3 月 11 日、国際的な AI データ テクノロジーの大手企業である Stardust AI は、2024 年春の製品発表カンファレンスを北京で開催し、AI 向けデータ クローズドループ製品である MorningStar を発表しました。 MorningStar は、データ価値の発見に焦点を当てた初の AI データ プラットフォームであり、従来のデータ管理ツールと比較して、先進的なコンセプト、簡単な操作、豊富な機能を備えたこの AI データ発見、管理、コラボレーション、反復プラットフォームは、データ価値の発見のために設計されています。モデルの反復を行い、AI データ負債の問題を解決します。この作成により、エンタープライズ AI データの効率的な反復の重要なリンクがサポートされ、データ負債リスクの蓄積、低価値のデータ コストの無駄、モデルの長いフィードバック チェーンなどの問題が回避されます。トレーニングとアプリケーションの効果。
▲ MorningStar 正式リリース
現在、MorningStar データ管理プラットフォームはアプリケーションを受け付けています。公式 Web サイトにアクセスして、その他の紹介を表示し、送信することができます。要件。
1.モーニングスターとは何ですか?
▲ MorningStar Data Closed Loop
MorningStar は、非構造化改善を目的とした AI2.0 時代のデータ管理ニーズを満たす万能ツールですアルゴリズム エンジニアのためのデータ管理データ管理の効率化により、最先端のデータ ライフ サイクル管理、包括的なデータ マイニング ツール、強力な指標追跡および困難なケース発見機能、効率的でコンプライアンスに準拠したデータ資産管理などにより、企業のデータ資産管理コストとモデルのオンライン反復時間を節約できます。その利点は国内外の類似製品をはるかに上回り、アルゴリズム開発がよりスムーズかつ俊敏になり、データの価値を最大限に発揮できるようになります。
2. MorningStar のユーザーは誰ですか?
データ中心のコラボレーション環境を構築することで、MorningStar はエンタープライズ AI データ負債の問題を解消し、主に機械学習アルゴリズム エンジニア、ビジネス担当者、技術マネージャーという 3 種類のユーザーにサービスを提供しています。 MorningStar は、さまざまなユーザーのさまざまなニーズを満たすことができ、データ ハード ケースの検出、モデルの反復、インジケーターの追跡、データ値のマイニング、ビジネス効果のフィードバック、運用テスト、データ要素の管理、企業価値の創出などの豊富な使用シナリオをカバーします。
3. モーニングスターを選ぶ理由は何ですか?
データ テクノロジーは、人工知能における 3 つの変化を促進しました。ビッグモデルの時代には、企業の生産効率を向上させるために、あらゆる階層が独自のデータに基づいてスーパー従業員を生み出す必要があります。モデルとコンピューティング能力は購入できますが、データの本当の価値を引き出すには、洗練された完全なプロセス管理が必要です。企業は、AI 2.0 時代にデータを取得、生成し、継続的にデータを反復し、社内のデータ中心のコラボレーションを促進してデータを取得できるように、検出可能、管理可能、協調的かつ反復可能なデータ パイプラインを構築する必要があります。競争力。
MorningStar は、AI 2.0 時代の企業向けに特別に設計された市場で唯一の閉ループ データ製品であり、データ管理、反復、最適化、AI のマイニングなどの閉ループ リンクを包括的にカバーしていますは、企業が効率的なデータ閉ループ システムを確立し、データ価値を最大化し、モデル効果を最適化し、差別化された競争力の障壁を構築できるよう支援することに尽力しています。
▲ MorningStar 製品の利点
(1) 最先端のデータライフサイクル管理
アルゴリズム エンジニアは、MorningStar を使用して AI データのライフ サイクルを管理し、データ バージョン管理、高速データ スライス、追跡可能なデータ リネージ、およびセキュリティ管理を強化できます。プラットフォームの自動化されたワークフローにより、データがあらゆる段階で適切に管理され、最適化されることが保証されます。
▲データ スライス
柔軟なデータ スライス機能により、アルゴリズム エンジニアは、後続のデータ処理プロセスでアルゴリズムの反復データの方向をワンクリックで選択できます。
▲データ フロー: さまざまなセマンティック情報を含むデータのバージョン生成プロセスを記録します
データ プロセスのオーケストレーションとスケジューリング、アルゴリズム エンジニアはデータ処理を簡単に記録できます結果とセマンティックの結果を処理し、バージョン管理を実行し、ライフサイクル全体のデータ情報を記録し、データのトレーサビリティと操作の再現性を確保します。
▲データ フロー: データ ソースとデータ配信
アルゴリズム エンジニアは、プラットフォームを通じて一連のデータ トレースとモデルを通じてモデルの真の値の比較を行うことができます。デバッグおよび分析生成ツールを使用して、困難なデータを検出し、ワンクリックでそれを Rosetta データ注釈システムに送信します。
(2) 包括的なデータ マイニング ツール
MorningStar は、きめ細かい視覚化、指標の計算、データ分布の探索、クロス分析などのデータ価値の詳細なマイニングをサポートします。 -モーダルデータ取得などは、手動監視、セマンティック検索、特徴生成、データ強化を通じて、より低コストで最適なアルゴリズムを取得でき、ビジュアルデータマイニングロジックを通じてユーザーがモデルトレーニングの問題を発見して解決できるように支援します。
▲分布の視覚化
上の図は、視覚的なデータ マイニング ロジックを通じて、困難なケース データと異常なラベル分布を持つデータを見つける MorningStar の機能を示しています。スケーラビリティ。
▲データ探索
アルゴリズムエンジニアは、MorningStar を使用して、さまざまなシナリオや次元でのデータ検索を実行し、データの状況を迅速に把握し、アルゴリズム実験のアイデアを策定できます。 。
MorningStar は、さまざまなタイプのマルチモーダル データ視覚化とセマンティック検索をサポートしており、必要な高価値データを方向性を持ってより簡単かつ迅速にマイニングできるようになります。
(3) 強力な指標追跡と困難なケースの発見機能
困難なケースの発見戦略を統合した最初のデータクローズドループ製品として、モーニングスターは、モデルがトレーニング プロセスは信頼性が高く、トレースは反復可能です。一連のデータ トレース、モデル デバッグ、解析生成ツールを通じて、高品質で再現可能な Al モデルの実現と維持に役立ちます。
▲データのトレーサビリティ: データ フローを通じて、アルゴリズムの評価に使用されたデータをいつでもソースまで追跡できます。
▲バージョン比較
異なるデータバージョンを選択することで、アルゴリズムの予測結果と真の値を比較したり、可視化機能を使用して位置を特定したりするのに便利です。困難なケースのデータを分析します。
▲インジケーターの追跡と効果検出
MorningStar は SDK を使用して、モデルトレーニング環境、トレーニングデータ分析管理、インジケーター分析環境を便利に接続し、アルゴリズムを繰り返し実行します。
(4) 効率的でコンプライアンスに準拠したデータ資産管理
MorningStar は、データセットの包括的な分析をサポートし、ビジネス マネージャーがエンタープライズ レベルのデータ要素の管理と分析を実現し、資産を提示できるように支援します。データ資産の規模、コンテンツの配布、所有権、その他の側面からの情報が一目でわかります。
▲データ コンプライアンス監査
チームは、MorningStar を通じてデータ資産を統合し、使用価値を共有できます。権限管理と利用記録により、データのセキュリティを確保しながら部門間のデータ流通を高速化します。
▲データ資産の表示
さらに、MorningStar は、マルチソース、マルチフォーマット、異種データを統合し、超大容量データを管理し、企業資産の視覚的モデリング ; 多次元のきめ細かいデータの分類とインベントリをサポートし、企業内の内部データの深い理解を促進し、企業内の部門を越えたコラボレーションにおけるデータ フローの効率を向上させます。
上の図は、MorningStar によるデータセットの人気価値ランキングを示しています。アルゴリズム反復に対するデータ資産の価値は、データ使用時間、シーン ラベル、アノテーション結果、データ要素を支援するためなど、経済的利益の分析。
(5) より多くの機能
優秀なアルゴリズム エンジニアとして、あなたはまだオリジナルの自作ツール、一時的なツール、さらには Excel を使用してデータを処理していますか?プロフェッショナルな AI データの発見、管理、コラボレーション、イテレーション プラットフォームとして、MorningStar は上記の高度な操作を実行できるだけでなく、豊富な実用的な機能も備えています。たとえば、マルチソース、マルチフォーマット、異種構造化データの統合管理をサポートし、SDK をサポートし、モデルのパフォーマンス評価とモニタリングを実行し、包括的なモデル評価レポートを取得できます。
Stardust Data と香港科技大学によって作成された CIF-Bench 自動評価が間もなく MorningStar で開始されることは言及する価値があります。 28 のモデル評価リストは、20 の基本的な次元を評価し、150 種類のタスクの指示に従うモデルの能力を調べることに重点を置いています。リストのリンク: https://yizhillll.github.io/CIF-Bench/。
ある自動運転アルゴリズム エンジニアは、当初は発見するのに 1 日かかった困難なケースが、プラットフォームを通じて 1 ~ 2 時間で発見できるようになり、反復効率が大幅に向上したと報告しました。
将来的にも、MorningStar は反復的な更新を継続していきます。ユーザーの皆様は貴重なご提案を歓迎し、AI アルゴリズムの反復をより効率的にするためにデータのクローズドループ管理を再構築するために私たちと協力してください。
5.モーニングスターが正式にリリースされました
Stardust Data の創設者兼 CEO の Zhang Lei 氏によると、「AI 2.0 時代では、独自のデータをマスターすることは、独自のモデルをマスターすることを意味します。」エンタープライズ データの価値の核心は、データの定義、管理、反復にあります。進化し続ける AI テクノロジーの波の中で、データの継続的な管理、最適化、反復が、企業が AI2.0 時代に抜きん出るための重要な要素となるでしょう。あなたの会社が独自のデータと数百億の大規模モデルを使用して独自のスーパー従業員を創出したいと考えている場合、モーニングスターは私たちとコミュニケーションをとることを心から歓迎します。 AI データ管理のニーズに対応するユーザーのタイプに関係なく、モーニングスターは、SaaS、企業の民営化展開、カスタマイズされたソフトウェア開発のサポートなど、包括的なソリューションと柔軟な使用方法を提供できます。
製品公式サイトアドレス: https://stardust.ai/MorningStar
要件提出アドレス: https://stardust.ai/contact
#
以上がスターダストデータ、データ価値の発見に焦点を当てた最初の製品であるMorningStarを発売の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。