Ant Group NextEvo が完全にオープンソースの AI インフラ技術を公開し、「自動運転」のための大規模モデルのトレーニングを可能にします-AI-php.cn

ホームページ

テクノロジー周辺機器

Ant Group NextEvo が完全にオープンソースの AI インフラ技術を公開し、「自動運転」のための大規模モデルのトレーニングを可能にします

王林

Feb 02, 2024 am 08:39 AM

大型モデル業界アリグループ

最近、Ant Group の AI イノベーション研究開発部門である NextEvo は、大規模なモデルのトレーニングの効率を大幅に向上できる包括的なオープンソース AI インフラテクノロジーを発表しました。データによると、この技術によりトレーニング時間の有効割合が 95% 以上に増加し、トレーニングプロセスの自動化が実現できます。この画期的な進歩により、AI 研究開発の効率が大幅に促進されました。

蚂蚁集团NextEvo全面开源AI Infra技术，可实现大模型训练“自动驾驶”

写真: Ant Group の自動分散ディープラーニングシステム DLRover が完全にオープンソースになりました

DLRover は、大規模なユーザー向けに設計されたシステムです。スケール分散トレーニング用に設計された技術フレームワーク。今日の多くの企業では、トレーニングジョブが複雑で多様なハイブリッド展開クラスターで実行されることがよくあります。どんなに複雑な環境であっても、DLRover は悪路を運転するのと同じように簡単に処理できます。

2023 年の大型モデルテクノロジーの急速な発展により、エンジニアリングの実践が爆発的に成長しました。データを効率的に管理し、トレーニングと推論の効率を最適化し、既存のコンピューティング能力を最大限に活用する方法が重要な問題となっています。

GPT-3 のようなパラメーターレベル 1,000 億の大規模モデルを完成させるには、1 枚のカードで 1 回トレーニングするのに 32 年かかります。したがって、トレーニングプロセス中にコンピューティング能力を最大限に活用することが非常に重要です。この目標を達成するには、2 つのアプローチを取ることができます。まず、購入した GPU のパフォーマンスをさらに向上させて、その可能性を最大限に発揮できます。第二に、これまで利用できなかった CPU やメモリなどのコンピューティングリソースを利用できるようになります。これを達成するには、異種コンピューティングプラットフォームを通じてこの問題を解決できます。

DLRover は最近、モデルのトレーニング中のチェックポイント管理に使用される Flash Checkpoint (FCP) ソリューションを統合しました。従来のチェックポイント管理方法には、長時間の消費、高頻度のチェックポイントによる利用可能なトレーニング時間の減少、低頻度のチェックポイントの回復時の過剰な損失などの問題があります。新しいソリューション FCP を適用することで、1,000 億パラメータモデルのトレーニング後、チェックポイントによる無駄なトレーニング時間が約 5 分の 1 に削減され、持続時間が約 70 分の 1 に短縮されます。この改善により、効果的なトレーニング時間が 90% から 95% に増加しました。これは、DLRover のモデルトレーニング効率が大幅に向上したことを意味します。

また、3 つの新しいオプティマイザーテクノロジーも統合しました。オプティマイザーは機械学習の中核コンポーネントであり、損失関数を最小限に抑えるためにニューラルネットワークパラメーターを更新するために使用されます。その中で、Ant の AGD (隣接ステップの勾配差による自動切り替えオプティマイザー) オプティマイザーは、大規模モデルの事前トレーニングタスクにおいて、従来の AdamW テクノロジーよりも 1.5 倍高速です。 AGD はアリ内の複数のシナリオで使用され、顕著な結果を達成しており、関連する論文は NeurIPS '23 に掲載されています。

蚂蚁集团NextEvo全面开源AI Infra技术，可实现大模型训练“自动驾驶”

図: 大規模モデルの事前トレーニングタスクでは、AGD は AdamW と比較して 1.5 倍高速化できます。

自動化された分散深度として学習システム、DLRover の「自動運転」機能モジュールには、PyTorch 分散トレーニング拡張ライブラリである Atorch も含まれており、数千億のパラメータモデルとキロカロリーの規模で、トレーニングの計算能力利用率は 60% に達し、開発者を支援します。ハードウェアのコンピューティング能力を圧迫します。

DLRover は、「ML for System」の概念を使用して分散トレーニングのインテリジェンスを強化し、開発者がリソース割り当ての制約を完全に取り除き、モデルのトレーニング自体に集中できるようにするシステムを使用することを目指しています。リソース構成を入力しなくても、DLRover は各トレーニングジョブに最適なリソース構成を提供できます。

Ant Group が人工知能分野の技術への投資を継続していることがわかりましたが、最近 Ant Group は社内に AI イノベーション研究開発部門 NextEvo を設立し、すべてのコア技術の研究開発を担当しています。 Bailing モデルのすべてを含む Ant AI 研究開発作業には、AI アルゴリズム、AI エンジニアリング、NLP、AIGC などのコア技術のほか、マルチモーダル大型モデルやデジタルヒューマンのレイアウト分野での技術研究開発と製品イノベーションが含まれます。。

同時に、アントグループはオープンソースのペースを加速し、関連する国内技術のギャップを埋め、人工知能産業の急速な発展を促進しました。

DLRover オープンソースアドレス: https://www.php.cn/link/cf372cbe6eae54c6a6dfb3ebbcdc3404

以上がAnt Group NextEvo が完全にオープンソースの AI インフラ技術を公開し、「自動運転」のための大規模モデルのトレーニングを可能にしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Java チュートリアル

1663

CakePHP チュートリアル

1420

Laravel チュートリアル

1315

PHP チュートリアル

1266

C# チュートリアル

1239

Related knowledge

DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました Aug 09, 2024 pm 04:01 PM

でももしかしたら公園の老人には勝てないかもしれない？パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボットエージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

初のメカニカルクロー！元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した Aug 21, 2024 pm 07:33 PM

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition（以下、「Yuanluobot SenseRobot」という）をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

クロードも怠け者になってしまった！ネチズン: 自分に休日を与える方法を学びましょう Sep 02, 2024 pm 01:56 PM

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました Aug 22, 2024 pm 10:35 PM

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標（速度、負荷）を追求していると説明した。など）、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件（未発表2件）、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

AIハードウェアがまたメンバー追加！携帯電話を置き換えるのではなく、NotePinは長生きできるでしょうか？ Sep 02, 2024 pm 01:40 PM

これまでのところ、AI ウェアラブルデバイス分野で特に優れた結果を達成した製品はありません。今年初めのMWC24で発表されたAIPinは、評価プロトタイプが出荷されると、発表当時に喧伝された「AI神話」が崩れ始め、わずか1年で大規模なリターンを獲得した。数か月; RabbitR1 も当初は比較的よく売れましたが、大量に出荷されたときは「Android ケース」と同様に否定的な評価を受けました。さて、別の企業がAIウェアラブルデバイス分野に参入しました。テクノロジーメディアのTheVergeは昨日、AIスタートアップのPlaudがNotePinという製品を発売したとのブログ投稿を公開した。まだ「絵を描いている」段階にあるAIFriendとは異なり、NotePinはすでに開始されています

Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Sep 03, 2024 pm 05:18 PM

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。、そしてティーポットを一定の角度に傾けます。これ

分散型人工知能カンファレンス DAI 2024 論文募集: エージェントデイ、強化学習の父であるリチャードサットン氏が出席します。 Yan Shuicheng、Sergey Levine、DeepMind の科学者が基調講演を行います Aug 22, 2024 pm 08:02 PM

会議の紹介科学技術の急速な発展に伴い、人工知能は社会の進歩を促進する重要な力となっています。この時代に、分散型人工知能 (DAI) の革新と応用を目撃し、参加できることは幸運です。分散型人工知能は人工知能分野の重要な分野であり、近年ますます注目を集めています。大規模言語モデル (LLM) に基づくエージェントは、大規模モデルの強力な言語理解機能と生成機能を組み合わせることで、自然言語対話、知識推論、タスク計画などにおいて大きな可能性を示しました。 AIAgent は大きな言語モデルを引き継ぎ、現在の AI 界隈で話題になっています。アウ

See all articles