メタ人工知能の開発エラー、GPUの使用が間に合わず相手に遅れをとった
内部メモによると、2022 年の夏の終わりに、Meta の CEO であるマーク ザッカーバーグ氏が、会社のコンピューティング能力、特に最先端の人工知能を扱う。
このメモは、メタ社が人工知能研究への注目度の高い投資を行っており、成長を支えるために同社が人工知能への依存度を高めているにも関わらず、主要なシステムには高価な人工知能に最適化されたソフトウェアおよびハードウェアシステムを採用していないことを指摘している。ソーシャルメディア巨人のペースが遅いため、規模が拡大するにつれてイノベーションに追いつくことが困難になっている。 Meta が AI への取り組みをサポートするには、「物理インフラストラクチャの設計、ソフトウェア システム、安定したプラットフォームを提供するためのアプローチを根本的に変更する」必要がある。
この再編によりメタ社の資本支出は四半期当たり約40億ドル増加し、2021年のほぼ2倍となり、4カ所にデータセンターを建設する計画が一時停止または中止されたと同社は明らかにした。
そしてメタ社は深刻な経営難に直面しており、昨年11月以来前例のない人員削減を実施している。
同時に、昨年 11 月の ChatGPT の出現により、生成 AI 製品をリリースしたテクノロジー大手間の競争が始まりました。 5 人の関係者によると、生成 AI には大量のコンピューティング能力が必要であり、そのためメタ拡張の緊急性が高まっています。
情報筋は、Meta による人工知能への GPU の適用が遅いことが主な問題の 1 つであることを明らかにしました。 GPU チップは、多数のタスクを同時に実行でき、数十億個のデータの処理に必要な時間を短縮できるため、AI 処理に最適です。しかし、GPUチップはより高価であり、チップメーカーのNvidiaが市場の80%を支配し、対応するソフトウェアでリードを維持していると情報筋は述べた。
昨年まで、Meta は主に AI ワークロードを実行するために大量の通常の CPU を使用していました。 CPU はコンピューターの世界の主力チップであり、何十年にもわたってデータセンターを支配してきましたが、人工知能の仕事では十分なパフォーマンスを発揮しません。
これにより、AI の分野で競合他社が Meta を上回る結果となりました。彼らは GPU チップを使用し、より優れた AI ソフトウェアを備えているため、新しい AI 製品やサービスをより迅速に開発できます。
Meta は、2 つの情報源によると、AI をトレーニングするために社内で設計された独自のカスタム チップの使用も開始しました。しかし 2021 年には、この 2 つの側面からなるアプローチは、コアに GPU を使用して構築されたアプローチよりも遅く、効率が低いことが判明しています。 GPUチップは、さまざまなタイプのモデルを実行する際にもMetaのチップよりも柔軟性があると2人の情報筋は述べた。
その後、ザッカーバーグが会社をメタバースに軸足を移したとき、コンピューティング能力の不足により、会社はTikTokの台頭やApple主導の広告プライバシーの変更などの脅威に対応できなくなりました。
これらの問題は、元メタ取締役会メンバーのピーター・ティール氏の注目を集めました。 2022年初め、彼は理由を説明することなく辞任した。この件に詳しい2人の関係者によると、ティール氏は退任前の取締役会で、ザッカーバーグ氏とその幹部らはメタバースの開発に集中しすぎてメタの中核であるソーシャルメディア事業を無視していると指摘した。 TikTokなど。
Meta は 2022 年にカスタム チップを発売する計画を立てていましたが、その後断念し、代わりに同年に数十億ドル規模の Nvidia GPU チップを発注しました。現時点で、Meta は、2015 年に TPU と呼ばれる独自のカスタム バージョンの GPU の導入を開始した Google などの競合他社に遅れをとっています。
メタは次に、人工知能部門の再編を開始し、その責任者に 2 人の新しいエンジニアを任命しました。その間、数十人の幹部がメタを去り、そのほぼ全員がAIインフラストラクチャのリーダーに代わった。
次に、Meta は、より多くの電力を必要とし、より多くの熱を発生するチップである GPU の導入に対応するために、データ センターの改修を開始しました。専用ネットワーク接続。この作業には、クラスターの熱を管理するための大規模なネットワーク容量と新しい液体冷却システムが必要であり、それらの「完全な再設計」が必要です。
作業が進むにつれ、Meta は、人工知能モデルのトレーニングと推論の実行の両方ができる、GPU に似た、より野心的な新しいチップを開発するという内部計画を開始します。 2人の関係筋によると、このプロジェクトは2025年頃に完了する予定だという。
メタの広報担当者ジョン・カーヴィル氏は、チッププロジェクトについてのコメントを控えた。
Meta は GPU をスケールアップしていますが、Microsoft や Google などの企業は商用の生成人工知能製品を推進しており、この点では Meta は大きな進歩を遂げていません。
Meta の最高財務責任者は 2 月に、同社が現在そのコンピューティング能力のほとんどを生成的な作業に費やしていないことを認めました。 「基本的に当社の人工知能機能はすべて、広告、ニュースフィード、リールに使用されています。リールは若いユーザーに人気のあるMetaのTikTok風のショートビデオフォーマットです」と同氏は語った。
4 つの情報筋によると、Meta は 11 月に ChatGPT が開始されるまで、生成 AI 製品の開発を優先していませんでした。同社のAI研究部門は2021年後半から技術プロトタイプをリリースしているが、それらを製品化することには注力していない。しかし、投資家の関心が高まり続ける中、ザッカーバーグ氏は2月、新しい高レベルの生成AIチームの創設を発表し、この分野での同社の取り組みを「加速する」と述べた。
最高技術責任者のアンドリュー・ボズワース氏も今月、生成人工知能は彼とザッカーバーグ氏が最も多くの時間を費やしている分野であると述べ、メタ社が今年新製品を発売すると予測した。
新しいチームに詳しい関係者 2 人によると、チームの作業は初期段階にあり、後で微調整してさまざまな製品に適合させることができるコア プログラムである基本モデルの構築に焦点を当てているとのことです。
メタの広報担当カービル氏は、同社は1年以上にわたりさまざまなチームで生成人工知能製品を開発していると述べた。彼は、ChatGPT が立ち上げられてから数か月で作業が加速したことを認めました。
以上がメタ人工知能の開発エラー、GPUの使用が間に合わず相手に遅れをとったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

Meta Connect 2024イベントは9月25日から26日に予定されており、このイベントで同社は新しい手頃な価格の仮想現実ヘッドセットを発表すると予想されている。 Meta Quest 3S であると噂されている VR ヘッドセットが FCC のリストに掲載されたようです。この提案

GPUを準備しましょう!ついにLlama3.1が登場しましたが、ソースはMeta公式ではありません。今日、新しい Llama 大型モデルのリーク ニュースが Reddit で話題になり、基本モデルに加えて、8B、70B、最大パラメータ 405B のベンチマーク結果も含まれています。以下の図は、Llama3.1 の各バージョンと OpenAIGPT-4o および Llama38B/70B の比較結果を示しています。 70B バージョンでも複数のベンチマークで GPT-4o を上回っていることがわかります。画像ソース: https://x.com/mattshumer_/status/1815444612414087294 明らかに、8B と 70 のバージョン 3.1

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

たった今、待望の Llama 3.1 が正式にリリースされました。 Metaは「オープンソースは新たな時代を導く」と公式に声を上げた。 Meta 氏は公式ブログで、「今日まで、オープンソースの大規模言語モデルは、機能とパフォーマンスの点でクローズド モデルに比べてほとんど遅れを取ってきました。今、私たちはオープンソースが主導する新しい時代の到来を告げています。私たちは MetaLlama3.1405B を一般公開しました」と述べました。これは世界で最大かつ最も強力なオープンソースの基本モデルであると私たちは信じています。現在までに、Llama のすべてのバージョンの合計ダウンロード数は 3 億回を超えており、Meta の創設者兼 CEO のザッカーバーグ氏も次のように書いています。」長い記事「OpenSourceAIsthePathForward」、

Meta による Quest 3 の最初のリリース (Amazon で現在 499.99 ドル) から 1 年以上が経過しました。それ以来、Apple はかなり高価な Vision Pro を出荷し、Byte Dance は中国で Pico 4 Ultra を発表しました。ただし、
