OpenAI CEO、「規模の拡大が進歩の唯一の方法ではなく、巨大な AI モデルの時代は終わりを迎えるかもしれない」-AI-php.cn

ホームページ

テクノロジー周辺機器

OpenAI CEO、「規模の拡大が進歩の唯一の方法ではなく、巨大な AI モデルの時代は終わりを迎えるかもしれない」

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 23, 2023 pm 07:46 PM

openai gpt-4

OpenAI CEO：巨型AI模型时代即将终结，想进步别再靠扩大规模

4 月 18 日のニュース、OpenAI のチャットボット ChatGPT は非常に強力であるため、人工知能への大きな関心と投資を引き起こしています。しかし、同社のCEOであるサム・アルトマン氏は、既存の研究戦略は失敗しており、将来のAIの進歩には新しいアイデアが必要であると考えている。

近年、OpenAI は、既存の機械学習アルゴリズムを以前は想像もできなかった規模に拡張することにより、処理言語において目覚ましい一連の進歩を遂げてきました。同社が最近開発したプロジェクトはGPT-4で、1億ドル以上の費用をかけて数兆語のテキストと数千個の強力なコンピュータチップを使って訓練されたという。

しかし、アルトマン氏は、AIの将来の進歩はもはやモデルの大型化に依存しない、と述べた。同氏はマサチューセッツ工科大学（MIT）のイベントで「私たちは時代の終わりに来ていると思う。この（発信する）時代において、モデルはますます大きくなった。これからは、別の形でモデルを作ろうとしている」と語った。

アルトマン氏のコメントは、新しい AI アルゴリズムの開発と展開をめぐる競争における予期せぬ展開を表しています。 11月にChatGPTを発表して以来、Microsoftは基礎となるテクノロジーを活用してBing検索エンジンにチャットボットを追加し、GoogleはBardという競合他社を立ち上げた。多くの人が、仕事や個人的なタスクを支援するために、この新しいチャットボットを試してみたいと考えています。

一方、Anthropic、AI21、Cohere、Character.AI など、資金豊富なスタートアップ企業の多くは、OpenAI に追いつくために、より大規模なアルゴリズムの構築にリソースを注ぎ込んでいます。 ChatGPT の初期バージョンは GPT-3 に基づいて構築されていますが、ユーザーはより強力な GPT-4 サポートバージョンにもアクセスできるようになりました。

アルトマン氏の声明は、モデルを拡張し、トレーニング用にさらに多くのデータを提供する戦略を採用した後、GPT-4 が OpenAI の最後の主要な成果になる可能性があることも示唆しました。ただし、現在の方法に代わる可能性のある研究戦略や技術については明らかにしませんでした。 GPT-4について説明した論文の中でOpenAIは、その推定ではモデルのスケールアップによる利益の減少が示されていると述べた。アルトマン氏によると、同社が建設できるデータセンターの数や、その建設速度には物理的な限界があるという。

Cohereの共同創設者でGoogleで人工知能の開発に携わったニック・フロスト氏は、アルトマン氏の言う「モデルのサイズを無制限に拡大し続けることは効果的な解決策ではない。計画」は正しいと述べた。彼は、GPT-4 およびその他のトランスフォーマータイプ (編集グループ: トランスフォーマーは直訳するとコンバーター、GPT は Generative pre-trained Transformers の略で、トランスフォーマーに基づく生成事前トレーニングモデルを意味します) の機械学習モデルが進歩していると信じています。もはやスケーリングだけではありません。

Frost 氏は次のように付け加えました。「変圧器をより良く、より便利にする方法はたくさんありますが、その多くはモデルにパラメータを追加する必要はありません。新しい人工知能モデルの設計またはアーキテクチャと、人間ベースのさらなる調整「フィードバックは、多くの研究者がすでに模索している方向性です。」

OpenAI の言語アルゴリズムファミリでは、各バージョンは人工ニューラルネットワークで構成されています。このソフトウェアの設計は、ニューラルネットワークからインスピレーションを得ています。要素が相互作用する方法相互に学習すると、トレーニング後に、指定されたテキスト文字列に続く単語を予測できます。

2019 年、OpenAI は最初の言語モデル GPT-2 をリリースしました。これには最大 15 億のパラメータが含まれ、ニューロン間の調整可能な接続数の尺度です。これは、スケールアップによってモデルの一貫性が高まるという OpenAI 研究者らの発見のおかげもあって、非常に大きな数字です。

2020 年、OpenAI は GPT-2 の後継となる GPT-3 を発表しました。これは、最大 1,750 億のパラメータを備えたより大きなモデルです。詩、電子メール、その他のテキストを生成する GPT-3 の幅広い機能により、他の企業や研究機関は、独自の AI モデルを GPT-3 と同等またはそれ以上のスケールに拡張できると考えるようになりました。

昨年 11 月に ChatGPT がデビューした後、ミーム作成者やテクノロジー専門家は、GPT-4 が登場すると、より多くのパラメータを備えたより複雑なモデルになるだろうと推測しました。しかし、OpenAI が新しい AI モデルを最終的に発表したとき、同社はそれがどのくらいの大きさになるかについては明らかにしませんでした。おそらく、重要なのはサイズだけではなくなったためでしょう。 MIT のイベントで、アルトマン氏は GPT-4 のトレーニング費用は 1 億ドルかどうか尋ねられ、「それ以上です」と答えました。

OpenAI は GPT-4 のスケールと内部動作を秘密にしていますが、パフォーマンスを向上させるためにスケールアップのみに依存しているわけではなくなっている可能性があります。可能性の 1 つは、同社が ChatGPT の機能を強化するために「人間のフィードバックによる強化学習」と呼ばれる手法を使用したことです。これには、人間がモデルの回答の品質を判断し、高品質と判断される可能性が高いサービスを提供するように誘導することが含まれます。答え。

GPT-4 の並外れた能力は多くの専門家を驚かせ、経済を変革する AI の可能性についての議論を引き起こし、偽情報を広めて失業を生み出す可能性があるという懸念も引き起こしました。最近、テスラのイーロン・マスク最高経営責任者（CEO）を含む多くの起業家やAI専門家が、GPT-4より強力なモデルの開発を6か月間停止することを求める公開書簡に署名した。

MIT のイベントで、アルトマン氏は、彼の会社が現在 GPT-5 を開発していないことを認めました。同氏はさらに、「この公開書簡の以前のバージョンでは、OpenAI が GPT-5 のトレーニングを行っていると主張していた。実際、我々はこれを行っておらず、短期的には行うつもりはない。」と付け加えた。

以上がOpenAI CEO、「規模の拡大が進歩の唯一の方法ではなく、巨大な AI モデルの時代は終わりを迎えるかもしれない」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7469

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニングコストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

データに最適なエンベディングモデルの選択: OpenAI とオープンソースの多言語エンベディングの比較テスト Feb 26, 2024 pm 06:10 PM

OpenAI は最近、最新世代の埋め込みモデル embeddingv3 のリリースを発表しました。これは、より高い多言語パフォーマンスを備えた最もパフォーマンスの高い埋め込みモデルであると主張しています。このモデルのバッチは、小さい text-embeddings-3-small と、より強力で大きい text-embeddings-3-large の 2 つのタイプに分類されます。これらのモデルがどのように設計され、トレーニングされるかについてはほとんど情報が開示されておらず、モデルには有料 API を介してのみアクセスできます。オープンソースの組み込みモデルは数多くありますが、これらのオープンソースモデルは OpenAI のクローズドソースモデルとどう違うのでしょうか?この記事では、これらの新しいモデルのパフォーマンスをオープンソースモデルと実証的に比較します。データを作成する予定です

Spring Boot と OpenAI の出会いによる新しいプログラミングパラダイム Feb 01, 2024 pm 09:18 PM

2023年、AI技術が注目を集め、プログラミング分野を中心にさまざまな業界に大きな影響を与えています。 AI テクノロジーの重要性に対する人々の認識はますます高まっており、Spring コミュニティも例外ではありません。 GenAI (汎用人工知能) テクノロジーの継続的な進歩に伴い、AI 機能を備えたアプリケーションの作成を簡素化することが重要かつ緊急になっています。このような背景から、AI 機能アプリケーションの開発プロセスを簡素化し、シンプルかつ直観的にし、不必要な複雑さを回避することを目的とした「SpringAI」が登場しました。「SpringAI」により、開発者はAI機能を搭載したアプリケーションをより簡単に構築でき、使いやすく、操作しやすくなります。

二代目アメカ登場！彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 Mar 04, 2024 am 09:10 AM

人型ロボット「アメカ」が第二世代にバージョンアップ！最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン Apr 23, 2024 pm 03:28 PM

Llama3 に関しては、新しいテスト結果が発表されました。大規模モデル評価コミュニティ LMSYS は、Llama3 が 5 位にランクされ、英語カテゴリでは GPT-4 と同率 1 位にランクされました。このリストは他のベンチマークとは異なり、モデル間の 1 対 1 の戦いに基づいており、ネットワーク全体の評価者が独自の提案とスコアを作成します。最終的に、Llama3 がリストの 5 位にランクされ、GPT-4 と Claude3 Super Cup Opus の 3 つの異なるバージョンが続きました。英国のシングルリストでは、Llama3 がクロードを追い抜き、GPT-4 と並びました。この結果について、Meta の主任科学者 LeCun 氏は非常に喜び、リツイートし、

OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる Jul 19, 2024 am 01:29 AM

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

Rust ベースの Zed エディターはオープンソース化されており、OpenAI と GitHub Copilot のサポートが組み込まれています Feb 01, 2024 pm 02:51 PM

著者丨コンパイル: TimAnderson丨プロデュース: Noah|51CTO Technology Stack (WeChat ID: blog51cto) Zed エディタープロジェクトはまだプレリリース段階にあり、AGPL、GPL、および Apache ライセンスの下でオープンソース化されています。このエディターは高性能と複数の AI 支援オプションを備えていますが、現在は Mac プラットフォームでのみ利用可能です。 Nathan Sobo 氏は投稿の中で、GitHub 上の Zed プロジェクトのコードベースでは、エディター部分は GPL に基づいてライセンスされ、サーバー側コンポーネントは AGPL に基づいてライセンスされ、GPUI (GPU Accelerated User) インターフェイス部分はApache2.0ライセンス。 GPUI は Zed チームによって開発された製品です

世界で最も強力なモデルが一夜にして交代し、GPT-4 時代の終わりを告げました。クロード3号は事前にGPT-5を狙撃し、1万ワードの論文を3秒で読み切るなど、人間に近い理解力を持っている。 Mar 06, 2024 pm 12:58 PM

ボリュームはクレイジー、ボリュームはクレイジー、そして大きなモデルがまた変わりました。たった今、世界で最も強力な AI モデルが一夜にして交代し、GPT-4 が祭壇から引き抜かれました。 Anthropic が Claude3 シリーズの最新モデルをリリースしました一言評価: GPT-4 を本当に粉砕します!マルチモーダルと言語能力の指標に関しては、Claude3 が勝ちます。 Anthropic 氏の言葉を借りれば、Claude3 シリーズモデルは、推論、数学、コーディング、多言語理解、視覚において新たな業界のベンチマークを設定しました。 Anthropic は、セキュリティ概念の違いを理由に OpenAI から「離反」した従業員によって設立された新興企業であり、同社の製品は繰り返し OpenAI に大きな打撃を与えてきました。今回、Claude3は大きな手術まで受けました。

See all articles