目次
1. パラメータは 1 兆個?偽物!
ホームページ テクノロジー周辺機器 AI GPT-4に関する2つの噂と最新の予測!

GPT-4に関する2つの噂と最新の予測!

Apr 11, 2023 pm 06:07 PM
api gpt-4 モデル

著者|Yun Zhao

3 月 9 日、マイクロソフト ドイツ最高技術責任者 (CTO) のアンドレアス ブラウン氏が AI キックオフ カンファレンスで待望のニュースを発表しました。来週のリリースに合わせて、ビデオなど、まったく異なる可能性を提供するマルチモーダル モードを開始する予定です。」

GPT-4に関する2つの噂と最新の予測!

##同氏は、大規模言語モデル (LLM) を「ゲームチェンジャー」に例えました。LLM は機械に自然言語を理解するよう教え、以前は人間しか読み取れなかったものを機械が統計的に理解するからです。同時に、このテクノロジーは「すべての言語で利用できる」ように進化しました。ドイツ語で質問し、イタリア語で答えることができます。マルチモダリティにより、Microsoft (-OpenAI) は「モデルを包括的なものにする」でしょう。

GPT-4 が大規模なマルチモーダル モデルになることは基本的に確実であるようです。しかし、GPT-4の正体を事前に知りたいのであれば、それを見つけることは不可能ではありません。

1. 予測: GPT-4 は以前のマルチモーダル大規模言語モデル Kosmos-1

実際に、3 月 1 日の時点で、私たちは次のことに気づきました。 Microsoft が公開したマルチモーダル大規模言語モデル Kosmos-1 が開発されました。 GPT-4 がマルチモーダルである場合、GPT-4 が何ができるかを合理的に予測できます。

GPT-4に関する2つの噂と最新の予測!

KOSMOS-1 は、マルチモーダル入力を認識できるマルチモーダル大規模言語モデル (MLLM) です。指示に従い、コンテキストに応じた実行を行います。学習タスク。これはマルチモーダル タスクである場合もあります。この取り組みでは、ビジョンを大規模言語モデル (LLM) と一致させ、LLM から MLLM への進化を推進します。

GPT-4に関する2つの噂と最新の予測!

## スタンフォード博士で Nvidia AI 科学者である Jim Fan は、これに基づいて 5 つの具体的な予測を立てました:

(1) 視覚的 IQ テスト: はい、人間のためのテストです。 (2) OCR による読み取り能力がない: スクリーンショット、スキャンした文書、道路標識、またはテキストを含むピクセルを入力します。明示的な OCR を使用せずに、コンテンツについて直接推論します。これは、マルチメディア Web ページ上の AI 駆動アプリケーションや、現実世界のカメラからの「野生のテキスト」のロックを解除するのに役立ちます。 (3) マルチモーダルチャット: 写真について会話します。途中で「フォローアップ」写真を提供することもできます。 (4) 字幕、視覚的な質疑応答、物体検出、シーンのレイアウト、常識的推論などの広範な視覚的理解機能。 (5) オーディオおよび音声認識: Kosmos-1 論文では言及されていませんが、Whisper はすでに OpenAI API であり、統合は簡単であるはずです。

GPT-4に関する2つの噂と最新の予測!

ジムは、アンドレアスの最近の発表に基づく予測にはいくつかの矛盾がある可能性があると考えています。しかし、Kosmos-1 はすでにこれを実現しています。 GPT-4 や Microsoft が次に提供するあらゆる AI サービスの機能を提供すると考える理由があります。 「Kosmos-1 が研究室に留まり、製品にならないとは信じがたいです。」

GPT-4に関する2つの噂と最新の予測!

マルチモーダル大規模モデルのアプリケーション例: 画像キャプチャ、画像質疑応答、OCR、ビジュアルダイアログ

Jim は実践者に、「マルチモーダル API の準備をしておいてください。それらは遅かれ早かれ登場します。」

2. GPT-4 は、アギ?十分とは程遠い

第一に、精度の問題はまだ十分ではありません。ドイツマイクロソフトの人工知能上級専門家であるシーブラー氏は、運用の信頼性と事実の忠実性について尋ねられたところ、AIが必ずしも正しく答えるとは限らず、検証が必要であると述べた。 Microsoft は現在、この問題に対処するための信頼度指標を作成中です。通常、顧客は独自のデータセットに対する AI サポートのみを使用し、モデルはすでに非常に正確であるため、主に在庫データの読解とクエリに使用します。ただし、モデルによって生成されたテキストはまだ生成的なものであるため、簡単に検証できません。 「私たちは、賛成派も反対派も含めて、フィードバック ループを構築しました。これは反復的なプロセスです」とシーブラー氏は語った。

第二に、十分なデータがありません。マルチモーダル GPT-4 は、強力な視覚、聴覚、読解力、推論能力を発揮しようとしていますが、これは AGI の氷山の一角にすぎず、人型ロボットを例にとると、制御データを統一することは困難です。ロボットの制御データ、および 、これらの制御データはロボットのハードウェアに関連しており、大きく異なります。したがって、異なる実際のロボットからの学習データを簡単に組み合わせることができず、テキスト、ビデオ、画像、音声などのデータとは質的に異なります。

3. GPT-4 に関する 2 つの噂

1. パラメータは 1 兆個?偽物!

GPT-4 は、OpenAI によって作成されている新しい言語モデルで、人間の音声に似たテキストを生成できます。これは、GPT-3.5 に基づいた ChatGPT で使用されるテクノロジーを進化させます。

業界の専門家は、2021 年 8 月の時点で、GPT-4 には 100 兆個のパラメータがあるだろうと推測していましたが、当時、一部の人々は次のように述べていました: より多くのパラメータを使用して AI を構築することが、必ずしもより良いパフォーマンスを保証するとは限らない応答性に影響を与える可能性があります。

GPT-4に関する2つの噂と最新の予測!

しかし、ChatGPT の父である Altman 氏は、すぐにこの噂に反論しました。ChatGPT の次のバージョンは AGI ではなく、またAGIでしょうか?パラメータは100兆個あります。それらの噂は間違いです。

2.Bing チャットは GPT-4 を使用しますか?

Microsoft は、新しい Bing または Bing Chat は ChatGPT よりも強力であると発表しました。 OpenAI のチャットは GPT-3.5 を使用しているため、Bing チャットでは GPT-4 が使用されているのではないかと推測する人もいます。これは確認されていません。

明らかに、Bing Chat はインターネット経由で現在の情報にアクセスできるようにアップグレードされました。これは、これまで 2021 年より前に受信したトレーニング データからしか恩恵を受けることができなかった ChatGPT に比べて大幅な改善です。

インターネット アクセスに加えて、Bing Chat に使用される AI モデルははるかに高速です。これは、研究室から持ち出されて検索エンジンに追加されるときに重要です。

しかし、これは OpenAI の GPT-4 モデルと同等である可能性は低いようです。 GPT-4 がすでに一般公開されている場合は、それを秘密にしておく必要はありません。

4. GPT-4: 革命ではなく進化

今後登場する GPT-4 が人々に深い印象を残すことは間違いありません。しかし、OpenAI CEO のサム・アルトマン氏は StrictlyVC とのインタビューで、「人々は失望することを『懇願』しており、彼らは失望するでしょう。」

アルトマン氏も以前 Twitter で次のように述べています。世界経済に大きな混乱を引き起こす可能性があるとし、世界に適応のチャンスをほとんど与えない衝撃的な進歩よりも、いくつかの小さな変更を迅速に展開する方が良いと述べた。

偶然にも、世界クラスの人工知能の達人である Ben Goertzel も GPT-3/GPT-4 に大量の冷や水を浴びせました:

もちろん、これらの「知識の整理」システム (ChatGPT など) に投資される資金と人的資源の量は、根拠のある自己修正的な認知の根っこをより尊重する代替 AI アプローチに投資される金額よりもはるかに大きいことに注意する必要があります。複雑。

1970 年代後半から 1990 年代前半にかけての、多層ニューラル ネットワークに対する広範な懐疑論とエキスパート システムの採用は、現在と同じように、素朴で古風で愚かなものに見えました。

#同様に、LLM に対する今日の厳しい目での熱意と、より巧妙な AGI アプローチの口先だけの無視は、2020 年代半ばから後半までにはばかばかしいものに見えるでしょう

##この投稿で私が言いたいのは、これらの LLM ベースのシステムがクールでも役に立たないと言っているわけではありません。単に、これらは、表面的に見えるほど AGI と密接に関連していない、流行の新しい狭い AI テクノロジである、ということです。請求。

つまり、GPT-4 は革命ではなく進化です。

5. 最後に書かれています

明らかに、ChatGPT 4 が OpenAI の次の製品の名前になる可能性は低いですが、ChatGPT の名前は創造的な想像力をもたらすでしょう。おそらく、その改善を推進する AI モデル GPT-4 と組み合わせられます。 AI 実務者とマネージャーは、GPT-4 と ChatGPT の現在の作業の進捗状況と、OpenAI が次のメジャー アップグレードをいつリリースするかに焦点を当てる必要があります。

最後に皆さんにお伝えしたいのは、来週リリースされる GPT-4 がこの記事の予測に一致するかどうかは重要ではないということです。を楽しみにしています。重要なのは、開発者またはその会社がマルチモーダルな大規模モデル API を受け入れる準備ができているかどうかです。これらすべてが 2024 年までに実現するとは、なんと幸運なことでしょう。

参考リンク:

https://arxiv.org/abs/2302.14045

https://www.heise.de/news/ GPT-4 は来週登場し、マルチモーダルになる予定です-Microsoft-Germany-7540972.html

https://t.co/JbtQvjoJ3W

以上がGPT-4に関する2つの噂と最新の予測!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです 世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました Jun 01, 2024 pm 10:03 PM

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は

こんにちは、電気アトラスです!ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 こんにちは、電気アトラスです!ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか?」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

Google は大喜び: JAX のパフォーマンスが Pytorch や TensorFlow を上回りました! GPU 推論トレーニングの最速の選択肢となる可能性があります Google は大喜び: JAX のパフォーマンスが Pytorch や TensorFlow を上回りました! GPU 推論トレーニングの最速の選択肢となる可能性があります Apr 01, 2024 pm 07:46 PM

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

AI が数学研究を破壊する!フィールズ賞受賞者で中国系アメリカ人の数学者が上位 11 件の論文を主導 | テレンス・タオが「いいね!」しました AI が数学研究を破壊する!フィールズ賞受賞者で中国系アメリカ人の数学者が上位 11 件の論文を主導 | テレンス・タオが「いいね!」しました Apr 09, 2024 am 11:52 AM

AI は確かに数学を変えつつあります。最近、この問題に細心の注意を払っている陶哲軒氏が『米国数学協会会報』(米国数学協会会報)の最新号を送ってくれた。 「機械は数学を変えるのか?」というテーマを中心に、多くの数学者が意見を述べ、そのプロセス全体は火花に満ち、ハードコアで刺激的でした。著者には、フィールズ賞受賞者のアクシャイ・ベンカテシュ氏、中国の数学者鄭楽軍氏、ニューヨーク大学のコンピューター科学者アーネスト・デイビス氏、その他業界で著名な学者を含む強力な顔ぶれが揃っている。 AI の世界は劇的に変化しています。これらの記事の多くは 1 年前に投稿されたものです。

FisheyeDetNet: 魚眼カメラに基づいた最初のターゲット検出アルゴリズム FisheyeDetNet: 魚眼カメラに基づいた最初のターゲット検出アルゴリズム Apr 26, 2024 am 11:37 AM

目標検出は自動運転システムにおいて比較的成熟した問題であり、その中でも歩行者検出は最も初期に導入されたアルゴリズムの 1 つです。ほとんどの論文では非常に包括的な研究が行われています。ただし、サラウンドビューに魚眼カメラを使用した距離認識については、あまり研究されていません。放射状の歪みが大きいため、標準のバウンディング ボックス表現を魚眼カメラに実装するのは困難です。上記の説明を軽減するために、拡張バウンディング ボックス、楕円、および一般的な多角形の設計を極/角度表現に探索し、これらの表現を分析するためのインスタンス セグメンテーション mIOU メトリックを定義します。提案された多角形モデルの FisheyeDetNet は、他のモデルよりも優れたパフォーマンスを示し、同時に自動運転用の Valeo 魚眼カメラ データセットで 49.5% の mAP を達成しました。

テスラのロボットは工場で働く、マスク氏:手の自由度は今年22に達する! テスラのロボットは工場で働く、マスク氏:手の自由度は今年22に達する! May 06, 2024 pm 04:13 PM

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー(テスラの4680バッテリー)を次のように分類します:公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング:今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行​​い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジム ファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン 大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン Apr 23, 2024 pm 03:28 PM

Llama3 に関しては、新しいテスト結果が発表されました。大規模モデル評価コミュニティ LMSYS は、Llama3 が 5 位にランクされ、英語カテゴリでは GPT-4 と同率 1 位にランクされました。このリストは他のベンチマークとは異なり、モデル間の 1 対 1 の戦いに基づいており、ネットワーク全体の評価者が独自の提案とスコアを作成します。最終的に、Llama3 がリストの 5 位にランクされ、GPT-4 と Claude3 Super Cup Opus の 3 つの異なるバージョンが続きました。英国のシングルリストでは、Llama3 がクロードを追い抜き、GPT-4 と並びました。この結果について、Meta の主任科学者 LeCun 氏は非常に喜び、リツイートし、

See all articles