目次
ネットワーク規模やコンピューティング規模を誰も気にしていないときに始めましょう
コンピューター ビジョン用のニューラル ネットワークの構築
OpenAI: 100 人から ChatGPT へ
OpenAI が大規模なニューラル ネットワークをトレーニングする方法
GPT-4 についてもう一度話しましょう
人工知能の未来
ホームページ テクノロジー周辺機器 AI GPT-4 は ChatGPT と比べてどのような点が改善されていますか? Jen-Hsun Huang 氏が OpenAI 共同創設者と「炉辺チャット」を開催

GPT-4 は ChatGPT と比べてどのような点が改善されていますか? Jen-Hsun Huang 氏が OpenAI 共同創設者と「炉辺チャット」を開催

Mar 31, 2023 pm 10:39 PM
chatgpt gpt-4 ニューラルネットワーク

ChatGPT と GPT-4 の最も重要な違いは、GPT-4 に基づいて構築すると、次の文字をより高い精度で予測できることです。ニューラル ネットワークがテキスト内の次の単語をより正確に予測できるほど、テキストをよりよく理解できます。

制作: Big Data Digest

著者: Caleb

Nvidia が OpenAI と出会ったとき、どのような火花を起こすでしょうか?

先ほど、Nvidia の創設者兼 CEO の Huang Jensen 氏が、GTC のファイアサイド チャット中に OpenAI の共同創設者 Ilya Sutskever 氏と詳細な意見交換をしました。

GPT-4 は ChatGPT と比べてどのような点が改善されていますか? Jen-Hsun Huang 氏が OpenAI 共同創設者と「炉辺チャット」を開催

ビデオリンク:

https://www.nvidia.cn/gtc-global/session-catalog/?tab.catalogallsessinotallow=16566177511100015Kus #/ session/1669748941314001t6Nv

2 日前、OpenAI はこれまでで最も強力な人工知能モデルである GPT-4 を発表しました。 OpenAIは公式ウェブサイトでGPT-4を「OpenAIの最も先進的なシステム」と呼び、「より安全でより有用な応答を生成できる」としている。

Sutskever氏は講演の中で、GPT-4はChatGPTと比較して多くの面で「かなりの改善」を示しており、新しいモデルは画像とテキストを読み取れると指摘した。同氏は、質問や問い合わせに応じて「将来のバージョンでは、(ユーザーが)グラフを取得できるようになるかもしれない」と述べた。

ChatGPT と GPT-4 の世界規模での人気に伴い、これもこの会話の焦点になっているのは間違いありません。GPT-4 とその前身 (ChatGPT 関連のトピックを含む) に加えて、Huang Renxun 氏と Sutskever 氏は、ディープ ニューラル ネットワークの機能、限界、内部操作、さらには将来の AI 開発の予測についても語りました。

Digest Fungus とのこの会話を詳しく見てみましょう~

ネットワーク規模やコンピューティング規模を誰も気にしていないときに始めましょう

Sutskever の話を聞くと、多くの人がそう思うかもしれません名前を聞いて最初に思い浮かぶのは OpenAI とその関連 AI 製品ですが、Sutskever 氏の経歴は、博士研究員、Google Brain 研究科学者、Seq2Seq モデルの共同開発者である Andrew Ng 氏に遡ることを知っておく必要があります。

ディープラーニングは最初からSutskeverと結びついていたと言えます。

Sutskever 氏は、ディープ ラーニングに対する自身の理解を語る際、これからディープ ラーニングが実際に世界を変えるだろうと述べました。しかし、彼の個人的な出発点は、AI が大きな影響を与える可能性についての直観、意識と人間の経験に対する強い関心、そして AI の開発がこれらの質問の答えに役立つという信念にあります。

2002 年から 2003 年にかけて、学習は人間だけができることであり、コンピューターには学習できないと人々は一般に信じていました。そして、コンピューターに学習能力を与えることができれば、AI の分野で大きな進歩となるでしょう。

これは、Sutskever 氏が AI 分野に正式に参入する機会にもなりました。

そこでサツケヴァーは、同じ大学のジェフ・ヒントンを見つけました。彼の見解では、ヒントンが取り組んでいるニューラル ネットワークは画期的な技術であると考えています。なぜなら、ニューラル ネットワークの特徴は、自動的に学習してプログラムできる並列コンピュータにあるからです。

当時は、ネットワークの規模や計算規模の重要性を誰も気にしていませんでした。人々が訓練したニューラル ネットワークは 50 または 100 個だけで、その数百はすでに大きなものとみなされ、パラメータが 100 万個ありました。また、巨大だと考えられていました。

さらに、BLAS を理解できる人がいないため、最適化されていない CPU コードでしかプログラムを実行できません。最適化された Matlab を使用して、質問して比較するためにどのような種類の質問を使用するかなどのいくつかの実験を行っています。

しかし、問題は、これらは非常に散在的な実験であり、実際には技術の進歩を促進できないことです。

コンピューター ビジョン用のニューラル ネットワークの構築

当時、Sutskever 氏は、教師あり学習が将来の進むべき道であることに気づきました。

これは単なる直感ではなく、議論の余地のない事実でもあります。ニューラル ネットワークが十分に深く、十分な大きさであれば、いくつかの困難なタスクを解決する能力があります。しかし、人々はまだ深くて大規模なニューラル ネットワークに注目していません。あるいは、ニューラル ネットワークにまったく注目していません。

良い解決策を見つけるには、適切な大規模なデータセットと多くの計算が必要です。

ImageNet がそのデータです。当時、ImageNet は非常に難しいデータ セットでしたが、大規模な畳み込みニューラル ネットワークをトレーニングするには、それに匹敵する計算能力が必要でした。

次は GPU の登場です。 Jeff Hinton の提案の下、ImageNet データセットの出現により、畳み込みニューラル ネットワークが GPU に非常に適したモデルであるため、非常に高速に作成でき、規模がますます大きくなっていることがわかりました。

その後、この手法はコンピュータ ビジョンの記録を直接かつ大幅に破りました。これは以前の手法の継続に基づくものではなく、鍵となるのはデータ セット自体の難しさと範囲です。

OpenAI: 100 人から ChatGPT へ

OpenAI の初期の頃、Sutskever 氏は、プロジェクトをどのように推進すればよいのか完全にわかっていなかった、と認めました。

2016 年の初め、ニューラル ネットワークはそれほど開発されておらず、研究者の数も現在よりもはるかに少なかったです。 Sutskever 氏は、当時の社内の従業員はわずか 100 名で、そのほとんどがまだ Google またはディープマインドで働いていたことを思い出しました。

しかし、当時彼らには 2 つの大きなアイデアがありました。

そのうちの 1 つは、圧縮による教師なし学習です。 2016 年、教師なし学習は機械学習における未解決の問題であり、誰もそれを実装する方法を知りませんでした。最近、圧縮についてあまり話題になりませんでしたが、GPT が実際にトレーニング データを圧縮していることに突然誰もが気づきました。

数学的に言えば、これらの自己回帰生成モデルをトレーニングするとデータが圧縮され、なぜそれが機能するのかが直感的にわかります。データが十分に圧縮されていれば、そこに存在するすべての隠された情報を抽出できます。これは、OpenAI の感情ニューロンに関する関連研究にも直接つながりました。

同時に、Amazon レビューの次の文字を予測するために同じ LSTM を調整したところ、次の文字を十分に予測できれば、LSTM 内に次の文字に対応するニューロンが存在することがわかりました。その心情。これは教師なし学習の効果を示す良い例であり、次の文字予測のアイデアも検証します。

しかし、教師なし学習のデータはどこから入手できるのでしょうか?サツケバー氏によると、教師なし学習の難しい部分は、データよりもむしろ、なぜそれを行うのか、そして次のキャラクターを予測するためにニューラル ネットワークをトレーニングすることには追求し探求する価値があると認識していることだという。そこから、わかりやすい表現を学びます。

もう 1 つの大きなアイデアは強化学習です。スツケヴァー氏は常に、大きいほど良いと信じてきました。 OpenAI の目標の 1 つは、適切なスケール方法を見つけ出すことです。

OpenAI が完了した最初の本当に大きなプロジェクトは、ストラテジー ゲーム Dota 2 の実装でした。当時、OpenAI は強化学習エージェントを自分自身と戦うように訓練し、一定のレベルに達して人間のプレイヤーとゲームをプレイできるようにすることが目標でした。

Dota の強化学習から、GPT 出力テクノロジー ベースと組み合わせた人間のフィードバックの強化学習への変換が、今日の ChatGPT になりました。

OpenAI が大規模なニューラル ネットワークをトレーニングする方法

インターネット上のさまざまなテキスト内の次の単語を正確に予測するために大規模なニューラル ネットワークをトレーニングする場合、OpenAI はワールド モデルを学習します。

これは、テキストで統計的相関関係を学習しているだけのように見えますが、実際には、これらの統計的相関関係を学習すると、この知識を非常に圧縮できます。ニューラル ネットワークが学習するのはテキストを生成する過程でのいくつかの表現ですが、このテキストは実際には世界地図であり、ニューラル ネットワークは人間や社会を見るための視点をどんどん学習して​​いきます。これらは、ニューラル ネットワークが次の単語を正確に予測するタスクで実際に学習するものです。

同時に、次の単語の予測が正確であればあるほど復元度が高まり、この過程で得られる世界の解像度も高くなります。これは事前トレーニング段階の役割ですが、ニューラル ネットワークが私たちが望むように動作するわけではありません。

言語モデルが実際にやろうとしていることは、インターネット上に何らかの接頭辞やヒントで始まるランダムなテキストがあった場合、それは何を完成させるかということです。

もちろん、入力するテキストをインターネット上で見つけることもできますが、これは当初考えられていたものではないため、微調整、人間の教師による強化学習、その他の形式による追加のトレーニングが必要です。 AI 支援が役立つ場所の説明。

しかし、これは新しい知識を教えることではなく、その知識とコミュニケーションをとり、私たちが望むものをその知識に伝えることであり、これには境界も含まれます。このプロセスがより適切に実行されるほど、ニューラル ネットワークの有用性と信頼性が向上し、境界の忠実度が高くなります。

GPT-4 についてもう一度話しましょう

ChatGPT が最も急速にユーザー数を伸ばしているアプリケーションになってから間もなく、GPT-4 が正式にリリースされました。

Sutskever 氏は、この 2 つの違いについて、GPT-4 は ChatGPT と比較して多くの点で大幅な改善を達成していると述べました。

ChatGPT と GPT-4 の最も重要な違いは、GPT-4 に基づいて構築すると、次の文字をより高い精度で予測できることです。ニューラル ネットワークがテキスト内の次の単語をより正確に予測できるほど、テキストをよりよく理解できます。

たとえば、推理小説を読んだとします。その小説は非常に複雑で、多くのプロットや登場人物が散りばめられており、多くの謎めいた手がかりが隠されています。この本の最後の章で、探偵はすべての手がかりを集め、全員を集め、これから犯人を明らかにする、そしてその人物は...

これが GPT-4 です。予測できる。

ディープラーニングでは論理的な推論ができないと言われています。しかし、この例にしろ、GPT ができることの一部にしろ、ある程度の推論能力を示しています。

サツケヴァー氏は、論理的推論を定義するときに、次の決定を下すときにそれを特定の方法で考えることができれば、より良い答えが得られるかもしれないと答えました。ニューラル ネットワークがどこまで実現できるかはまだわかりませんが、OpenAI はまだその可能性を十分に引き出していません。

一部のニューラル ネットワークには実際にこの種の機能がすでに備わっていますが、そのほとんどは十分な信頼性がありません。信頼性は、これらのモデルを実用化する上での最大の障害であり、現行モデルの大きなボトルネックでもあります。重要なのは、モデルに特定の機能があるかどうかではなく、どの程度の機能があるかです。

Sutskever氏はまた、「GPT-4にはリリース当時、検索機能が組み込まれていなかった。単に次の単語を予測できる優れたツールであるが、これは完全に備えていると言える」と述べた。能力があり、検索がより効率的になります。

GPT-4 のもう 1 つの重要な改善は、画像の応答と処理です。その中でマルチモーダル学習は重要な役割を果たしています. Sutskever氏は, マルチモーダルには2つの側面があると述べました. 1つ目は, マルチモーダルはニューラルネットワーク, 特に視覚に役立つということです; 2つ目は, テキスト学習に加えて, 世界についての知識も得ることができるということです.イメージから学びました。

人工知能の未来

AI を使用して AI をトレーニングする場合、データのこの部分を無視すべきではないと Sutskever 氏は言います。

将来の言語モデルの発展を予測することは困難ですが、Sutskever 氏の見解では、この分野は今後も進歩し、AI はその強さで人類に衝撃を与え続けるだろうと信じる十分な理由があります。その能力の限界。 AIの信頼性は信頼できるかどうかで決まり、将来的には絶対に信頼できる段階に必ず到達します。

完全に理解していない場合は、それを理解するために質問したり、わからないことを伝えたりします。これらは、AI のユーザビリティが最も大きな影響を及ぼし、最も大きな影響を与える領域です。今後の進歩。

現在、私たちはこのような課題に直面しています。ニューラル ネットワークで長い文書を要約したり、概要を取得したりする際に、重要な詳細が見落とされていないことを確認するにはどうすればよいでしょうか?ある点が読者全員が同意するほど明らかに重要である場合、ニューラル ネットワークによって要約されたコンテンツは信頼できるものとして受け入れられます。

ニューラルネットワークがユーザーの意図に明確に従うかどうかについても同様です。

今後 2 年間でこのテクノロジーはますます多く使用され、このテクノロジーの信頼性はますます高まるでしょう。

関連レポート: https://blogs.nvidia.com/blog/2023/03/22/sutskever-openai-gtc/

以上がGPT-4 は ChatGPT と比べてどのような点が改善されていますか? Jen-Hsun Huang 氏が OpenAI 共同創設者と「炉辺チャット」を開催の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ChatGPT では、無料ユーザーが 1 日あたりの制限付きで DALL-E 3 を使用して画像を生成できるようになりました ChatGPT では、無料ユーザーが 1 日あたりの制限付きで DALL-E 3 を使用して画像を生成できるようになりました Aug 09, 2024 pm 09:37 PM

DALL-E 3は、前モデルより大幅に改良されたモデルとして2023年9月に正式導入されました。これは、複雑な詳細を含む画像を作成できる、これまでで最高の AI 画像ジェネレーターの 1 つと考えられています。ただし、発売当初は対象外でした

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです 世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

YOLOは不滅です! YOLOv9 がリリースされました: パフォーマンスとスピード SOTA~ YOLOは不滅です! YOLOv9 がリリースされました: パフォーマンスとスピード SOTA~ Feb 26, 2024 am 11:31 AM

現在の深層学習手法は、モデルの予測結果が実際の状況に最も近くなるように、最適な目的関数を設計することに重点を置いています。同時に、予測に十分な情報を取得するには、適切なアーキテクチャを設計する必要があります。既存の方法は、入力データがレイヤーごとの特徴抽出と空間変換を受けると、大量の情報が失われるという事実を無視しています。この記事では、ディープネットワークを介してデータを送信する際の重要な問題、つまり情報のボトルネックと可逆機能について詳しく説明します。これに基づいて、深層ネットワークが複数の目的を達成するために必要なさまざまな変化に対処するために、プログラマブル勾配情報 (PGI) の概念が提案されています。 PGI は、目的関数を計算するためのターゲット タスクに完全な入力情報を提供することで、ネットワークの重みを更新するための信頼できる勾配情報を取得できます。さらに、新しい軽量ネットワーク フレームワークが設計されています。

二代目アメカ登場!彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 二代目アメカ登場!彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 Mar 04, 2024 am 09:10 AM

人型ロボット「アメカ」が第二世代にバージョンアップ!最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。 「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン 大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン Apr 23, 2024 pm 03:28 PM

Llama3 に関しては、新しいテスト結果が発表されました。大規模モデル評価コミュニティ LMSYS は、Llama3 が 5 位にランクされ、英語カテゴリでは GPT-4 と同率 1 位にランクされました。このリストは他のベンチマークとは異なり、モデル間の 1 対 1 の戦いに基づいており、ネットワーク全体の評価者が独自の提案とスコアを作成します。最終的に、Llama3 がリストの 5 位にランクされ、GPT-4 と Claude3 Super Cup Opus の 3 つの異なるバージョンが続きました。英国のシングルリストでは、Llama3 がクロードを追い抜き、GPT-4 と並びました。この結果について、Meta の主任科学者 LeCun 氏は非常に喜び、リツイートし、

携帯電話にchatgptをインストールする方法 携帯電話にchatgptをインストールする方法 Mar 05, 2024 pm 02:31 PM

インストール手順: 1. ChatGTP ソフトウェアを ChatGTP 公式 Web サイトまたはモバイル ストアからダウンロードします; 2. それを開いた後、設定インターフェイスで言語を中国語を選択します; 3. ゲーム インターフェイスでヒューマン マシン ゲームを選択し、中国スペクトル; 4 . 起動後、チャット ウィンドウにコマンドを入力してソフトウェアを操作します。

世界で最も強力なモデルが一夜にして交代し、GPT-4 時代の終わりを告げました。クロード3号は事前にGPT-5を狙撃し、1万ワードの論文を3秒で読み切るなど、人間に近い理解力を持っている。 世界で最も強力なモデルが一夜にして交代し、GPT-4 時代の終わりを告げました。クロード3号は事前にGPT-5を狙撃し、1万ワードの論文を3秒で読み切るなど、人間に近い理解力を持っている。 Mar 06, 2024 pm 12:58 PM

ボリュームはクレイジー、ボリュームはクレイジー、そして大きなモデルがまた変わりました。たった今、世界で最も強力な AI モデルが一夜にして交代し、GPT-4 が祭壇から引き抜かれました。 Anthropic が Claude3 シリーズの最新モデルをリリースしました 一言評価: GPT-4 を本当に粉砕します!マルチモーダルと言語能力の指標に関しては、Claude3 が勝ちます。 Anthropic 氏の言葉を借りれば、Claude3 シリーズ モデルは、推論、数学、コーディング、多言語理解、視覚において新たな業界のベンチマークを設定しました。 Anthropic は、セキュリティ概念の違いを理由に OpenAI から「離反」した従業員によって設立された新興企業であり、同社の製品は繰り返し OpenAI に大きな打撃を与えてきました。今回、Claude3は大きな手術まで受けました。

1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViT 1.3ミリ秒には1.3ミリ秒かかります。清華社の最新オープンソース モバイル ニューラル ネットワーク アーキテクチャ RepViT Mar 11, 2024 pm 12:07 PM

論文のアドレス: https://arxiv.org/abs/2307.09283 コードのアドレス: https://github.com/THU-MIG/RepViTRepViT は、モバイル ViT アーキテクチャで優れたパフォーマンスを発揮し、大きな利点を示します。次に、この研究の貢献を検討します。記事では、主にモデルがグローバル表現を学習できるようにするマルチヘッド セルフ アテンション モジュール (MSHA) のおかげで、軽量 ViT は一般的に視覚タスクにおいて軽量 CNN よりも優れたパフォーマンスを発揮すると述べられています。ただし、軽量 ViT と軽量 CNN のアーキテクチャの違いは十分に研究されていません。この研究では、著者らは軽量の ViT を効果的なシステムに統合しました。

See all articles