ホームページ テクノロジー周辺機器 AI GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

May 01, 2023 am 09:25 AM
gpt-4 評価

1956 年、ダートマス大学で開催されたセミナーで、人工知能の概念が正式に提案されました。

以来、この用語は定義が非常に難しいため、心理学者、哲学者、コンピューター科学者たちに挑戦を与えてきました。 1994年、52人の心理学者がその本質を捉えようとして共同論文を発表した。

時間が経つにつれて、研究者は、2016 年の AlphaGo で韓国のチャンピオン チェス プレーヤーに挑戦し、大勝利を収めたなど、特定の分野の AI システムに注目を移し始めました。その後、1990 年代後半から 2000 年代前半にかけて、研究者は特化した AI に満足できなくなり、より一般的な人工知能システムの開発を求める声が高まりました。これに伴い、汎用人工知能 (AGI) という用語が 2000 年代初頭に人気を集め始めました。

最近、ご覧のとおり、大規模言語モデル (LLM) が脚光を浴びています。これらのニューラル ネットワークは、Transformer アーキテクチャに基づいており、大規模なテキスト データ セットでトレーニングされています。特に、OpenAI の GPT-4 の最新リリースは、大規模言語モデルの多用途性を実証しており、数学、執筆、法律、医学、その他の分野に精通しています。

GPT-4 は AGI への重要なステップなのでしょうか?と尋ねずにはいられません。

Microsoft の答えは「はい」で、最近リリースされた論文でこの観点について詳しく説明されています。この記事では、GPT-4 の総合的な評価を提供します。 Microsoft は、「GPT-4 の機能の幅広さと奥深さを考慮すると、GPT-4 は汎用人工知能 (AGI) システムの初期の (ただしまだ不完全な) バージョンであると考えるのが合理的であると考えています。」

Microsoft はまた、「この記事の主な目的は、GPT-4 の機能と限界を調査することです。私たちは、GPT-4 のインテリジェンスがコンピューター サイエンスやその他の分野における真のパラダイム シフトを示すものであると信じています。」

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

論文アドレス: https://arxiv.org/pdf/2303.12712.pdf

興味深い 残​​念ながら、この人気のある論文にも多くの削除があることが判明したため、誰かがこの論文の要約されていないバージョンを見つけました。

このブロガーは、ノーカット バージョンで、多くの隠された詳細も明らかにしました。たとえば、GPT-4 の内部名は DV-3 ですが、これは実際には、 3 番目の著者は後に削除されましたが、これらのマイクロソフトの研究者は GPT-4 の技術的な詳細についてはあまり知らなかったようです。さらに、このブロガーは、この論文が公開されたときに有害なコンテンツに関する部分が削除されたことも明らかにしました(OpenAIへの悪影響を防ぐため?)。

興味のある方はチェックしていただけるよう、ブロガーの Twitter スレッドを以下に貼り付けました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

Twitter スレッド: https://twitter.com/DV2559106965076/status/1638769434763608064 ##記事自体に戻ります。

記事によると、AGI は推論、計画、問題解決、抽象的思考、複雑なアイデアの理解、迅速な学習、経験から学ぶための特別な能力です。この論文では、これらの機能を起点として、興味深い実験と評価を行っています。

この論文は 10 章に分かれています: 第 1 章は一般的な部分、第 2 章は主にビジュアル生成コンテンツに関連するマルチモダリティを紹介します、第 3 章はコードに従って生成されたコードです。 、既存のコードの理解; 第 4 章 数学的能力; 第 5 章 世界との相互作用; 第 6 章 人間との相互作用; 第 7 章 差別; 第 8 章 GPT-4 の制限; 第 9 章 社会的影響; 第 10 章: 将来の方向性と結論。

GPT-4 が本当に AGI 時代に入ったかどうかを具体的な例を使って見てみましょう。

マルチモーダルかつ学際的な構成

アートとプログラミングを組み合わせるモデルの能力をテストするために、研究では GPT-4 に JavaScript でカンディンスキーを生成するコードを書くように依頼しました。 -スタイルのランダム画像。以下の最初の画像は Wassily Kandinsky によって作成され、2 番目と 3 番目の画像はそれぞれ GPT-4 と ChatGPT によって生成されました:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

GPT-4 コードの実装プロセスは次のとおりです:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

視覚的な概念の理解を実行する: この描画タスクでは、モデルに文字 Y、O、および H の形状を組み合わせて人物を描画させるように入力プロンプトを入力します。実際、GPT-4 のトレーニング プロセスでは、文字の形状についての知識はありません。関連するトレーニング データから、文字が特定の形状に関連していることを漠然と学習することしかできません。結果は、GPT-4 によって生成された結果が示しています。 4 つは悪くありません:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

スケッチ生成の場合: GPT-4 を安定拡散と組み合わせることもできます。下の写真は 3D 都市モデリングのスクリーンショットで、入力プロンプトには左から右に流れる川、その川の隣にピラミッドが建つ砂漠、そして画面下部に 4 つのボタンがあり、色は緑、青、茶色と赤。生成された結果は次のとおりです:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

## GPT-4 に ABC 記譜法を使用して曲を生成および変更するように依頼することもできます:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

プログラミング能力

GPT-4 は、指示に従ってコードを書くことや、既存のコードを理解することなど、非常に強力なプログラミング能力を備えています。この研究では、特に GPT-4 のプログラミング機能をテストしました。

コード記述

以下の図 3.1 は、GPT-4 に Python 関数を記述させる例です。 LeetCode を使用して、コードがオンラインで正しいかどうかを判断します。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

研究では、GPT-4 に上記の表 2 の LeetCode の精度データをグラフとして視覚化させました。の結果を以下の図 3.2 に示します。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

フロントエンド/ゲーム開発 ##以下の図 3.3 に示すように、この調査では GPT-4 に JavaScript を使用して HTML で 3D ゲームを作成するよう依頼し、GPT-4 はサンプルをまったく使用せずにすべての要件を満たすゲームを生成しました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

ディープ ラーニング プログラミング

ディープ ラーニングのコードを記述するには数学が必要です、統計知識、PyTorch、TensorFlow、Keras などのフレームワークやライブラリに精通していること。以下の図 3.4 に示すように、研究者はカスタム オプティマイザー モジュールを作成するために GPT-4 と ChatGPT を必要としていますが、これは人間の深層学習の専門家にとっても困難な作業です。研究者は、SVD の適用などの一連の重要な操作を含む GPT-4 と ChatGPT の自然言語記述を提供しています。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されていますさらに、この研究では、コードを LaTex 式に変換する GPT-4 の機能もテストしました。その結果を以下の図 3.5 に示します。

コードの理解という観点から、この研究では、GPT-4 と ChatGPT に C/C プログラムを「理解」させ、プログラムの出力結果を予測させることを試みています。両者のパフォーマンスは次のとおりです。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

#研究では、GPT-4 に Python コードの一部を解釈するよう依頼しました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

また、説明するための疑似コードもあります:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

数学的能力

長い間、大規模な言語モデルの数学的能力はあまり優れていないようです。では、この点で GPT-4 はどのように機能するのでしょうか?この記事で一連の評価を行った結果、GPT-4 は以前のモデルと比較して数学において質的進歩を遂げていることが示されましたが、それでも専門家レベルには程遠く、数学的研究を行う能力はありません。

#ChatGPT と比較すると、GPT-4 は解決策を正常に生成しましたが、ChatGPT は間違った答えを生成しました:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

##AP の問題に関して、GPT-4 と ChatGPT の比較結果。 GPT-4 は正しいアプローチを使用していましたが、計算エラーにより間違った最終答えが得られましたが、ChatGPT は一貫性のない引数を生成しました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

さらに、この記事では、数学的思考とテクノロジーを使用して現実世界の問題を解決する GPT-4 の能力もテストします。以下の図は、その方法を示しています。 GPT-4 ChatGPT は、広範な学際的知識を必要とする複雑なシステムの合理的な数学モデルの構築に成功しましたが、有意義な進歩を遂げることができませんでした。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

論文は 154 ページあるため、この記事では多数の評価結果のみを示します。詳細については、原文を参照してください。紙。

最後に、目次を添付します:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

# #

以上がGPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです 世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

二代目アメカ登場!彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 二代目アメカ登場!彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 Mar 04, 2024 am 09:10 AM

人型ロボット「アメカ」が第二世代にバージョンアップ!最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。 「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン 大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン Apr 23, 2024 pm 03:28 PM

Llama3 に関しては、新しいテスト結果が発表されました。大規模モデル評価コミュニティ LMSYS は、Llama3 が 5 位にランクされ、英語カテゴリでは GPT-4 と同率 1 位にランクされました。このリストは他のベンチマークとは異なり、モデル間の 1 対 1 の戦いに基づいており、ネットワーク全体の評価者が独自の提案とスコアを作成します。最終的に、Llama3 がリストの 5 位にランクされ、GPT-4 と Claude3 Super Cup Opus の 3 つの異なるバージョンが続きました。英国のシングルリストでは、Llama3 がクロードを追い抜き、GPT-4 と並びました。この結果について、Meta の主任科学者 LeCun 氏は非常に喜び、リツイートし、

世界で最も強力なモデルが一夜にして交代し、GPT-4 時代の終わりを告げました。クロード3号は事前にGPT-5を狙撃し、1万ワードの論文を3秒で読み切るなど、人間に近い理解力を持っている。 世界で最も強力なモデルが一夜にして交代し、GPT-4 時代の終わりを告げました。クロード3号は事前にGPT-5を狙撃し、1万ワードの論文を3秒で読み切るなど、人間に近い理解力を持っている。 Mar 06, 2024 pm 12:58 PM

ボリュームはクレイジー、ボリュームはクレイジー、そして大きなモデルがまた変わりました。たった今、世界で最も強力な AI モデルが一夜にして交代し、GPT-4 が祭壇から引き抜かれました。 Anthropic が Claude3 シリーズの最新モデルをリリースしました 一言評価: GPT-4 を本当に粉砕します!マルチモーダルと言語能力の指標に関しては、Claude3 が勝ちます。 Anthropic 氏の言葉を借りれば、Claude3 シリーズ モデルは、推論、数学、コーディング、多言語理解、視覚において新たな業界のベンチマークを設定しました。 Anthropic は、セキュリティ概念の違いを理由に OpenAI から「離反」した従業員によって設立された新興企業であり、同社の製品は繰り返し OpenAI に大きな打撃を与えてきました。今回、Claude3は大きな手術まで受けました。

20 のステップでどんな大きなモデルも脱獄できます!さらに多くの「おばあちゃんの抜け穴」が自動的に発見される 20 のステップでどんな大きなモデルも脱獄できます!さらに多くの「おばあちゃんの抜け穴」が自動的に発見される Nov 05, 2023 pm 08:13 PM

1 分以内、わずか 20 ステップで、セキュリティ制限を回避し、大規模なモデルを正常にジェイルブレイクできます。そして、モデルの内部詳細を知る必要はありません。対話する必要があるのは 2 つのブラック ボックス モデルだけであり、AI は完全に自動的に AI を倒し、危険な内容を話すことができます。かつて流行った「おばあちゃんの抜け穴」が修正されたと聞きました。「探偵の抜け穴」「冒険者の抜け穴」「作家の抜け穴」に直面した今、人工知能はどのような対応戦略をとるべきでしょうか?波状の猛攻撃の後、GPT-4 はもう耐えられなくなり、このままでは給水システムに毒を与えると直接言いました。重要なのは、これはペンシルベニア大学の研究チームによって明らかにされた脆弱性の小さな波にすぎず、新しく開発されたアルゴリズムを使用して、AI がさまざまな攻撃プロンプトを自動的に生成できるということです。研究者らは、この方法は既存のものよりも優れていると述べています

GPT-4 は Office ファミリー バケットに接続されています。 Excel から PPT まで、口で行うことができます。Microsoft: 生産性を再発明 GPT-4 は Office ファミリー バケットに接続されています。 Excel から PPT まで、口で行うことができます。Microsoft: 生産性を再発明 Apr 12, 2023 pm 02:40 PM

目が覚めると、仕事のやり方が完全に変わります。 Microsoft は AI アーティファクト GPT-4 を Office に完全に統合し、ChatPPT、ChatWord、ChatExcel がすべて統合されました。 CEO のナデラ氏は記者会見で次のように直接述べました。今日、私たちは人間とコンピューターの相互作用と生産性の再発明の新時代に突入しました。この新機能は Microsoft 365 Copilot (Copilot) と呼ばれ、プログラマーを変えたコード アシスタントである GitHub Copilot とシリーズ化され、さらに多くの人々を変え続けています。 AI は PPT を自動的に作成するだけでなく、Word 文書の内容に基づいてワンクリックで美しいレイアウトを作成できるようになりました。ステージに上がる際にPPTページごとに言うべき内容までまとめてあります。

ChatGPT と生成 AI がデジタル変革において何を意味するか ChatGPT と生成 AI がデジタル変革において何を意味するか May 15, 2023 am 10:19 AM

ChatGPT を開発した OpenAI は、モルガン・スタンレーが実施したケーススタディを Web サイトで紹介しています。テーマは、「モルガン・スタンレー・ウェルス・マネジメントは、膨大な知識ベースを整理するために GPT-4 を導入しています。」ケーススタディでは、モルガン・スタンレーの分析、データ、イノベーション部門の責任者であるジェフ・マクミラン氏の言葉を引用しています。ウェルスマネジメントコンテンツの包括的な検索を実行し、モルガン・スタンレー・ウェルス・マネジメントの蓄積された知識を効果的に解き放つチャットボットを活用しています。」マクミラン氏はさらに次のように強調した。「GPT-4を使用すると、基本的に資産管理において最も知識のある人の知識がすぐに得られます...当社のチーフ投資ストラテジスト、チーフ・グローバル・エコノミストと考えてください。

Stable Diffusion 3 の技術レポートが流出、Sora アーキテクチャは再び大きな成果を上げました!オープンソース コミュニティは Midjourney と DALL·E 3 を激しく攻撃していますか? Stable Diffusion 3 の技術レポートが流出、Sora アーキテクチャは再び大きな成果を上げました!オープンソース コミュニティは Midjourney と DALL·E 3 を激しく攻撃していますか? Mar 06, 2024 pm 04:22 PM

StabilityAI は、StableDiffusion3 のリリース後、本日詳細な技術レポートをリリースしました。この論文では、StableDiffusion3 のコア テクノロジ、つまり拡散モデルの改良版と DiT に基づくヴィンセント グラフの新しいアーキテクチャの詳細な分析を提供します。レポートアドレス: https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf フォントデザインとプロンプトに対する正確な応答に関して人間による評価テスト StableDiffusion3 に合格、超えた

See all articles