OpenAI 社長: GPT-4 は完璧ではありませんが、明らかに異なります
# 3 月 16 日のニュース、人工知能研究会社 OpenAI は昨日、待望のテキスト生成 AI モデル GPT-4 をリリースしました。 OpenAIの共同創設者兼社長であるグレッグ・ブロックマン氏はインタビューで、GPT-4は完璧ではないが、明らかに違うと語った。
GPT-4 は、より真実に近い表現を提供し、開発者がそのスタイルと動作をより簡単に制御できるようにするなど、多くの重要な点で前身の GPT-3 を改良しています。 GPT-4 は、画像を理解したり、写真に注釈を追加したり、写真に写っているものを詳細に説明したりできるという意味でもマルチモーダルです。
しかし、GPT-4には重大な欠陥もあります。 GPT-3 と同様に、モデルは「錯覚」(つまり、モデルによって集約されたテキストがソース テキストと無関係であるか、十分に不正確である) に悩まされ、基本的な推論エラーを起こします。 OpenAIはブログで例を挙げ、GPT-4は「エルヴィス・プレスリー」を「俳優の息子」と表現したが、実際には両親も俳優ではなかった。
GPT-4 と GPT-3 を比較するよう求められたとき、ブロックマン氏は「違う」という 4 語の答えだけを返しました。彼は次のように説明しました。「GPT-4 は、まだ多くの問題やバグがありますが、明らかに異なります。しかし、微積分や法律などの科目のスキルが飛躍的に向上しているのがわかります。一部の領域ではパフォーマンスが非常に悪かったですが、現在は
テスト結果はブロックマンの見解を裏付けています。大学入学資格試験では、GPT-4 が 4 点(5 点満点)、GPT-3 が 1 点、GPT-3 と GPT-4 の間の GPT-3.5 も 4 点となります。 。司法模擬試験では、GPT-4 のスコアは上位 10% に入りましたが、GPT-3.5 のスコアは下位 10% 付近で推移していました。
同時に、GPT-4 は前述のマルチモードをより重視しています。 「キリンについての記事を書いてください」などのテキスト プロンプトのみを受け入れることができる GPT-3 および GPT-3.5 とは異なり、GPT-4 は画像とテキストの両方のプロンプトを受け入れて、画像内の人物の識別などの特定の操作を実行できます。セレンゲティで捕獲されたキリンとその内容の基本的な説明。
これは、GPT-4 が画像とテキスト データでトレーニングされていたのに対し、その前任者はテキストのみでトレーニングされていたためです。 OpenAIは、トレーニングデータは「法的に認可され、公開されているさまざまなデータソースから来ており、公開されている個人情報が含まれている可能性がある」と述べたが、詳細の提供を求められた際、ブロックマン氏は拒否した。 OpenAI は以前、トレーニング データによって法的トラブルに巻き込まれました。
GPT-4 の画像理解能力は人々に深い印象を残しました。たとえば、「この画像の何がそんなに面白いですか?」というプロンプトを入力すると、GPT-4 は画像全体を分解し、ジョークのオチを正しく説明します。
現在、GPT - 4 を使用できるパートナーは 1 人だけです。 、視覚障害者向けの支援アプリ「Be My Eyes」ブロックマン氏は、OpenAIがリスクとメリットとデメリットを随時評価するため、より広範な展開が進行中であると述べ、それは「ゆっくりと意図的に」行われるだろうと述べた。 # 彼はまた、「顔認識や人々の画像の処理方法など、対処する必要がある政策上の問題もあります。私たちは、危険ゾーンがどこにあるのか、赤い線がどこにあるのかを見つけ出し、時間をかけて解決策を見つける必要があります。 「
OpenAI は、テキストから画像への変換システム Dall-E 2 でも同様の倫理的ジレンマに直面しました。OpenAI は、最初にこの機能を無効にした後、顧客が AI を活用した画像生成システムで使用する顔をアップロードできるようにしました。」当時、OpenAI は、セキュリティ システムのアップグレードにより、ディープフェイクやポルノ、政治的、暴力的なコンテンツの作成の試みによる潜在的な害が最小限に抑えられるため、顔編集機能が可能になったと主張しました。長期的な問題は、GPT-4 が危害を引き起こす可能性のある方法で不注意に使用されることを防ぐことです。モデルがリリースされてから数時間後、イスラエルのサイバーセキュリティスタートアップ Adversa AI は、OpenAI のコンテンツ フィルターをバイパスすることを実証するブログ投稿を公開しました。また、GPT-4 にフィッシングメールを生成させます。同性愛者に対する攻撃的な説明やその他の不快なテキスト。
これは言語モデルの世界では新しい問題ではありません。Facebook の親会社 Meta のチャットボットである BlenderBot や OpenAI の ChatGPT も、不適切なコンテンツを出力する誘惑にさらされており、
GPT-4 の堅牢性について尋ねられたとき、ブロックマン氏は、このモデルは、GPT-4 の堅牢性について次のように強調しました。 「6か月のセキュリティトレーニングを受けている。内部テストでは、OpenAIの使用ポリシーで許可されていないコンテンツのリクエストには応答しなかった。GPTを理解するために多くの時間を費やした」とブロックマン氏は語った。私たちは、人々が求める個性やモードに合わせてモデルをさらに拡張できるように、さまざまな改善を含めてモデルを継続的に更新しています。 「
率直に言って、初期の実世界テストの結果はそれほど満足のいくものではありません。 Adversa AI テストに加えて、Microsoft のチャットボット Bing Chat も脱獄が非常に簡単であることが判明しました。ユーザーは慎重に作成された入力を使用して、チャットボットに愛情を表現したり、危害を加えると脅したり、大量殺人を正当化したり、陰謀論をでっち上げたりすることができます。
Brockman 氏は、GPT-4 がこの分野で不十分であることは否定しませんでしたが、「システム」メッセージと呼ばれる API レベルの機能を含む、このモデルの新しい制限ツールを強調しました。システム メッセージは基本的に、GPT-4 との対話の雰囲気を設定し、境界を確立する指示です。たとえば、システム メッセージは次のようになります。「あなたは常にソクラテス式で質問に答える家庭教師です。あなたは決して生徒に答えを与えることはありませんが、常に正しい質問をして、生徒が自分で考えることを学べるように努めています。」
システム メッセージが GPT-4 が軌道から外れることを防ぐガードレールとして機能するという考えです。 「GPT-4のトーン、スタイル、内容を本当に理解することが私たちの大きな焦点でした」とブロックマン氏は語った。
ブロックマン氏はまた、AI モデルのパフォーマンスを評価するための OpenAI の最新オープン ソース ソフトウェア フレームワークである Evals についても言及し、OpenAI はこのフレームワークの特徴を「強化」することに取り組んでいます。そのモデル。 Evals を使用すると、ユーザーはパフォーマンスをチェックしながらモデル (GPT-4 など) を評価するベンチマークを開発および実行できます。これはモデル テストへのクラウドソース アプローチです。
Brockman 氏は次のように述べています。「Evals を使用すると、ユーザーが関心のあるユースケースをよりよく確認でき、テストできるようになります。このフレームワークをオープンソース化した理由の 1 つは、3 回ごとに新しいモデルをリリースしなくなったことです。 」また、OpenAI は Evals でモデルをテストした人々に報酬を与えるかどうかも質問した。同氏はこれにコミットすることに消極的だったが、期間限定でOpenAIがGPT-4 APIを要求するEevalsユーザーにGPT-4 APIへの早期アクセスを許可していることには言及した。
ブロックマン氏は、追加のテキストを生成する前にモデルが考慮できるテキストを指す GPT-4 のコンテキスト ウィンドウについても話しました。 OpenAIは、通常のGPT-4の「メモリ」の5倍、GPT-3の「メモリ」の8倍である、約50ページのコンテンツを「記憶」できるバージョンのGPT-4をテストしている。
Brockman は、コンテキスト ウィンドウの拡大により、特に企業において、これまで未踏の新たなユースケースが生まれると考えています。彼は、さまざまな部門の従業員を含むさまざまなソースからの背景と知識を利用して、非常に知識豊富でありながら会話形式で質問に回答できる、企業向けに構築された AI チャットボットを構想していました。
これは新しい概念ではありません。しかし、ブロックマン氏は、GPT-4 の回答は、他のチャットボットや検索エンジンが現在提供している回答よりもはるかに役立つと信じています。 「以前は、モデルはあなたが誰なのか、何に興味があるのかなどまったく知りませんでした。コンテキスト ウィンドウが大きくなったことで間違いなくモデルが強化され、モデルが人々に提供できるサポートが大幅に強化されました。」と彼は言いました。Xiaoxiao)
以上がOpenAI 社長: GPT-4 は完璧ではありませんが、明らかに異なりますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









OpenAI は最近、最新世代の埋め込みモデル embeddingv3 のリリースを発表しました。これは、より高い多言語パフォーマンスを備えた最もパフォーマンスの高い埋め込みモデルであると主張しています。このモデルのバッチは、小さい text-embeddings-3-small と、より強力で大きい text-embeddings-3-large の 2 つのタイプに分類されます。これらのモデルがどのように設計され、トレーニングされるかについてはほとんど情報が開示されておらず、モデルには有料 API を介してのみアクセスできます。オープンソースの組み込みモデルは数多くありますが、これらのオープンソース モデルは OpenAI のクローズド ソース モデルとどう違うのでしょうか?この記事では、これらの新しいモデルのパフォーマンスをオープンソース モデルと実証的に比較します。データを作成する予定です

2023年、AI技術が注目を集め、プログラミング分野を中心にさまざまな業界に大きな影響を与えています。 AI テクノロジーの重要性に対する人々の認識はますます高まっており、Spring コミュニティも例外ではありません。 GenAI (汎用人工知能) テクノロジーの継続的な進歩に伴い、AI 機能を備えたアプリケーションの作成を簡素化することが重要かつ緊急になっています。このような背景から、AI 機能アプリケーションの開発プロセスを簡素化し、シンプルかつ直観的にし、不必要な複雑さを回避することを目的とした「SpringAI」が登場しました。 「SpringAI」により、開発者はAI機能を搭載したアプリケーションをより簡単に構築でき、使いやすく、操作しやすくなります。

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

著者丨コンパイル: TimAnderson丨プロデュース: Noah|51CTO Technology Stack (WeChat ID: blog51cto) Zed エディター プロジェクトはまだプレリリース段階にあり、AGPL、GPL、および Apache ライセンスの下でオープンソース化されています。このエディターは高性能と複数の AI 支援オプションを備えていますが、現在は Mac プラットフォームでのみ利用可能です。 Nathan Sobo 氏は投稿の中で、GitHub 上の Zed プロジェクトのコード ベースでは、エディター部分は GPL に基づいてライセンスされ、サーバー側コンポーネントは AGPL に基づいてライセンスされ、GPUI (GPU Accelerated User) インターフェイス部分はApache2.0ライセンス。 GPUI は Zed チームによって開発された製品です

少し前まで、OpenAISora はその驚くべきビデオ生成効果で急速に人気を博し、数ある文学ビデオ モデルの中でも際立って世界的な注目を集めるようになりました。 2 週間前にコストを 46% 削減した Sora トレーニング推論再現プロセスの開始に続き、Colossal-AI チームは世界初の Sora のようなアーキテクチャのビデオ生成モデル「Open-Sora1.0」を完全にオープンソース化し、全体をカバーしました。データ処理、すべてのトレーニングの詳細、モデルの重みを含むトレーニング プロセスを管理し、世界中の AI 愛好家と協力してビデオ作成の新時代を推進します。ちょっと覗いてみましょう。Colossal-AI チームがリリースした「Open-Sora1.0」モデルによって生成された賑やかな街のビデオを見てみましょう。オープンソラ1.0

Ollama は、Llama2、Mistral、Gemma などのオープンソース モデルをローカルで簡単に実行できるようにする非常に実用的なツールです。この記事では、Ollamaを使ってテキストをベクトル化する方法を紹介します。 Ollama をローカルにインストールしていない場合は、この記事を読んでください。この記事では、nomic-embed-text[2] モデルを使用します。これは、短いコンテキストおよび長いコンテキストのタスクにおいて OpenAI text-embedding-ada-002 および text-embedding-3-small よりも優れたパフォーマンスを発揮するテキスト エンコーダーです。 o が正常にインストールされたら、nomic-embed-text サービスを開始します。

MicrosoftとOpenAIが人型ロボットのスタートアップに巨額の資金を投資していることが年初に明らかになった。このうちマイクロソフトは9500万ドル、OpenAIは500万ドルを投資する予定だ。ブルームバーグによると、同社は今回のラウンドで総額5億米ドルを調達する予定で、資金調達前の評価額は19億米ドルに達する可能性がある。何が彼らを惹きつけるのでしょうか?まずはこの会社のロボット分野の実績を見てみましょう。このロボットはすべて銀と黒で、その外観はハリウッドの SF 大作映画に登場するロボットのイメージに似ています。今、彼はコーヒー カプセルをコーヒー マシンに入れています。正しく置かれていない場合でも、何もせずに自動的に調整されます。人間リモコン: ただし、しばらくすると、コーヒーを持ち帰って楽しむことができます: 家族にそれを認識した人はいますか? はい、このロボットは少し前に作成されました。

Open AI の ChatGPT Mac アプリケーションは、ここ数か月間 ChatGPT Plus サブスクリプションを持つユーザーのみに限定されていましたが、現在は誰でも利用できるようになりました。最新の Apple S を持っている限り、アプリは他のネイティブ Mac アプリと同じようにインストールされます。
