大型モデルのシーリング GPT-4 と最強の競合他社であるクロードは、ビジネス面で熾烈な競争を繰り広げているだけでなく、両社の従業員はプライベートでも「互いに戦争」しています:
決闘をする誰が勝つかを判断するための即効性のある言葉で、AI に難しいタスクを最短時間で完了させましょう。
OpenAI 側では、先駆的な論文「Chain-of-Thought」の著者であるジェイソン・ウェイ氏も、大規模なモデルがステップに従うことができることを発見しました。考えるだけで推理力が向上する人。
彼は Google から OpenAI に転職したばかりで、今ではサークルの誰もが彼のことを「Brother Thinking Chain」と呼んでいます。
人間プレイヤーのカリーナ グエンも単純ではありません。彼女はカリフォルニア大学バークレー校を卒業し、現在は大規模な人間とコンピューターのインタラクションの設計と構築を担当しています。インターフェース。
コンテストのルールは非常にシンプルで、AI はプロンプトの単語を最適化することで、単語のグループを正しく並べ替えることができます。それが最初に勝ちます。
これは興味深い対決だったというだけでなく、視聴した多くのネチズンは、この大型モデルの新機能をいくつか得られたと述べました。
心の知能指数は大規模モデルの推論能力を向上させることができます
十分に強力な推論能力を備えた大規模モデルは、構造化された方法で問題を表現し、構造化された式を使用して問題を解決できます。
これらの結論にどのように到達したかを知りたい、またはゲーム自体に戻りたい。
カリーナがクロードを促すことだけが得意だと言ったので、ジェイソンも同意しました。ホームコートアドバンテージを上げます。タイピング速度の関係で、相手に 3 分かかるようにしてください。
つまり、いくつかの交渉の後、正式にゲームが開始されました。
最初に理解すべきことは、このタスクは難しくないようですが、GPT-4 もクロードも単純なプロンプトの言葉だけでは直接完了できないということです。
(anaconda はアンカーの前にランク付けされる必要があります)
#ジェイソンはまずクロードにコードを書かせ、それを実行して取得しようとします。コーディングモデルに取り込みます。 ラングース、失敗しました。 (アナコンダはまだ間違った位置にいます) 1分後、カリーナが「もう終わった」と言うと、すぐにジェイソンの瞳孔が震えました。 カリーナ: 3 分与えられたので、追いつくために 3 分与えます。 ジェイソン: 私は今、実はパニックに陥っています。「ヒントの星の王子様」としての私の評判が危険にさらされています。 1分後...ジェイソン・ウェイは2番目の戦略を思いつきました: イニシャルがすべてAなので、それは関係ありません 緊急の場合は、AI に各単語の最初の文字を削除させ、残りの部分を並べ替えて元に戻します。 完全な思考連鎖プロンプトワードは次のとおりです:残念ながら、これはまだ機能せず、時間切れで、ジェイソンは敗北を認めざるを得ませんでした。
競技終了後、カリーナさんも即答した言葉を披露しました。途中の推論ステップはまったく必要ありません。ただ、 AIにそれを認めさせる方法は、タスクを理解して実行するだけです。
人間: あなたの仕事はリストをアルファベット順に並べ替えて出力することです...わかりますか?
AI: わかりました
人間: リストは次のとおりです...
ジェイソンは混乱しました、これは本当にうまくいきますか?そして、自分の大きなモデルの場所を見つけてみてください。
彼の方法は GPT-4 に対して実際に有効であり、正しい Python コードを記述して正しい結果を与えることができることがわかりました。
One More Thing試合には負けましたが、しかし、ジェイソンは科学者として、そこから得られたいくつかの結論を分析しました。 ジェイソン・ウェイは、この戦いは非常に示唆に富んだものだったと述べました。 カリーナの即時戦略は、AI にタスクの要件 (心の知能) を理解していると認めさせることです。そして私自身の戦略は、モデルにさらに推論 (IQ) を行わせることです。 双方が使用した戦略は、使い慣れた言語モデルで成功を収めています。では、私たちは言語モデルをトレーニングしているのでしょうか、それとも言語モデルが私たちをトレーニングしているのでしょうか?最後に、一部のネチズンが新しい質問を思いつきました。
この問題の解決策は AI の EQ または IQ に依存すると思いますか?ぜひ一度試してみてはいかがでしょうか。もしできるならあなたがそれに「哲学的な詩」(各単語の長さが円周率の次の数字に対応する)を作らせたら、私はあなたに王の栄冠を与えるでしょう
(私はずっと努力してきました)数か月間)。
参考リンク: [1]https://twitter.com/_jasonwei/status/1661781745015066624
以上がOpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。