大型モデルのシーリング GPT-4 と最強の競合他社であるクロードは、ビジネス面で熾烈な競争を繰り広げているだけでなく、両社の従業員はプライベートでも「互いに戦争」しています:
決闘をする誰が勝つかを判断するための即効性のある言葉で、AI に難しいタスクを最短時間で完了させましょう。
OpenAI 側では、先駆的な論文「Chain-of-Thought」の著者であるジェイソン・ウェイ氏も、大規模なモデルがステップに従うことができることを発見しました。考えるだけで推理力が向上する人。
彼は Google から OpenAI に転職したばかりで、今ではサークルの誰もが彼のことを「Brother Thinking Chain」と呼んでいます。
人間プレイヤーのカリーナ グエンも単純ではありません。彼女はカリフォルニア大学バークレー校を卒業し、現在は大規模な人間とコンピューターのインタラクションの設計と構築を担当しています。インターフェース。
コンテストのルールは非常にシンプルで、AI はプロンプトの単語を最適化することで、単語のグループを正しく並べ替えることができます。それが最初に勝ちます。
これは興味深い対決だったというだけでなく、視聴した多くのネチズンは、この大型モデルの新機能をいくつか得られたと述べました。
心の知能指数は大規模モデルの推論能力を向上させることができます
十分に強力な推論能力を備えた大規模モデルは、構造化された方法で問題を表現し、構造化された式を使用して問題を解決できます。
これらの結論にどのように到達したかを知りたい、またはゲーム自体に戻りたい。
カリーナがクロードを促すことだけが得意だと言ったので、ジェイソンも同意しました。ホームコートアドバンテージを上げます。タイピング速度の関係で、相手に 3 分かかるようにしてください。
つまり、いくつかの交渉の後、正式にゲームが開始されました。
最初に理解すべきことは、このタスクは難しくないようですが、GPT-4 もクロードも単純なプロンプトの言葉だけでは直接完了できないということです。
(anaconda はアンカーの前にランク付けされる必要があります)
残念ながら、これはまだ機能せず、時間切れで、ジェイソンは敗北を認めざるを得ませんでした。
競技終了後、カリーナさんも即答した言葉を披露しました。途中の推論ステップはまったく必要ありません。ただ、 AIにそれを認めさせる方法は、タスクを理解して実行するだけです。
人間: あなたの仕事はリストをアルファベット順に並べ替えて出力することです...わかりますか?
AI: わかりました
人間: リストは次のとおりです...
ジェイソンは混乱しました、これは本当にうまくいきますか?そして、自分の大きなモデルの場所を見つけてみてください。
彼の方法は GPT-4 に対して実際に有効であり、正しい Python コードを記述して正しい結果を与えることができることがわかりました。
では、私たちは言語モデルをトレーニングしているのでしょうか、それとも言語モデルが私たちをトレーニングしているのでしょうか?
もしできるならあなたがそれに「哲学的な詩」(各単語の長さが円周率の次の数字に対応する)を作らせたら、私はあなたに王の栄冠を与えるでしょう
(私はずっと努力してきました)数か月間)。
参考リンク: [1]https://twitter.com/_jasonwei/status/1661781745015066624
以上がOpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。