Google と OpenAI の学者が AI について語る: 言語モデルは数学を「征服」するために懸命に取り組んでいる
コンピュータが得意なことは何かと尋ねると、その答えの中で必ず数学が挙げられます。一流の学者は、長い研究期間を経て、数学的計算におけるコンピューターの発展の研究において驚くべき成果を達成しました。
たとえば、昨年、カリフォルニア大学バークレー校、OpenAI、Google の研究者は、GPT-3、DALL・E 2 などの言語モデルで大きな進歩を遂げました。開発されています。しかし、これまで言語モデルは、「アリスはボブよりも 5 個多いボールを持っており、チャーリーに 4 個のボールを与えた後、ボブは 2 個のボールを持っています。アリスにボールをいくつ持っているか尋ねてください。」のような、口頭で説明されるいくつかの単純な数学的問題を解決できませんでした。 ?" 言語モデルの場合、正しい答えを出すのは少し「難しい」かもしれません。
「コンピューターが数学に非常に優れていると言うとき、それは特定の特定の事柄に非常に優れているという意味です」と、Google の機械学習専門家であるガイ・ガー・アリ氏は述べています。コンピュータが算術演算に優れているのは事実ですが、特定のモード以外ではコンピュータは無力であり、単純なテキスト記述の質問には答えることができません。
Google 研究者のイーサン ダイアーはかつてこう言いました:「数学の研究をする人は、厳格な推論システムを持っています。彼らが知っていることと理解していないことの間には明らかなギャップがあります。」
文章問題や定量的推論の問題を解くのは、他の問題とは異なり、堅牢性と厳密性が必要なため、難しいものです。プロセスのどの段階でも間違えると、間違った答えが得られます。 DALL・E は絵を描くのが得意ですが、生成される画像は時々奇妙で、指が欠けたり、目が奇妙に見えたりします。それは誰もが受け入れることができますが、数学では間違いが発生するため、許容範囲は非常に小さくなります。 OpenAI の機械学習専門家である Vineet Kosaraju 氏も、「言語モデルによって生じる数学的エラー (10 を 10 ではなく 1 と 0 と誤解するなど) に対する私たちの許容度はまだ比較的小さいです。」とこの考えを表明しています。
# 「私たちが数学を勉強するのは、それが独立していて非常に興味深いと思うからです」と OpenAI の機械学習専門家、カール・コッベ氏は言います。機械学習モデルは、より大きなデータ サンプルでトレーニングされると、より堅牢になり、エラーが少なくなります。しかし、モデルのスケールアップは定量的推論によってのみ可能であるようです。研究者らは、言語モデルによって犯された間違いには、より的を絞ったアプローチが必要であると思われることに気づきました。
昨年、カリフォルニア大学バークレー校と OpenAI の 2 つの研究チームが、それぞれデータ セット MATH と GSM8K をリリースしました。これら 2 つのデータ セットには、何千もの幾何学、代数学、初等数学、など数学の問題。 「これがデータセットに問題があるのかどうかを確認したかったのです」と、AI セキュリティセンターの研究者で数学を専門とするスティーブン・バサート氏は言う。言語モデルは文章問題が苦手であることが知られていますが、この問題では言語モデルのパフォーマンスはどの程度悪いのでしょうか? より適切にフォーマットされた大規模なデータ セットを導入することで解決できるのでしょうか?
MATH データセットでは、トップの言語モデルは 7% の精度を達成しました。これに対し、人間の大学院生の精度は 40%、オリンピックチャンピオンの精度は 90% でした。 GSM8K データセット (小学校レベルの問題) では、モデルは 20% の精度を達成しました。実験では、OpenAI は微調整と検証という 2 つの手法を使用し、その結果、モデルが自身のエラーの多くの例を確認できることが示されました。これは貴重な発見です。
当時、GSM8K で 80% の精度を達成するには、OpenAI のモデルを 100 倍のデータでトレーニングする必要がありました。しかし今年6月、Googleは78%の精度を達成したMinervaをリリースした。この結果は予想を上回り、研究者らは予想よりも早い結果が出たと述べた。
Minerva は、Google が自社開発した Pathways Language Model (PaLM) に基づいており、arXiv、LaTeX、その他の数学形式を含む、より多くの数学データ セットを備えています。ミネルヴァが採用するもう 1 つの戦略は、ミネルヴァが大きな問題を小さな部分に分割する、思考の連鎖の促しです。さらに、Minerva は多数決を使用し、モデルに 1 つの答えを見つけるよう求めるのではなく、100 個の答えを見つけるように求めます。これらの答えのうち、ミネルヴァは最も一般的なものを選択します。 これらの新しい戦略から得られる利益は大きく、Minerva は MATH、GSM8K、MMLU (化学や生物学を含むより一般的なアルゴリズムのセット) で最大 50% の精度を達成しました。 STEM 問題の正解率は 80% 近くです。ミネルバに少し調整した問題をやり直すように依頼したところ、同様にうまく機能し、その能力が記憶だけから来ているわけではないことを示しました。 ミネルヴァは、奇妙で混乱を招く推論を持ちながらも、正しい答えを導き出すことができます。ミネルバのようなモデルは人間と同じ答えに到達するかもしれませんが、彼らがたどる実際のプロセスは大きく異なる可能性があります。 Google の機械学習専門家であるイーサン ダイアー氏は、「数学の世界では、何かを知っているか知らないかの間には、厳密な推論システムがあるという考えがあると思います。しかし、人々は一貫性のない答えを出し、間違いを犯し、核となる概念を適用できません。機械学習のフロンティアでは、境界があいまいです。
以上がGoogle と OpenAI の学者が AI について語る: 言語モデルは数学を「征服」するために懸命に取り組んでいるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









vue.jsのオブジェクトに文字列を変換する場合、標準のjson文字列にはjson.parse()が推奨されます。非標準のJSON文字列の場合、文字列は正規表現を使用して処理し、フォーマットまたはデコードされたURLエンコードに従ってメソッドを削減できます。文字列形式に従って適切な方法を選択し、バグを避けるためにセキュリティとエンコードの問題に注意してください。

概要:Vue.js文字列配列をオブジェクト配列に変換するための次の方法があります。基本方法:定期的なフォーマットデータに合わせてマップ関数を使用します。高度なゲームプレイ:正規表現を使用すると、複雑な形式を処理できますが、慎重に記述して考慮する必要があります。パフォーマンスの最適化:大量のデータを考慮すると、非同期操作または効率的なデータ処理ライブラリを使用できます。ベストプラクティス:コードスタイルをクリアし、意味のある変数名とコメントを使用して、コードを簡潔に保ちます。

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

VueとElement-UIカスケードドロップダウンボックスv-Modelバインディング共通ピットポイント:V-Modelは、文字列ではなく、カスケード選択ボックスの各レベルで選択した値を表す配列をバインドします。 SelectedOptionsの初期値は、nullまたは未定義ではなく、空の配列でなければなりません。データの動的読み込みには、非同期でデータの更新を処理するために非同期プログラミングスキルを使用する必要があります。膨大なデータセットの場合、仮想スクロールや怠zyな読み込みなどのパフォーマンス最適化手法を考慮する必要があります。

Vue axiosのタイムアウトを設定するために、Axiosインスタンスを作成してタイムアウトオプションを指定できます。グローバル設定:Vue.Prototype。$ axios = axios.create({Timeout:5000});単一のリクエストで:this。$ axios.get( '/api/users'、{timeout:10000})。

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。
