InstructGPT 論文の重要な技術ポイントを素早く学びましょう: Li Mu に従って ChatGPT の背後にあるテクノロジーをマスターしてください
ChatGPT が普及してから、テクノロジーに注目する多くの学生が「ChatGPT の背後にある原理を体系的に理解できる学習教材はありますか?」という質問をしています。 OpenAI が ChatGPT に関連する論文をリリースしていないため、この問題は厄介になります。
ただし、ChatGPT に関する OpenAI のブログから、ChatGPT で使用されるメソッドは、 InstructGPT が GPT-3 で微調整されていることを除いて、その兄弟モデルである InstructGPT と同じであることがわかります。 ChatGPT は GPT-3.5 に基づいています。データ収集の点でも、両者にはいくつかの違いがあります。
# ブログリンク: https://openai.com/blog/chatgpt/
InstructGPT の論文は 2022 年 3 月にリリースされましたが、OpenAI は早くも 1 月に関連ブログを公開しました (「GPT-3 ナンセンスをどうするか? OpenAI: 再トレーニングした」を参照)新しいバージョンはより「従順」です)。その際、OpenAI は、InstructGPT が GPT-3 を微調整するためにヒューマン フィードバックの強化学習法 (RLHF) を使用し、モデルの出力を人間の好みとより一致させることを明確に述べましたが、これは ChatGPT のトレーニングでも継続されています。
# 論文リンク: https://arxiv.org/pdf/2203.02155.pdf
さらに、InstructGPT と ChatGPT の間には多くの類似点があります。したがって、InstructGPT の論文を徹底的に理解することは、ChatGPT の方向で何らかの作業を行いたい学生にとって非常に役立ちます。だからこそ、私たちは李牧の講義を強くお勧めします。
コースアドレス: https://jmq.xet.tech/s/2lec6b (「読む」をクリック元のテキスト」に直接アクセスできます)
リー・ムー博士はアマゾンの上級主任科学者です。彼は以前にアストン・チャンと「ハンズオンディープラーニング」を共著しました。その他。過去 2 年間、彼はビデオを通じてさまざまな AI の知識を皆さんに紹介し、数十の論文に関する精読コースを制作してきました。多くの学生は李牧と一緒に論文を集中的に読む習慣を身につけました。
ステーション B の Li Mu 博士のアカウントは「Li Mu から AI を学ぶ」です。
InstructGPT の解釈コースは合計 67 分で、基本的に論文の執筆順に紹介されます。
ChatGPT ブログの技術図。
InstructGPT 論文の技術図。
論文の第 3 章では、InstructGPT の著者が最初にデータ取得方法とプロセスを紹介し、Li Mu も全員にそれを詳しく読んでもらいました。この部分はエンジニアリングにおいて非常に価値があります。 Li Mu 氏が言ったように、これまでにこのようなこと (データのラベル付けなど) を行ったことがなく、データのラベル付けを手伝ってくれる人を探す必要がある場合は、直接使用できる多くのテンプレートが含まれている付録を参照してください。この論文の著者は、注釈付き Web サイトの UI がどのようなものであるかについても説明しており、学ぶ価値があります。次に、Li Mu は、第 3 章で書かれた 3 つのモデル (「3.5 モデル」を参照)、SFT (教師あり微調整) モデル、RM (報酬モデリング) モデル、および RL (強化学習) モデルに焦点を当てました。これらのモデルに関係するパラメーターや目的関数などの詳細。 最後に、Li Mu 氏は、技術的に言えば、InstructGPT は依然として非常に実用的なテクノロジであると結論付けました。これは、大規模な言語モデルが与えられた場合、注釈付きデータを使用して実用的なものにすることで、関心のある分野でそのパフォーマンスを迅速に向上させるにはどうすればよいかという方法を全員に伝えます。したがって、生成モデルを使用して製品を作成したい人に運用上のアイデアを提供します。 もちろん、Li Mu 博士が言ったように、科学研究の作業は段階的に行われ、InstructGPT も以前の研究に基づいているため、ChatGPT を徹底的に理解したい学生は、必然的に戻って読む必要があり、さらに多くの論文が必要になります。以前のコースで、Li Mu は GPT、GPT-2、および GPT-3 の論文も詳細に解釈しました。
## コースアドレス: https://jmq.xet.tech/s/2lec6b
以上がInstructGPT 論文の重要な技術ポイントを素早く学びましょう: Li Mu に従って ChatGPT の背後にあるテクノロジーをマスターしてくださいの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











DALL-E 3は、前モデルより大幅に改良されたモデルとして2023年9月に正式導入されました。これは、複雑な詳細を含む画像を作成できる、これまでで最高の AI 画像ジェネレーターの 1 つと考えられています。ただし、発売当初は対象外でした

StableDiffusion3 の論文がついに登場しました!このモデルは2週間前にリリースされ、Soraと同じDiT(DiffusionTransformer)アーキテクチャを採用しており、リリースされると大きな話題を呼びました。前バージョンと比較して、StableDiffusion3で生成される画像の品質が大幅に向上し、マルチテーマプロンプトに対応したほか、テキスト書き込み効果も向上し、文字化けが発生しなくなりました。 StabilityAI は、StableDiffusion3 はパラメータ サイズが 800M から 8B までの一連のモデルであると指摘しました。このパラメーター範囲は、モデルを多くのポータブル デバイス上で直接実行できることを意味し、AI の使用を大幅に削減します。

インストール手順: 1. ChatGTP ソフトウェアを ChatGTP 公式 Web サイトまたはモバイル ストアからダウンロードします; 2. それを開いた後、設定インターフェイスで言語を中国語を選択します; 3. ゲーム インターフェイスでヒューマン マシン ゲームを選択し、中国スペクトル; 4 . 起動後、チャット ウィンドウにコマンドを入力してソフトウェアを操作します。

ChatGPT と Python の完璧な組み合わせ: インテリジェント カスタマー サービス チャットボットの作成 はじめに: 今日の情報化時代において、インテリジェント カスタマー サービス システムは企業と顧客の間の重要なコミュニケーション ツールとなっています。より良い顧客サービス体験を提供するために、多くの企業が顧客相談や質問応答などのタスクを完了するためにチャットボットに注目し始めています。この記事では、OpenAI の強力なモデル ChatGPT と Python 言語を使用して、インテリジェントな顧客サービス チャットボットを作成し、顧客サービスを向上させる方法を紹介します。

この記事では、ChatGPT と Java を使用してインテリジェントなチャットボットを開発する方法を紹介し、いくつかの具体的なコード例を示します。 ChatGPT は、OpenAI によって開発された生成事前トレーニング トランスフォーマーの最新バージョンです。これは、自然言語を理解し、人間のようなテキストを生成できるニューラル ネットワーク ベースの人工知能テクノロジーです。 ChatGPT を使用すると、適応型チャットを簡単に作成できます

Neural Radiance Fieldsは2020年に提案されて以来、関連論文の数が飛躍的に増加し、3次元再構成の重要な分野となっただけでなく、自動運転の重要なツールとして研究の最前線でも徐々に活発になってきています。 NeRF は、過去 2 年間で突然出現しました。その主な理由は、特徴点の抽出とマッチング、エピポーラ幾何学と三角形分割、PnP とバンドル調整、および従来の CV 再構成パイプラインのその他のステップをスキップし、メッシュ再構成、マッピング、ライト トレースさえもスキップするためです。 、2D から直接入力画像を使用して放射線野を学習し、実際の写真に近いレンダリング画像が放射線野から出力されます。言い換えれば、ニューラル ネットワークに基づく暗黙的な 3 次元モデルを指定されたパースペクティブに適合させます。

2017 年に初めて開催されて以来、CoRL はロボット工学と機械学習の交差点における世界トップクラスの学術会議の 1 つになりました。 CoRL は、理論と応用を含むロボット工学、機械学習、制御などの複数のトピックをカバーするロボット学習研究のための単一テーマのカンファレンスであり、2023 年 CoRL カンファレンスは 11 月 6 日から 9 日まで米国アトランタで開催されます。公式データによると、今年は25か国から199本の論文がCoRLに選ばれた。人気のあるトピックには、演算、強化学習などが含まれます。 CoRLはAAAIやCVPRといった大規模なAI学会に比べて規模は小さいものの、今年は大型モデル、身体化知能、ヒューマノイドロボットなどの概念の人気が高まる中、関連研究も注目されるだろう。

ChatGPTPHP を使用してインテリジェントな顧客サービス ロボットを構築する方法 はじめに: 人工知能技術の発展に伴い、顧客サービスの分野でロボットの使用が増えています。 ChatGPTPHP を使用してインテリジェントな顧客サービス ロボットを構築すると、企業はより効率的でパーソナライズされた顧客サービスを提供できるようになります。この記事では、ChatGPTPHP を使用してインテリジェントな顧客サービス ロボットを構築する方法を紹介し、具体的なコード例を示します。 1. ChatGPTPHP をインストールし、ChatGPTPHP を使用してインテリジェントな顧客サービス ロボットを構築します。
