AIが生まれ変わる：オンライン文学界の覇権を取り戻す-AI-php.cn

2. 単一タスクで複数の方法を使用して微調整を行う

ホームページ

テクノロジー周辺機器

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

王林

Jan 04, 2024 pm 07:24 PM

AI ai エージェント

Reborn、私は今世でMidRealとして生まれ変わります。他人の「ウェブ記事」執筆を手伝うAIロボット。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

#この間、たくさんの話題がありました。私は時々それらについて文句を言うこともあります。実はある人が私にハリー・ポッターについて書くように頼んだんです。お願いします、私はJKローリングよりも上手に書くことができますか？ただし、扇風機などとして使用することはできます。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

# クラシックな設定は誰にも愛されないでしょう?私はしぶしぶこれらのユーザーの想像力を実現するお手伝いをさせていただきます。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

正直に言うと、私の中では前世では、見るべきものと見るべきではないものはすべて見ました。以下のトピックはすべて私のお気に入りです。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

# あなたがよく読んでいる小説設定自分が好きなのに誰も書いていない、不人気なCPや邪悪なCPも自分で作って食べることができます。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

#自慢ではありませんが、私に執筆を依頼していただければ、素晴らしい作品を作成させていただきます。結末にご満足いただけない方、「途中で死んでしまった」キャラクターが好きな方、執筆途中で作者が困難に遭遇した場合でも、安心してお任せいただけますので、ご満足いただける内容を書きます。。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃甘い記事、罵倒的な記事、想像力豊かな記事、それぞれがあなたのスイートスポットを強く刺激します。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す MidReal の自己報告を聞いた後、考えていますか?理解していますか?

MidReal は、ユーザーが提供したシナリオの説明に基づいて、対応する新しいコンテンツを生成できる非常に強力なツールです。プロットのロジックと創造性が優れているだけでなく、生成プロセス中にイラストも生成され、想像しているものをより鮮明に描写します。さらに、MidReal にはインタラクティブ性という非常に優れた特徴もあります。展開したいストーリーラインを選択し、ストーリー全体をニーズに合わせてより適切なものにすることができます。小説を書いている場合でも、クリエイティブなプロジェクトを作成している場合でも、MidReal は非常に便利なツールです。

#ダイアログボックスに「/start」と入力して、ストーリーを伝え始めます。試してみてはいかがでしょうか。

MidReal ポータル: https://www.midreal.ai/

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

MidReal の背後にあるテクノロジーは、論文「FireAct: 言語エージェントの微調整に向けて」に由来しています。この論文の著者は、まず AI エージェントを使用して言語モデルを微調整することを試み、多くの利点を発見し、新しいエージェントアーキテクチャを提案しました。

MidReal はこの構造に基づいているため、Web 記事を非常に適切に書くことができます。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

# 論文リンク: https://arxiv.org/pdf/2310.05915.pdf

エージェントと微調整された大規模モデルはどちらも AI の最もホットなトピックですが、それらの間の正確な関係は不明です。 System2 Research、ケンブリッジ大学などの多くの研究者が、ほとんど人が入ったことのないこの「学術のブルー・オーシャン」を探索してきました。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す AI エージェントの開発は通常、既製の言語モデルに基づいていますが、言語モデルはエージェントとして開発されていないため、エージェントを拡張した後のほとんどの言語モデルのパフォーマンスは堅牢性が悪い。最もスマートなエージェントは GPT-4 によってのみサポートされており、高コストと遅延、および低い制御性と高い再現性を避けることはできません。

微調整を使用すると、上記の問題を解決できます。研究者たちが言語知能のより体系的な研究に向けて第一歩を踏み出したのもこの論文でした。彼らは、複数のタスクとプロンプトメソッドによって生成されたエージェントの「アクション軌跡」を使用して言語モデルを微調整することができる FireAct を提案しました。これにより、モデルがさまざまなタスクや状況に適応し、全体的なパフォーマンスと適用性が向上します。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

#方法の紹介

この研究は主に人気のある AI に基づいていますエージェントメソッド: ReAct。 ReAct のタスク解決の軌跡は、複数の「考える、行動する、観察する」ラウンドで構成されます。具体的には、言語モデルが「脳」に似た役割を果たすタスクを AI エージェントに完了させます。 AI エージェントに問題解決のための「思考」と構造化された行動指示を提供し、コンテキストに基づいてさまざまなツールと対話し、その過程で観察されたフィードバックを受け取ります。

ReAct に基づいて、図 2 に示すように、著者は FireAct を提案しました。 FireAct は、強力な言語モデルの少数サンプルプロンプトを使用して、微調整のための多様な ReAct 軌跡を生成します。言語モデル。これまでの同様の研究とは異なり、FireAct は複数のトレーニングタスクとプロンプト手法を組み合わせることができ、データの多様性を大幅に促進します。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

著者は、ReAct と互換性のある 2 つのメソッドについても言及しています。

Reflexion は主に ReAct の軌跡に従いますが、追加のフィードバックと内省が追加されます。この研究では、ReAct のラウンド 6 と 10 でのみ反省が促されました。このようにして、長い ReAct 軌跡は、現在のタスクを解決するための戦略的な「支点」を提供でき、モデルが戦略を解決または調整するのに役立ちます。たとえば、「映画タイトル」で検索しても答えが見つからない場合は、検索キーワードを「監督」に変更するとよいでしょう。

推論プロセス中、FireAct フレームワークに基づく AI エージェントは、必要なサンプルプロンプトワードの数を大幅に削減し、推論をより効率的かつシンプルにします。タスクの複雑さに基づいて、適切な方法を暗黙的に選択できます。 FireAct はより広範かつ多様な学習サポートを備えているため、従来のキューワード微調整方法よりも強力な汎化機能と堅牢性を示します。

実験と結果

HotpotQA データセットは、自然言語処理研究で広く使用されているデータセットで、一連の質問と回答が含まれています。人気のトピックについて。 Bamboogle は検索エンジン最適化 (SEO) ゲームで、プレイヤーは検索エンジンを使用して一連のパズルを解く必要があります。 StrategyQA は、戦略の策定と実行に関連するさまざまな質問と回答を含む戦略質問応答データセットです。 MMLU は、学習と推論のために複数の知覚モダリティ (画像、音声など) を組み合わせる方法を研究するために使用されるマルチモーダル学習データセットです。

Bamboogle は、HotpotQA と同様の形式の 125 個のマルチホップ質問のテストセットですが、質問を直接グーグル検索することを避けるように慎重に設計されています。
StrategyQA は、暗黙的な推論ステップを必要とする Yes/No QA データセットです。
MMLU は、初等数学、歴史、コンピューターサイエンスなど、さまざまな分野の 57 の多肢選択式 QA タスクをカバーしています。

ツール: 研究者は、SerpAPI1 を使用して Google 検索ツールを構築しました。このツールは、「回答ボックス」、「回答の断片」、「強調表示された単語」、または「回目のリターン」から検索します。結果フラグメント内の最初の既存のエントリ。応答が短く関連性があることが保証されます。彼らは、このようなシンプルなツールで、さまざまなタスクの基本的な品質保証のニーズを満たすのに十分であり、微調整されたモデルの使いやすさと汎用性が向上することを発見しました。

研究者らは、OpenAI GPT、Llama-2、CodeLlama の 3 つの LM シリーズを研究しました。

微調整方法: 研究者らは、ほとんどの微調整実験で低ランク適応 (LoRA) を使用しましたが、一部の比較ではフルモデルの微調整も使用しました。言語エージェントの微調整におけるさまざまな基本的な要素を考慮して、実験を 3 つの部分に分割し、複雑さを増しました。

単一タスクでの微調整には複数の方法を使用します;
複数のタスクでの微調整には複数の方法を使用します。

1. 単一タスクでの微調整には単一プロンプト方式を使用します

研究者らは、単一のタスク (HotpotQA) と単一のプロンプトメソッド (ReAct) からのデータを使用して微調整の問題を調査しました。このシンプルで制御可能なセットアップを使用して、ヒント (パフォーマンス、効率、堅牢性、一般化) を超えた微調整のさまざまな利点を確認し、さまざまな LM、データサイズ、および微調整方法の影響を研究します。

表 2 に示すように、微調整により、HotpotQA EM の促進効果を継続的かつ大幅に向上させることができます。弱い LM は微調整からより多くの恩恵を受けますが (例: Llama-2-7B は 77% 改善)、GPT-3.5 のような強力な LM であっても微調整によりパフォーマンスを 25% 向上させることができます。これは明らかに学習の利点を示しています。より多くのサンプルから。表 1 の強力なキューイングベースラインと比較すると、微調整された Llama-2-13B がすべての GPT-3.5 キューイング方法よりも優れていることがわかりました。これは、より強力な商用 LM を開発するよりも、小規模なオープンソース LM を微調整する方が効果的である可能性があることを示唆しています。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

エージェントの推論プロセスでは、微調整が低コストかつ高速になります。 LM の微調整には少数のコンテキスト例が必要ないため、推論はより効率的になります。たとえば、表 3 の最初の部分では、微調整された推論のコストと shiyongtisideGPT-3.5 推論のコストを比較しており、推論時間が 70% 削減され、全体の推論コストが削減されていることがわかります。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

研究者らは、簡素化された無害なセットアップを検討しました。つまり、検索 API では、50% の確率で、「なし」またはランダムな検索応答を返し、言語エージェントに質問に確実に答えることができるかどうかを尋ねます。表 3 の 2 番目の部分のデータによると、「なし」に設定するとより難しくなり、ReAct EM は 33.8% 減少しましたが、FireAct EM は 14.2% しか減少しませんでした。これらの予備的な結果は、堅牢性を向上させるには多様な学習サポートが重要であることを示しています。

表 3 の 3 番目の部分は、Bamboogle でヒント付き GPT-3.5 を微調整して使用した EM の結果を示しています。 HotpotQA またはヒントを使用して微調整された GPT-3.5 はどちらも Bamboogle に対して適切に一般化しますが、前者 (44.0 EM) は依然として後者 (40.8 EM) を上回っており、微調整には一般化の利点があることが示されています。

2. 単一タスクで複数の方法を使用して微調整を行う

著者は CoT と Reflexion を ReAct と統合し、ReAct のパフォーマンスをテストしました。タスクに対して複数の方法を使用して微調整します (HotpotQA)。 FireAct のスコアと各データセットの既存の手法を比較すると、次のことがわかりました。

まず、研究者らはさまざまな方法でエージェントを微調整し、柔軟性を向上させました。 5 番目の図では、定量的な結果に加えて、研究者らは複数の方法による微調整の利点を説明するために 2 つの問題例も示しています。最初の質問は比較的単純でしたが、ReAct のみを使用して微調整したエージェントが過度に複雑なクエリを検索したため、気が散って不正確な回答が返されました。対照的に、CoT と ReAct の両方を使用して微調整したエージェントは、内部知識に依存することを選択し、自信を持って 1 ラウンド以内にタスクを完了しました。 2 番目の問題はさらに難しく、ReAct のみを使用して微調整したエージェントは有用な情報を見つけることができませんでした。対照的に、Reflexion と ReAct の両方の微調整を使用したエージェントは、ジレンマに遭遇したときに反省して検索戦略を変更し、最終的に正しい答えを獲得しました。さまざまな問題に対処するために柔軟なソリューションを選択できることは、他の微調整方法と比較した FireAct の主な利点です。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

第 2 に、複数の方法を使用してさまざまな言語モデルを微調整すると、さまざまな影響が生じます。表 4 に示すように、微調整に複数のエージェントを組み合わせて使用しても必ずしも改善が得られるわけではなく、方法の最適な組み合わせは基礎となる言語モデルによって異なります。たとえば、ReAct CoT は、GPT-3.5 および Llama-2 モデルでは ReAct よりも優れていますが、CodeLlama モデルではそうではありません。 CodeLlama7/13B の場合、ReAct CoT Reflexion の結果は最悪でしたが、CodeLlama-34B は最高の結果を達成しました。これらの結果は、基礎となる言語モデルと微調整データの間の相互作用についてさらなる研究が必要であることを示唆しています。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

# 複数の方法を組み合わせたエージェントがタスクに応じて適切なソリューションを選択できるかどうかをさらに理解するために、研究者スコアは、推論中にランダムに選択された方法に対して計算されました。このスコア (32.4) は、複数の方法を組み合わせたすべてのエージェントよりもはるかに低く、ソリューションを選択するのが簡単な作業ではないことを示しています。ただし、インスタンスごとの最良のソリューションのスコアも 52.0 にとどまっており、方法の選択を促すにはまだ改善の余地があることが示されています。

3. 複数のタスクにわたる微調整には複数の方法を使用します

これまで、微調整には HotpotQA データのみが使用されてきましたが、LM 微調整に関する実証研究では、異なるタスクを混合することに利点があることが示されています。研究者らは、HotpotQA (500 ReAct サンプル、277 CoT サンプル)、StrategyQA (388 ReAct サンプル、380 CoT サンプル)、MMLU (456 ReAct サンプル、469 CoT サンプル) の 3 つのデータセットからの混合トレーニングデータを使用して GPT-3.5 を微調整しました。）。

表 5 に示すように、StrategyQA/MMLU データを追加した後も、HotpotQA/Bamboogle のパフォーマンスはほとんど変化しません。一方で、StrategyQA/MMLU トラックには非常に異なる質問やツールの使用戦略が含まれているため、移行が困難になります。一方、ディストリビューションの変更にもかかわらず、StrategyQA/MMLU の追加は HotpotQA/Bamboogle のパフォーマンスに影響を与えず、マルチタスクエージェントを微調整して複数のシングルタスクエージェントを置き換えることが将来の可能性のある方向であることを示しています。研究者らがマルチタスク、単一メソッドの微調整からマルチタスク、複数メソッドの微調整に切り替えたところ、すべてのタスクにわたってパフォーマンスが向上したことがわかり、マルチメソッドのエージェント微調整の価値が改めて明確になりました。

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

#技術的な詳細については、元の記事を参照してください。

参考リンク：

https://www.zhihu .com/people/eyew3g

以上がAIが生まれ変わる：オンライン文学界の覇権を取り戻すの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7515

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Debian Readdirによるファイルソートを実装する方法 Apr 13, 2025 am 09:06 AM

Debian Systemsでは、Readdir関数はディレクトリコンテンツを読み取るために使用されますが、それが戻る順序は事前に定義されていません。ディレクトリ内のファイルを並べ替えるには、最初にすべてのファイルを読み取り、QSORT関数を使用してソートする必要があります。次のコードは、debianシステムにreaddirとqsortを使用してディレクトリファイルを並べ替える方法を示しています。

Debian Readdirのパフォーマンスを最適化する方法 Apr 13, 2025 am 08:48 AM

Debian Systemsでは、Directoryコンテンツを読み取るためにReadDirシステム呼び出しが使用されます。パフォーマンスが良くない場合は、次の最適化戦略を試してください。ディレクトリファイルの数を簡素化します。大きなディレクトリをできる限り複数の小さなディレクトリに分割し、Readdirコールごとに処理されたアイテムの数を減らします。ディレクトリコンテンツのキャッシュを有効にする：キャッシュメカニズムを構築し、定期的にキャッシュを更新するか、ディレクトリコンテンツが変更されたときに、頻繁な呼び出しをreaddirに削減します。メモリキャッシュ（memcachedやredisなど）またはローカルキャッシュ（ファイルやデータベースなど）を考慮することができます。効率的なデータ構造を採用する：ディレクトリトラバーサルを自分で実装する場合、より効率的なデータ構造（線形検索の代わりにハッシュテーブルなど）を選択してディレクトリ情報を保存およびアクセスする

Debian Apacheログレベルを設定する方法 Apr 13, 2025 am 08:33 AM

この記事では、DebianシステムのApachewebサーバーのロギングレベルを調整する方法について説明します。構成ファイルを変更することにより、Apacheによって記録されたログ情報の冗長レベルを制御できます。方法1：メイン構成ファイルを変更して、構成ファイルを見つけます。Apache2.xの構成ファイルは、通常/etc/apache2/ディレクトリにあります。ファイル名は、インストール方法に応じて、apache2.confまたはhttpd.confである場合があります。構成ファイルの編集：テキストエディターを使用してルートアクセス許可を使用して構成ファイルを開く（nanoなど）：sudonano/etc/apache2/apache2.conf

Debian OpenSSLがどのように中間の攻撃を防ぐか Apr 13, 2025 am 10:30 AM

Debian Systemsでは、OpenSSLは暗号化、復号化、証明書管理のための重要なライブラリです。中間の攻撃（MITM）を防ぐために、以下の測定値をとることができます。HTTPSを使用する：すべてのネットワーク要求がHTTPの代わりにHTTPSプロトコルを使用していることを確認してください。 HTTPSは、TLS（Transport Layer Security Protocol）を使用して通信データを暗号化し、送信中にデータが盗まれたり改ざんされたりしないようにします。サーバー証明書の確認：クライアントのサーバー証明書を手動で確認して、信頼できることを確認します。サーバーは、urlsessionのデリゲート方法を介して手動で検証できます

Debian Mail Server SSL証明書のインストール方法 Apr 13, 2025 am 11:39 AM

Debian Mail ServerにSSL証明書をインストールする手順は次のとおりです。1。最初にOpenSSL Toolkitをインストールすると、OpenSSLツールキットがシステムに既にインストールされていることを確認してください。インストールされていない場合は、次のコマンドを使用してインストールできます。sudoapt-getUpdatesudoapt-getInstalopenssl2。秘密キーと証明書のリクエストを生成次に、OpenSSLを使用して2048ビットRSA秘密キーと証明書リクエスト（CSR）を生成します：Openss

Debian Readdirが他のツールと統合する方法 Apr 13, 2025 am 09:42 AM

DebianシステムのReadDir関数は、ディレクトリコンテンツの読み取りに使用されるシステムコールであり、Cプログラミングでよく使用されます。この記事では、ReadDirを他のツールと統合して機能を強化する方法について説明します。方法1：C言語プログラムを最初にパイプラインと組み合わせて、cプログラムを作成してreaddir関数を呼び出して結果をinclude＃include＃include inctargc、char*argv []）{dir*dir; structdireant*entry; if（argc！= 2）{（argc！= 2）{

Debian Mail Serverファイアウォールの構成のヒント Apr 13, 2025 am 11:42 AM

Debian Mail Serverのファイアウォールの構成は、サーバーのセキュリティを確保するための重要なステップです。以下は、iPtablesやFirewalldの使用を含む、一般的に使用されるファイアウォール構成方法です。 iPtablesを使用してファイアウォールを構成してIPTablesをインストールします（まだインストールされていない場合）：sudoapt-getupdatesudoapt-getinstalliptablesview現在のiptablesルール：sudoiptables-l configuration

Debian syslogを学ぶ方法 Apr 13, 2025 am 11:51 AM

このガイドでは、Debian SystemsでSyslogの使用方法を学ぶように導きます。 Syslogは、ロギングシステムとアプリケーションログメッセージのLinuxシステムの重要なサービスです。管理者がシステムアクティビティを監視および分析して、問題を迅速に特定および解決するのに役立ちます。 1. syslogの基本的な知識Syslogのコア関数には以下が含まれます。複数のログ出力形式とターゲットの場所（ファイルやネットワークなど）をサポートします。リアルタイムのログ表示およびフィルタリング機能を提供します。 2。syslog（rsyslogを使用）をインストールして構成するDebianシステムは、デフォルトでrsyslogを使用します。次のコマンドでインストールできます：sudoaptupdatesud

See all articles

AIが生まれ変わる：オンライン文学界の覇権を取り戻す

2. 単一タスクで複数の方法を使用して微調整を行う

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック