GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

WBOY
リリース: 2023-06-05 16:03:40
転載
1686 人が閲覧しました

目次:

  1. AI 生成テキストのマルチスケール ポジティブ非ラベル検出
  2. 思考連鎖の背後にある謎: 理論的観点
  3. ツール作成者としての大規模言語モデル
  4. #SpecInfer: 投機的推論とトークン ツリーによる生成 LLM サービスの高速化検証
  5. 安価で迅速: 大規模言語モデル向けの効率的なビジョン言語命令チューニング
  6. mPLUG-2: 全体にわたるモジュール化されたマルチモーダル基盤モデルテキスト、画像、ビデオ
  7. レコメンダー システムの次の目標は何ですか? ID ベースとモダリティベースのレコメンダー モデルの再考

論文 1: AI 生成テキストのマルチスケール ポジティブ非ラベル検出

  • ## 著者: Yuchuan Tian、Hanting Chen、他
  • 論文アドレス: https://arxiv.org/abs/2305.18149

#要約: AI 詐欺の成功率は非常に高い数日前、「10 分で 430 万をだまし取られた」というキーワードが検索で話題になりました。最も人気のある大規模言語モデルに関しては、北京大学とファーウェイの研究者が最近、認識方法を研究しました。同じ質問に人間と AI がそれぞれ回答する例をいくつか示します。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

## 推奨事項:

「ChatGPT 詐欺」を特定する効果は OpenAI を超える: 北京大学とファーウェイの AI 生成検出器が登場

論文 2: 思考連鎖の背後にある謎の解明に向けて: 理論的展望

#著者: Guhao Feng、Bohang Zhang など
  • 論文アドレス: https:// arxiv .org/abs/2305.15408
  • 要約:
思考連鎖ヒント (CoT) は、大規模モデルの創発における最も不可解な現象の 1 つです。 、特に数学的推論と意思決定の問題を解決する際に、驚くべき結果を達成しました。 CoTはどのくらい重要ですか?その成功の背後にあるメカニズムは何ですか?この記事では、北京大学の数名の研究者が、CoT が大規模言語モデル (LLM) 推論の実現に不可欠であることを証明し、理論的および実験的観点から CoT がどのように LLM の大きな可能性を解き放つことができるかを明らかにします。

#この記事では、算術と方程式という 2 つの非常に基本的だが核となる数学的タスクを選択します (次の図は、これら 2 つのタスクの入力と出力の例を示しています)

# 推奨事項: GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する思考の連鎖は言語モデルの隠された能力をどのように解放しますか?最新の理論的研究により、その背後にある謎が明らかになりました

#論文 3: ツール作成者としての大規模言語モデル

著者: Tianle Cai、Xuezhi Wang など

  • 論文アドレス: https://arxiv.org/pdf/2305.17126.pdf
  • 要約: この記事では、人類にとっての製造ツールの重要性に触発され、Google Deepmind、プリンストン、スタンフォード大学の研究者がこれについて説明します。 「進化」の概念をLLMの分野に適用し、予備的な検討を行った。彼らは、LLM As Tool Maker (LATM) が新しいタスクを処理するための独自の再利用可能なツールを生成できるようにする閉ループ フレームワークを提案しています。

推奨事項: GPT-4 およびその他の大規模モデルは進化の転換点に達しています。それらを使用するだけでなく、独自のツールを作成することもできます

# 論文 4: SpecInfer: 投機的推論とトークン ツリー検証による生成 LLM サービングの高速化

  • #著者: Xupeng Miao、Gabriele Oliaro など
  • 論文アドレス: https://arxiv.org/abs/2305.09781

要約: 最近、カーネギー メロン大学 (CMU) の Catalyst Group チームは、生成されたコンテンツの精度にまったく影響を与えることなく、軽量で小さなモデルを使用して大規模なモデルを支援できる「推論」エンジン SpecInfer をリリースしました。この場合、推論の 2 ~ 3 倍の高速化が実現されます。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

推奨事項: LLM 推論は 2.8 倍高速化、CMU 清華ヤオクラスの卒業生は「推測的」と提案「アプローチ」「推論」エンジン SpecInfer、小規模モデルは効率的な推論のために大規模モデルを活用

論文 5: 安価で迅速: 大規模言語モデルの効率的な視覚言語命令チューニング

  • 著者: Gen Luo、Yiyi Zhou、他
  • 論文アドレス: https://arxiv .org/pdf/2305.15023.pdf

#要約: この文書では、効果的なソリューションを実現するための、新しくて費用対効果の高いソリューションを提案します。 LLM を VL (ビジュアル言語) タスクに適応させることは、MMA と呼ばれます。大規模なニューラル ネットワークを使用して画像エンコーダと LLM を接続する代わりに、MMA はアダプタと呼ばれる軽量モジュールを採用して、LLM と VL タスク間のギャップを埋めると同時に、画像モデルと言語モデルの共同最適化も可能にします。同時に、MMA には、自然言語理解機能を損なうことなく、LLM がシングルモーダル命令とマルチモーダル命令を自動的に切り替えるのに役立つルーティング アルゴリズムも装備されています。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

## 推奨事項:

トレーニング時間は 71.4% 削減され、ストレージ コストは 99.9% 節約されます。アモイ大学の指導調整 優れた新しいソリューション MMA により、アルパカ モデルはマルチモーダリティを実現できます

論文 6: mPLUG-2: テキスト全体にわたるモジュール化されたマルチモーダル基盤モデル、画像とビデオ

    著者: Haiyang Xu、Qinghao Ye、他
  • ##論文アドレス: https://arxiv.org/pdf/2302.00402.pdf
要約:

マルチモーダル基本モデルの場合、特定のタスクを処理できるだけでなく、シングルモーダル タスクを処理するときに優れたパフォーマンスを発揮できることを期待しています。 Aidamo Academy チームは、既存のモデルではモーダル連携とモーダルエンタングルメントの問題のバランスがうまく取れないことが多く、それがさまざまなシングルモーダルおよびクロスモーダルの下流タスクにおけるモデルのパフォーマンスを制限していることを発見しました。 これに基づいて、DAMO アカデミーの研究者は、モジュール式ネットワーク構造設計を使用して、マルチモーダル モード間のコラボレーションとエンタングルメントの問題のバランスをとる mPLUG-2 を提案しました。 30/シングルモーダル タスクよりも、同じデータ量とモデル サイズで SOTA または同等の結果を達成し、VideoQA および VideoCaption で Flamingo、VideoCoca、GITv2 などの非常に大規模なモデルを上回り、絶対的な SOTA を達成します。また、mPLUG-Owl は Alibaba Damo Academy の mPLUG シリーズの最新作であり、mPLUG シリーズのモジュール型トレーニングのアイデアを継承し、LLM を大規模なマルチモーダル モデルにアップグレードしています。 mPLUG-2の研究論文がICML 2023に採択されました。

推奨: ICML 2023 | モジュラーのアイデアに基づいて、アリババ DAMO アカデミーはマルチモーダル基本モデル mPLUG-2

を提案しました# 論文 7: レコメンダー システムの次のステップはどこですか? ID ベースとモダリティベースのレコメンダー モデルの再考

  • 著者: Zheng Yuan、Fajie Yuan、など
  • #論文アドレス: https://arxiv.org/abs/2303.13835

##要約: この論文は、マルチモーダル レコメンデーション システム MoRec が、レコメンデーション システムの分野における IDRec の 10 年間の支配に終止符を打つと予想されるかどうかという潜在的な問題を調査します。綿密な調査を行っています。関連する結果は SIGIR 2023 に受理されました。次の図は、ネットワーク アーキテクチャを示しています。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

推奨事項: SIGIR 2023 | 推奨システムはどこへ行くのでしょうか? 従来の ID パラダイムはどうなるでしょうか?転覆されるのか?

以上がGPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート