ホームページ テクノロジー周辺機器 AI Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

Sep 19, 2023 pm 08:33 PM
gpt-4 プロジェクト

自動要約技術は、主にパラダイムシフトにより、近年大幅に進歩しました。以前は、このテクノロジーは主に注釈付きデータセットの教師あり微調整に依存していましたが、現在は GPT-4 などのゼロショット プロンプトに大規模言語モデル (LLM) を使用しています。プロンプトを注意深く設定することで、追加のトレーニングなしで要約の長さ、テーマ、スタイル、その他の機能を細かく制御できます。

しかし、見落とされがちな側面が 1 つあります。それは、要約の情報密度です。理論的には、別のテキストを圧縮した要約は、ソース ファイルよりも密度が高く、つまりより多くの情報が含まれている必要があります。 LLM デコードの待ち時間が長いことを考慮すると、特にリアルタイム アプリケーションの場合は、より少ないワードでより多くの情報をカバーすることが重要です。

しかし、情報密度については未解決の問題であり、要約に詳細が不十分であれば情報がないのと同じであり、全体の長さを増やさずに情報が多すぎると理解が困難になります。固定されたトークン バジェット内でより多くの情報を伝達するには、抽象化、圧縮、融合を組み合わせる必要があります。

最近の研究では、Salesforce や MIT などの研究者が、GPT-4 によって生成された一連の概要に対する人間の好みを求めることで、密度の増加の限界を判断しようと試みています。この方法は、GPT-4

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

などの大規模な言語モデルの「表現能力」を向上させるための多くのインスピレーションを提供します。論文リンク: https://arxiv.org/pdf /2309.04269 .pdf

データセットのアドレス: https://huggingface.co/datasets/griffin/chain_of_density

具体的には、研究者は代表者の密度としてトークンごとのエンティティの平均数を使用しました。エンティティが希薄な最初の概要を生成します。次に、全長 (全長の 5 倍) を増やすことなく、前の概要から欠落していた 1 ~ 3 個のエンティティを繰り返し特定して融合します。各ダイジェストは、前のダイジェストよりもエンティティとトークンの比率が高くなります。人間の好みのデータに基づいて、著者らは最終的に、人間は人間が書いた要約とほぼ同じ密度で、通常の GPT-4 プロンプトによって生成される要約よりも密度の高い要約を好むと判断しました。 :

    CNN/マニュアルのサマリーのエンティティ密度を向上させるために、プロンプトベースの反復手法 (CoD) を開発する必要があります。情報量 (より多くのエンティティを優先) と明瞭さ (より少ないエンティティを優先) の間のトレードオフをよりよく理解するための、Daily Mail 記事の概要の密度の自動評価
  • オープンソース GPT-4要約、注釈、および評価または改良用の 5000 個の注釈なし CoD 要約のセット。
  • CoD とはどういう意味ですか?

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します著者は、最初の概要を生成し、エンティティ密度を継続的に増加させる単一チェーン オブ デンシティ (CoD) プロンプトを作成しました。具体的には、一定数の対話内で、ソース テキスト内の顕著なエンティティの固有のセットが識別され、長さを増やすことなく前の概要にマージされます。

プロンプトと出力の例を図 2 に示します。著者はエンティティのタイプを明示的に指定していませんが、欠落しているエンティティを次のように定義しています:

本編との関連:

    具体的:簡潔な要約 (5 単語以下);
  • ユニーク: 以前の要約には記載されていません;
  • 忠実: 記事内にあります;
  • どこでも: 記事内の任意の場所にあります。
  • 著者は、CNN/DailyMail 要約テスト セットからランダムに 100 個の記事を選択し、CoD 要約を生成しました。参照しやすいように、彼らは CoD の要約統計を、人が書いた箇条書きの参照要約と、「記事の非常に短い要約を書いてください。70 語以内でください。」という通常のプロンプトの下で GPT-4 によって生成された要約と比較しました。
#統計状況

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

研究では、著者は直接統計データと間接統計データの 2 つの側面から要約しました。直接統計 (トークン、エンティティ、エンティティ密度) は CoD によって直接制御されますが、間接統計は高密度化の予期される副産物です。

直接統計。表 1 に示すように、2 番目のステップでは、最初の長い要約から不要な単語が削除されたため、平均 5 トークンの長さが短縮されました (72 から 67 へ)。エンティティ密度は 0.089 で始まり、最初はヒトおよびバニラ GPT-4 (0.151 および 0.122) よりも低く、5 段階の高密度化の後、最終的には 0.167 まで上昇します。 Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します間接的な統計。追加のエンティティごとにスペースを確保するために要約が繰り返し書き直されるため、CoD の各ステップで抽象化のレベルが増加するはずです。著者らは、抽出密度、つまり抽出されたフラグメントの平均平方長を使用して抽象化を測定しています (Grusky et al., 2018)。同様に、概念融合は、エンティティが固定長の要約に追加されるにつれて単調に増加する必要があります。著者らは統合度を各要約文に並べられた原文の平均数で表現した。位置合わせには、著者らは相対 ROUGE ゲイン法 (Zhou et al., 2018) を使用します。この方法では、追加の文の相対 ROUGE ゲインが正でなくなるまで、ソース文とターゲット文を位置合わせします。また、コンテンツの配布や、要約コンテンツの記事内での位置の変更も予想されていました。

具体的には、著者らは、CoD アブストラクトが最初は強い「リードバイアス」を示すが、その後、記事の中間と最後から徐々にエンティティを紹介し始めると予想していました。これを測定するために、彼らはフュージョンのアライメントを使用して、元の文を表示せずにコンテンツを中国語で書き直し、すべてのアライメントされたソース文の平均文ランクを測定しました。

図 3 はこれらの仮説を裏付けています。書き換えステップの数が増加するにつれて、抽象化が増加し (左の画像は抽出密度が低いことを示します)、融合率も増加し (中央の画像が示します)、抽象化が始まります。記事の途中と末尾のコンテンツが含まれます (右側を参照)。興味深いことに、CoD のすべての要約は、人間が作成した要約やベースラインの要約と比較してより抽象的です。

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

コンテンツを書き直す場合は、元の中国語で書き直す必要があります。文は表示する必要はありません

CoD 要約のトレードオフをよりよく理解するために、著者は好みに基づいた人間の研究を実施し、GPT-4 を使用して評価に基づいた評価を実施しました。

人間の好み。具体的には、同じ 100 件の論文 (5 ステップ *100 = 合計 500 件の要約) について、著者は「再作成された」CoD 要約と記事をランダムに論文の最初の 4 人の著者に見せました。各アノテーターは、Stiennon et al. (2020) の「良い要約」の定義に基づいて、自分のお気に入りの要約を提供しました。表 2 は、CoD 段階での各アノテーターの 1 位の投票と、各アノテーターの概要を示しています。全体として、1 位の抄録の 61% (23.0 22.5 15.5) には 3 つ以上の高密度化ステップが含まれていました。好ましい CoD ステップ数の中央値は中央 (3) で、予想ステップ数は 3.06 です。

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

3 番目のステップの平均密度に基づくと、すべての CoD 候補の好ましいエンティティ密度は約 0.15 です。表 1 からわかるように、この密度は人間が書いた要約 (0.151) と一致していますが、通常の GPT-4 プロンプトで書かれた要約 (0.122)

自動測定値よりも大幅に高くなります。人間による評価 (下記) の補足として、著者らは GPT-4 を使用して、情報提供性、品質、一貫性、帰属性、全体性の 5 つの側面に沿って CoD 概要を採点しました (1 ~ 5 ポイント)。表 3 に示すように、密度は情報提供力と相関していますが、スコアはステップ 4 (4.74) でピークに達し、限界まで相関しています。

Salesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供します

各次元の平均スコアから判断すると、CoD の最初と最後のステップのスコアが最も低く、中間の 3 つのステップは近いスコア (4.78、4.77、4.76) です。 )。 ######定性分析。抽象的な一貫性/可読性と有益性の間には明らかなトレードオフがあります。図 4 に 2 つの CoD ステップを示します。1 つのステップの概要はより詳細に改善され、もう 1 つのステップの概要は損なわれています。平均して、中間 CoD 要約はこのバランスを最もよく達成しますが、このトレードオフは今後の作業で正確に定義し、定量化する必要があります。

論文の詳細については、原論文を参照してください。

以上がSalesforce は MIT 研究者と協力して GPT-4 改訂チュートリアルをオープンソース化し、少ない単語でより多くの情報を提供しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス Jul 17, 2024 am 01:56 AM

これも Tusheng のビデオですが、PaintsUndo は別の道を歩んでいます。 ControlNet 作者 LvminZhang が再び生き始めました!今回は絵画の分野を目指します。新しいプロジェクト PaintsUndo は、開始されて間もなく 1.4kstar を獲得しました (まだ異常なほど上昇しています)。プロジェクトアドレス: https://github.com/lllyasviel/Paints-UNDO このプロジェクトを通じて、ユーザーが静止画像を入力すると、PaintsUndo が線画から完成品までのペイントプロセス全体のビデオを自動的に生成するのに役立ちます。 。描画プロセス中の線の変化は驚くべきもので、最終的なビデオ結果は元の画像と非常によく似ています。完成した描画を見てみましょう。

RLHF から DPO、TDPO に至るまで、大規模なモデル アライメント アルゴリズムはすでに「トークンレベル」になっています RLHF から DPO、TDPO に至るまで、大規模なモデル アライメント アルゴリズムはすでに「トークンレベル」になっています Jun 24, 2024 pm 03:04 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 人工知能の開発プロセスにおいて、大規模言語モデル (LLM) の制御とガイダンスは常に中心的な課題の 1 つであり、これらのモデルが両方とも確実に機能することを目指しています。強力かつ安全に人類社会に貢献します。初期の取り組みは人間のフィードバックによる強化学習手法に焦点を当てていました (RL

オープンソース AI ソフトウェア エンジニアのリストのトップに立つ UIUC のエージェントレス ソリューションは、SWE ベンチの実際のプログラミングの問題を簡単に解決します オープンソース AI ソフトウェア エンジニアのリストのトップに立つ UIUC のエージェントレス ソリューションは、SWE ベンチの実際のプログラミングの問題を簡単に解決します Jul 17, 2024 pm 10:02 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この論文の著者は全員、イリノイ大学アーバナ シャンペーン校 (UIUC) の Zhang Lingming 教師のチームのメンバーです。博士課程4年、研究者

OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる Jul 19, 2024 am 01:29 AM

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

公理的トレーニングにより、LLM は因果推論を学習できます。6,700 万個のパラメータ モデルは、1 兆個のパラメータ レベル GPT-4 に匹敵します。 公理的トレーニングにより、LLM は因果推論を学習できます。6,700 万個のパラメータ モデルは、1 兆個のパラメータ レベル GPT-4 に匹敵します。 Jul 17, 2024 am 10:14 AM

LLM に因果連鎖を示すと、LLM は公理を学習します。 AI はすでに数学者や科学者の研究を支援しています。たとえば、有名な数学者のテレンス タオは、GPT などの AI ツールを活用した研究や探索の経験を繰り返し共有しています。 AI がこれらの分野で競争するには、強力で信頼性の高い因果推論能力が不可欠です。この記事で紹介する研究では、小さなグラフでの因果的推移性公理の実証でトレーニングされた Transformer モデルが、大きなグラフでの推移性公理に一般化できることがわかりました。言い換えれば、Transformer が単純な因果推論の実行を学習すると、より複雑な因果推論に使用できる可能性があります。チームが提案した公理的トレーニング フレームワークは、デモンストレーションのみで受動的データに基づいて因果推論を学習するための新しいパラダイムです。

arXiv 論文は「弾幕」として投稿可能、スタンフォード alphaXiv ディスカッション プラットフォームはオンライン、LeCun は気に入っています arXiv 論文は「弾幕」として投稿可能、スタンフォード alphaXiv ディスカッション プラットフォームはオンライン、LeCun は気に入っています Aug 01, 2024 pm 05:18 PM

乾杯!紙面でのディスカッションが言葉だけになると、どんな感じになるでしょうか?最近、スタンフォード大学の学生が、arXiv 論文のオープン ディスカッション フォーラムである alphaXiv を作成しました。このフォーラムでは、arXiv 論文に直接質問やコメントを投稿できます。 Web サイトのリンク: https://alphaxiv.org/ 実際、URL の arXiv を alphaXiv に変更するだけで、alphaXiv フォーラムの対応する論文を直接開くことができます。この Web サイトにアクセスする必要はありません。その中の段落を正確に見つけることができます。論文、文: 右側のディスカッション エリアでは、ユーザーは論文のアイデアや詳細について著者に尋ねる質問を投稿できます。たとえば、次のような論文の内容についてコメントすることもできます。

リーマン予想の大きな進歩!陶哲軒氏はMITとオックスフォードの新しい論文を強く推薦し、37歳のフィールズ賞受賞者も参加した リーマン予想の大きな進歩!陶哲軒氏はMITとオックスフォードの新しい論文を強く推薦し、37歳のフィールズ賞受賞者も参加した Aug 05, 2024 pm 03:32 PM

最近、2000年代の7大問題の一つとして知られるリーマン予想が新たなブレークスルーを達成した。リーマン予想は、数学における非常に重要な未解決の問題であり、素数の分布の正確な性質に関連しています (素数とは、1 とそれ自身でのみ割り切れる数であり、整数論において基本的な役割を果たします)。今日の数学文献には、リーマン予想 (またはその一般化された形式) の確立に基づいた 1,000 を超える数学的命題があります。言い換えれば、リーマン予想とその一般化された形式が証明されれば、これらの 1,000 を超える命題が定理として確立され、数学の分野に重大な影響を与えることになります。これらの命題の一部も有効性を失います。 MIT数学教授ラリー・ガスとオックスフォード大学から新たな進歩がもたらされる

無制限のビデオ生成、計画と意思決定、次のトークン予測とフルシーケンス拡散の拡散強制統合 無制限のビデオ生成、計画と意思決定、次のトークン予測とフルシーケンス拡散の拡散強制統合 Jul 23, 2024 pm 02:05 PM

現在、次のトークン予測パラダイムを使用した自己回帰大規模言語モデルが世界中で普及していると同時に、インターネット上の多数の合成画像やビデオがすでに拡散モデルの威力を示しています。最近、MITCSAIL の研究チーム (そのうちの 1 人は MIT の博士課程学生、Chen Boyuan です) は、全系列拡散モデルとネクスト トークン モデルの強力な機能を統合することに成功し、トレーニングおよびサンプリング パラダイムである拡散強制 (DF) を提案しました。 )。論文タイトル:DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion 論文アドレス:https:/

See all articles