GPT-4のパフォーマンスはどのくらいスムーズですか?人間の文章は超えられるのか?
要約生成は自然言語生成 (NLG) のタスクであり、その主な目的は長いテキストを短い要約に圧縮することです。ニュース記事、ソース コード、クロスランゲージ テキストなど、さまざまなコンテンツに適用できます。
ラージ モデル (LLM) の出現により、従来の細かいモデルは、 -特定のデータセットでのチューニング方法は適用されなくなりました。
LLM はサマリーの生成にどの程度効果があるのか、疑問に思わずにはいられません。
この質問に答えるために、北京大学の研究者は「要約は(ほぼ)死んだ」という論文で詳細な議論を行いました。彼らは、人間が生成した評価データセットを使用して、さまざまな要約タスク (単一のニュース、複数のニュース、ダイアログ、ソース コード、および言語間の要約) における LLM のパフォーマンスを評価しました。LLM が生成した要約、人間が作成した要約、および微調整されたモデルによって生成された要約により、LLM によって生成された要約が人間の評価者に非常に好まれていることが明らかになりました。 、NAACL、およびCOLINGを3年間で調査した結果、論文の約70%の主な貢献は要約要約方法を提案し、それを標準データに使用することであったことが判明し、その有効性はセットで検証されました。したがって、この研究では「要約は(ほぼ)死んだ」と述べられています。
それにもかかわらず、研究者らは、この分野は依然としていくつかの課題に直面していると述べています。たとえば、品質などのより高度な問題の必要性などです。参照データセットと改善された評価方法はまだ解決する必要があります
論文リンク: https://arxiv.org/pdf/2309.09558.pdf
#方法と結果単一のニュース、複数のニュース、および会話の要約タスクを実行する場合、CNN/DailyMail およびマルチニュースのデータ セット構築方法と同様の方法をシミュレーションに使用しました。言語間の要約タスクについては、Zhu et al. が提案したものと同じ戦略を採用します。コード要約タスクに関しては、Bahrami らによって提案された方法が使用されます。
データセットが構築されたら、次のステップは方法です。具体的には、この記事では、単一のニュース タスクに BART と T5、複数のニュース タスクに Pegasus と BART、対話タスクに T5 と BART、言語をまたがるタスクに MT5 と MBART、ソース コード タスクに Codet5 を使用します。
この実験では、人間の評価者を使用して、さまざまな要約の全体的な品質を比較しました。図 1 の結果によると、LLM によって生成された要約は、すべてのタスクにおいて、手動で生成された要約および微調整モデルによって生成された要約よりも優れています。
これは、伝統的に完璧だと考えられている人間が書いた要約をなぜ LLM が上回ることができるのかという疑問を引き起こします。さらに、予備的な観察では、LLM が生成した要約は非常にスムーズで一貫性があることが示されています。
この論文では、人間の要約文と LLM が生成した要約文における幻覚の問題を特定するためにアノテーターをさらに募集し、その結果が示されています。表 1 に示すように、人間が書いた要約は、GPT-4 によって生成された要約と比較して、同じかそれ以上の数の幻覚を示します。複数のニュース項目やコードの要約などの特定のタスクでは、人間が書いた要約は事実との一貫性が著しく劣ります。
#表 2 は、人間が書いた要約と GPT-4 が生成した要約における幻覚の割合を示しています
この記事では、人間が作成した参考資料の要約には流暢さに欠ける問題があることもわかりました。図 2 (a) に示すように、人間が作成した参考資料の概要には、情報が不完全な場合があります。また、図 2(b) では、人間が書いた参考資料の要約の一部が幻覚を示しています。
この研究では、モデルの微調整によって生成される要約は通常、固定かつ厳密な長さを持つのに対し、LLM は入力情報に基づいて出力の長さを調整できることもわかりました。さらに、入力に複数のトピックが含まれている場合、図 3 に示すように、微調整モデルによって生成される要約ではトピックの範囲が低くなりますが、LLM は要約の生成時にすべてのトピックを取得できます
#図 4 の結果によると、大規模モデルに対する人間の好みスコアが 50% を超えていることがわかります。これは、人々がその概要とモデルに強い好みを持っていることを示しています。テキスト要約における LLM の機能を強調します
以上がGPT-4のパフォーマンスはどのくらいスムーズですか?人間の文章は超えられるのか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









Debian Systemsでは、Readdir関数はディレクトリコンテンツを読み取るために使用されますが、それが戻る順序は事前に定義されていません。ディレクトリ内のファイルを並べ替えるには、最初にすべてのファイルを読み取り、QSORT関数を使用してソートする必要があります。次のコードは、debianシステムにreaddirとqsortを使用してディレクトリファイルを並べ替える方法を示しています。

この記事では、DebianシステムのApachewebサーバーのロギングレベルを調整する方法について説明します。構成ファイルを変更することにより、Apacheによって記録されたログ情報の冗長レベルを制御できます。方法1:メイン構成ファイルを変更して、構成ファイルを見つけます。Apache2.xの構成ファイルは、通常/etc/apache2/ディレクトリにあります。ファイル名は、インストール方法に応じて、apache2.confまたはhttpd.confである場合があります。構成ファイルの編集:テキストエディターを使用してルートアクセス許可を使用して構成ファイルを開く(nanoなど):sudonano/etc/apache2/apache2.conf

Debian Systemsでは、Directoryコンテンツを読み取るためにReadDirシステム呼び出しが使用されます。パフォーマンスが良くない場合は、次の最適化戦略を試してください。ディレクトリファイルの数を簡素化します。大きなディレクトリをできる限り複数の小さなディレクトリに分割し、Readdirコールごとに処理されたアイテムの数を減らします。ディレクトリコンテンツのキャッシュを有効にする:キャッシュメカニズムを構築し、定期的にキャッシュを更新するか、ディレクトリコンテンツが変更されたときに、頻繁な呼び出しをreaddirに削減します。メモリキャッシュ(memcachedやredisなど)またはローカルキャッシュ(ファイルやデータベースなど)を考慮することができます。効率的なデータ構造を採用する:ディレクトリトラバーサルを自分で実装する場合、より効率的なデータ構造(線形検索の代わりにハッシュテーブルなど)を選択してディレクトリ情報を保存およびアクセスする

Debian Mail Serverのファイアウォールの構成は、サーバーのセキュリティを確保するための重要なステップです。以下は、iPtablesやFirewalldの使用を含む、一般的に使用されるファイアウォール構成方法です。 iPtablesを使用してファイアウォールを構成してIPTablesをインストールします(まだインストールされていない場合):sudoapt-getupdatesudoapt-getinstalliptablesview現在のiptablesルール:sudoiptables-l configuration

Debian Systemsでは、OpenSSLは暗号化、復号化、証明書管理のための重要なライブラリです。中間の攻撃(MITM)を防ぐために、以下の測定値をとることができます。HTTPSを使用する:すべてのネットワーク要求がHTTPの代わりにHTTPSプロトコルを使用していることを確認してください。 HTTPSは、TLS(Transport Layer Security Protocol)を使用して通信データを暗号化し、送信中にデータが盗まれたり改ざんされたりしないようにします。サーバー証明書の確認:クライアントのサーバー証明書を手動で確認して、信頼できることを確認します。サーバーは、urlsessionのデリゲート方法を介して手動で検証できます

Debian Mail ServerにSSL証明書をインストールする手順は次のとおりです。1。最初にOpenSSL Toolkitをインストールすると、OpenSSLツールキットがシステムに既にインストールされていることを確認してください。インストールされていない場合は、次のコマンドを使用してインストールできます。sudoapt-getUpdatesudoapt-getInstalopenssl2。秘密キーと証明書のリクエストを生成次に、OpenSSLを使用して2048ビットRSA秘密キーと証明書リクエスト(CSR)を生成します:Openss

DebianシステムのReadDir関数は、ディレクトリコンテンツの読み取りに使用されるシステムコールであり、Cプログラミングでよく使用されます。この記事では、ReadDirを他のツールと統合して機能を強化する方法について説明します。方法1:C言語プログラムを最初にパイプラインと組み合わせて、cプログラムを作成してreaddir関数を呼び出して結果をinclude#include#include inctargc、char*argv []){dir*dir; structdireant*entry; if(argc!= 2){(argc!= 2){

このガイドでは、Debian SystemsでSyslogの使用方法を学ぶように導きます。 Syslogは、ロギングシステムとアプリケーションログメッセージのLinuxシステムの重要なサービスです。管理者がシステムアクティビティを監視および分析して、問題を迅速に特定および解決するのに役立ちます。 1. syslogの基本的な知識Syslogのコア関数には以下が含まれます。複数のログ出力形式とターゲットの場所(ファイルやネットワークなど)をサポートします。リアルタイムのログ表示およびフィルタリング機能を提供します。 2。syslog(rsyslogを使用)をインストールして構成するDebianシステムは、デフォルトでrsyslogを使用します。次のコマンドでインストールできます:sudoaptupdatesud
