大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。-AI-php.cn

ホームページ

テクノロジー周辺機器

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

王林

Apr 28, 2024 pm 04:04 PM

理論圧縮技術メモリ使用量パラメータの効率的な微調整

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

AIxiv コラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。

近年、大規模言語モデルやヴィンセントグラフモデルなどの大規模AIモデルが急速に発展しています。このような状況の下、急速に変化するニーズにどのように適応し、大規模なモデルをさまざまな下流タスクに迅速に適応させるかが重要な課題となっています。コンピューティングリソースの制限により、従来のフルパラメータ微調整方法では不十分な可能性があるため、より効率的な微調整戦略を検討する必要があります。上記の課題により、パラメータ効率的微調整 (PEFT) テクノロジが最近急速に開発されました。

PEFT 技術の開発の歴史を包括的に要約し、最新の研究の進歩を把握するために、最近、ノースイースタン大学、カリフォルニア大学、アリゾナ州リバーサイドの研究者が大学とニューヨーク大学研究者らは、大規模モデルにおけるパラメータ効率的微調整（PEFT）技術の応用と開発の見通しを調査、整理、要約し、包括的かつ最先端のレビューにまとめました。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

論文リンク: https://arxiv.org/pdf/2403.14608.pdf

PEFT は効率的な事前トレーニングされたモデルにダウンストリームタスクを適応させる手段。トレーニング前のパラメータの大部分を修正し、ごく少数のパラメータを微調整することで、大規模なモデルを簡単にデプロイし、さまざまなダウンストリームタスクに迅速に適応させることができます。「巨人」は圧政をしない。

全文は 24 ページで、約 250 の最新文書をカバーしており、公開されるとすぐにスタンフォード大学、北京大学、その他の機関によって引用されています。さまざまなプラットフォームで公開されています。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

具体的には、このレビューは、PEFT アルゴリズムの分類、効率的な PEFT 設計、PEFT クロスドメインアプリケーション、PEFT システムの設計と展開に焦点を当てています。 PEFT の開発の歴史と最新の進歩を 4 つのレベルに分けて包括的かつ丁寧に説明します。関連業界の実務者であっても、大規模モデルの微調整分野の初心者であっても、このレビューは包括的な学習ガイドとして役立ちます。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

#1. PEFT の背景の紹介

#この論文は、最初に最近人気のあるものから始まります。 LLaMA モデル代表として、大規模言語モデル (LLM) およびその他の Transformer ベースのモデルのアーキテクチャと計算プロセスが分析および精緻化され、以下のさまざまな PEFT テクノロジの分析を容易にするために必要なシンボリック表現が定義されます。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

さらに、PEFT アルゴリズムの分類方法についても概説します。著者は、PEFT アルゴリズムを、さまざまな操作に応じて、加算的微調整、選択的微調整、高パラメータ化微調整、およびハイブリッド微調整に分割します。図 3 に PEFT アルゴリズムの分類と、各カテゴリに含まれる具体的なアルゴリズム名を示します。各カテゴリの具体的な定義については、後で詳しく説明します。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

背景セクションでは、著者は、PEFT メソッドのパフォーマンスを検証するために使用される一般的なダウンストリームベンチマークとデータセットも紹介しており、読者が一般的なタスク設定に慣れることが容易になります。

2. PEFT メソッドの分類

著者は最初に、加算的微調整、選択的微調整、および重いパラメータ微調整とハイブリッド微調整の定義:

追加微調整 学習可能なパラメータを追加することによって、事前トレーニング済みモデルの特定の位置ダウンストリームのタスクに適応するときにモデルのトレーニング可能なパラメーターの数を最小限に抑えるためのモジュールまたはパラメーター。
選択的微調整微調整プロセス中にモデル内のパラメーターの一部のみを更新し、残りのパラメーターは固定したままにします。付加的微調整と比較して、選択的微調整では、事前トレーニングされたモデルのアーキテクチャを変更する必要がありません。
再パラメータ化された微調整は、事前トレーニングされたモデルのパラメータの(低ランク)表現を構築することによってトレーニングに使用されます。推論中に、追加の推論遅延が発生するのを避けるために、パラメータは事前トレーニングされたモデルのパラメータ構造に等価的に変換されます。

これら 3 つの違いを図 4 に示します。ハイブリッド微調整

は、さまざまな PEFT 手法の利点を組み合わせ、さまざまな手法の類似点を分析して、統合された PEFT アーキテクチャを構築したり、最適な PEFT ハイパーパラメータを見つけたりします。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

次に、著者は各 PEFT カテゴリをさらに細分化します:

A. 加算微調整:

1) アダプター

アダプターは、Transformer ブロック内に小さなアダプター層を追加することで、パラメーターの効率的な微調整を実現します。各アダプター層には、下方投影行列、活性化関数、および上方投影行列が含まれています。下方投影行列は入力フィーチャをボトルネック次元 r にマッピングし、上方投影行列はボトルネックフィーチャを元の次元 d にマッピングし直します。

#図 5 は、モデル内のアダプター層の 3 つの典型的な挿入戦略を示しています。シリアルアダプターはトランスモジュールの後に連続して挿入され、パラレルアダプターはトランスモジュールの隣に並列に挿入されます。 CoDA はスパースアダプターメソッドです。重要なトークンの場合、CoDA は推論に事前トレーニングされた Transformer モジュールとアダプターブランチの両方を使用します。重要でないトークンの場合、CoDA は計算オーバーヘッドを節約するために推論にアダプターブランチのみを使用します。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

2) ソフトプロンプト

ソフトプロンプトは、学習可能なベクトルを入力シーケンスの先頭に追加して、効率的な処理を実現します。パラメータの微調整。代表的な手法としては、Prefix-tuning や Prompt Tuning などがあります。プレフィックス調整では、各 Transformer レイヤーのキー、値、クエリ行列の前に学習可能なベクトルを追加することで、モデル表現の微調整が可能になります。プロンプトチューニングでは、学習可能なベクトルのみを最初の単語ベクトル層に挿入して、トレーニングパラメーターをさらに削減します。

3) その他

上記の 2 つの分類に加えて、いくつかの PEFT 手法もあります。トレーニングプロセス中に新しいパラメータが導入されました。

#2 つの代表的な方法を図 6 に示します。 (IA) 3 では、フィードフォワードネットワークのキー、値、およびアクティブ化を調整するための 3 つのスケーリングベクトルが導入されています。 SSF は線形変換を通じてモデルの活性化値を調整します。各ステップの後に、SSF は SSF-ADA レイヤーを追加して、アクティベーション値のスケーリングと変換を可能にします。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。 B. 選択的な微調整:

1) 非構造化マスク

このタイプのメソッドは、学習可能なバイナリマスクをモデルパラメーターに追加することによって微調整できるパラメーターを決定します。 Diff プルーニング、FishMask、LT-SFT などの多くの作品は、マスクの位置の計算に焦点を当てています。

2) 構造化マスク

非構造化マスクにはマスクの形状に制限はありませんが、これにより次のような問題が発生します。その影響における非効率性。したがって、FAR、S-Bitfit、Xattn Tuning などの一部の作品では、マスクの形状に構造的な制限を課しています。 2 つの違いを以下の図に示します。

C. 再パラメータ化された微調整:

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

1) 低ランク分解

この種類この方法は、微調整用のパラメータ空間全体を表す、事前トレーニングされた重み行列のさまざまな低次元の再パラメータ化形式を見つけることによって達成されます。最も典型的な方法は LoRA です。これは、2 つの追加の上向き投影行列と下向き投影行列を追加することによって、トレーニング用の元のモデルパラメーターの低ランク表現を構築します。トレーニング後、追加のパラメーターを事前トレーニングされた重みにシームレスにマージして、追加の推論オーバーヘッドの導入を回避できます。 DoRA は、重みマトリックスをモジュールの長さと方向に分離し、LoRA を利用して方向マトリックスを微調整します。

2) LoRA 導出方法

著者は、LoRA 導出方法を LoRA のランクの動的選択に分割します。 LoRA のあらゆる面での改善。

LoRA 動的ランクの一般的な方法は DyLoRA です。これは、トレーニングプロセス中に同時にトレーニングするための一連のランクを構築するため、最適なランクを見つけるために費やされるリソースが削減されます。

LoRA の改善において、著者はさまざまな側面における従来の LoRA の欠点と、それに対応する解決策を列挙します。

D. ハイブリッド微調整:

このパートでは、さまざまな PEFT テクノロジーを統合モデルに統合する方法を検討します。最適な設計パターンを見つけます。さらに、ニューラルアーキテクチャ検索 (NAS) を使用して最適な PEFT トレーニングハイパーパラメーターを取得するいくつかのソリューションも紹介されています。

3. 効率的な PEFT 設計

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

このセクションでは、著者は、PEFT のトレーニングと推論のレイテンシとピークメモリオーバーヘッドに焦点を当て、PEFT の効率を向上させる研究について説明します。著者はPEFTの効率化を主に3つの観点から解説しています。

PEFT プルーニング戦略: ニューラルネットワークプルーニングテクノロジと PEFT テクノロジを組み合わせて、効率をさらに向上させます。代表的なタスクには、AdapterDrop、SparseAdapter などがあります。

PEFT 定量化戦略: つまり、モデルの精度を下げることでモデルのサイズを縮小し、それによって計算効率を向上させます。 PEFT と組み合わせる場合、主な問題は、新しい PEFT モジュールの事前トレーニングの重みと量子化処理をより適切に考慮する方法です。代表作にQLoRA、LoftQなど。

メモリ効率の高い PEFT 設計: PEFT は、勾配計算と逆伝播が必要なため、トレーニング中に少数のパラメーターしか更新できませんが、そのメモリ使用量は依然として大きいです。この課題に対処するために、サイドチューニングや LST などの一部のメソッドは、事前トレーニングされた重み内の勾配計算をバイパスすることでメモリのオーバーヘッドを削減しようとします。同時に、HyperTuning、MeZO などの他の方法は、LLM 内でのバックプロパゲーションを回避してこの問題を解決しようとします。

4. PEFT の分野を超えた応用

この章では、著者がさまざまな分野での PEFT の応用が検討され、特定のモデルまたはタスクのパフォーマンスを向上させるためのより優れた PEFT 手法を設計する方法が議論されます。このセクションでは主に、LLM、ビジュアルトランスフォーマー (ViT)、ビジュアルテキストモデル、拡散モデルなどのさまざまな大規模な事前トレーニング済みモデルに焦点を当て、これらの事前トレーニング済みモデルの下流タスク適応における PEFT の役割について詳しく説明します。

LLM に関しては、著者は、LLaMA-Adapter などの代表的な作品である、視覚的な指示入力を受け入れるために PEFT を使用して LLM を微調整する方法を紹介します。さらに、著者は LLM の継続学習における PEFT の応用についても検討し、PEFT を使用して LLM を微調整してコンテキストウィンドウを拡大する方法についても言及しています。

ViT については、PEFT テクノロジを使用して下流の画像認識タスクに適応させる方法と、PEFT を使用して ViT ビデオ認識機能を提供する方法について説明します。

ビジュアルテキストモデルに関して、著者は、オープンセット画像分類タスク用のビジュアルテキストモデルを微調整するために PEFT を適用した多くの研究を紹介しました。

拡散モデルについて、著者らは 2 つの一般的なシナリオを特定しています。テキスト以外の入力を追加する方法と、パーソナライズされた生成を実現する方法です。それぞれのシナリオを PEFT で説明しています。 2種類のタスク。

5. PEFT のシステム設計の課題

この章では、まず著者が説明します。では、クラウドサービスに基づく PEFT システムが直面する課題について説明します。これには主に次の点が含まれます:

一元化された PEFT クエリサービス: このモードでは、クラウドサーバーは単一の LLM モデルのコピーと複数の PEFT モジュールを保存します。。さまざまな PEFT クエリのタスク要件に従って、クラウドサーバーは対応する PEFT モジュールを選択し、LLM モデルと統合します。

分散型 PEFT クエリサービス: このモードでは、LLM モデルはクラウドサーバーに保存され、PEFT 重みとデータセットはクラウドサーバーに保存されます。デバイス上のユーザー。ユーザーデバイスは、PEFT メソッドを使用して LLM モデルを微調整し、微調整された PEFT 重みとデータセットをクラウドサーバーにアップロードします。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。 複数の PEFT トレーニング: 課題には、メモリ勾配とモデルの重みストレージを管理する方法、バッチで PEFT をトレーニングするための効率的なカーネルを設計する方法などが含まれます。

上記のシステム設計の課題を考慮して、著者は、これらの課題と実現可能な解決策のより詳細な分析を提供するために、3 つの詳細なシステム設計ケースをリストします。

オフサイトチューニング: 主に、LLM を微調整する際のデータプライバシーのジレンマと大量のリソース消費の問題を解決します。

PetS: 統合サービスフレームワークを提供し、PEFT モジュールの統合管理およびスケジューリングメカニズムを提供します。

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

PEFT 並列トレーニングフレームワーク: S-LoRA と Punica を含む 2 つの並列 PEFT トレーニングフレームワークと、それらが PEFT のトレーニング効率をどのように向上させるかを紹介します。

6. 今後の研究の方向性

著者は、PEFT テクノロジーはまだ進歩していないと考えています。下流ミッションは成功しましたが、今後の作業で対処する必要があるいくつかの欠点がまだあります。

統一評価ベンチマークを確立する: いくつかの PEFT ライブラリはすでに存在しますが、PEFT ライブラリの有効性と効率を公正に比較するための包括的なベンチマークが不足しています。異なるPEFTメソッド。認知されたベンチマークを確立すると、コミュニティ内のイノベーションとコラボレーションが促進されます。

トレーニング効率の向上: PEFT トレーニング中のトレーニング可能なパラメーターの量は、トレーニング中の計算量とメモリの節約量と必ずしも一致するとは限りません。「効率的な PEFT 設計」セクションで説明したように、将来の研究では、メモリと計算効率を最適化する方法がさらに研究される可能性があります。

スケーリングの法則の探求: 多くの PEFT 手法は小規模な Transformer モデルに実装されており、その有効性は必ずしも今日の大規模なさまざまなモデルに適用できるわけではありません。パラメータの量。将来の研究では、PEFT 手法を大規模モデルに適用する方法を検討する可能性があります。

より多くのモデルとタスクを提供: Sora、Mamba などのより大規模なモデルの出現により、PEFT テクノロジーが可能性を解き放つことができます。新しいアプリケーションのシーン。将来の研究は、特定のモデルやタスク向けの PEFT 手法の設計に焦点を当てる可能性があります。

データプライバシーの強化: 集中型システムは、パーソナライズされた PEFT モジュールを提供または微調整するときに、データプライバシーの問題に直面する可能性があります。将来の研究では、個人データと中間トレーニング/推論結果を保護するための暗号化プロトコルが調査される可能性があります。

PEFT とモデル圧縮: プルーニングや量子化などのモデル圧縮技術が PEFT 手法に及ぼす影響は十分に研究されていません。今後の研究は、圧縮モデルが PEFT 法のパフォーマンスにどのように適応するかに焦点を当てる可能性があります。

以上が大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7751

Java チュートリアル

1643

CakePHP チュートリアル

1398

Laravel チュートリアル

1293

PHP チュートリアル

1234

Related knowledge

「Defect Spectrum」は、従来の欠陥検出の限界を打ち破り、超高精度かつ豊富なセマンティックな産業用欠陥検出を初めて実現します。 Jul 26, 2024 pm 05:38 PM

現代の製造において、正確な欠陥検出は製品の品質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データセットと比較して、「DefectSpectrum」データセットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

NVIDIA 対話モデル ChatQA はバージョン 2.0 に進化し、コンテキストの長さは 128K と記載されています Jul 26, 2024 am 08:40 AM

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープンモデルが開発されています。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載 Aug 08, 2024 pm 09:22 PM

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラルネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ～ 20% に相当します。

Google AI が IMO 数学オリンピック銀メダルを獲得、数理推論モデル AlphaProof が発売、強化学習が復活 Jul 26, 2024 pm 02:40 PM

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

Deepseekをローカルで微調整する方法 Feb 19, 2025 pm 05:21 PM

Deepseekクラスモデルのローカル微調整は、コンピューティングリソースと専門知識が不十分であるという課題に直面しています。これらの課題に対処するために、次の戦略を採用できます。モデルの量子化：モデルパラメーターを低精度の整数に変換し、メモリフットプリントを削減します。小さなモデルを使用してください。ローカルの微調整を容易にするために、より小さなパラメーターを備えた前提型モデルを選択します。データの選択と前処理：高品質のデータを選択し、適切な前処理を実行して、モデルの有効性に影響を与えるデータ品質の低下を回避します。バッチトレーニング：大規模なデータセットの場合、メモリオーバーフローを回避するためにトレーニングのためにバッチにデータをロードします。 GPUでの加速：独立したグラフィックカードを使用して、トレーニングプロセスを加速し、トレーニング時間を短縮します。

PRO | なぜ MoE に基づく大規模モデルがより注目に値するのでしょうか? Aug 07, 2024 pm 07:08 PM

2023 年には、AI のほぼすべての分野が前例のない速度で進化しています。同時に、AI は身体化されたインテリジェンスや自動運転などの主要な分野の技術的限界を押し広げています。マルチモーダルの流れのもと、AI大型モデルの主流アーキテクチャとしてのTransformerの状況は揺るがされるだろうか？ MoE (専門家混合) アーキテクチャに基づく大規模モデルの検討が業界の新しいトレンドになっているのはなぜですか?ラージビジョンモデル (LVM) は、一般的な視覚における新たなブレークスルーとなる可能性がありますか? ...過去 6 か月間にリリースされたこのサイトの 2023 PRO メンバーニュースレターから、上記の分野の技術トレンドと業界の変化を詳細に分析し、新しい分野での目標を達成するのに役立つ 10 の特別な解釈を選択しました。準備してください。この解釈は 2023 年の Week50 からのものです

自然の視点: 医療における人工知能のテストは混乱に陥っています。何をすべきでしょうか? Aug 22, 2024 pm 04:37 PM

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビンシン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージデータを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データセットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データセットがありますが、これらのデータセットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

See all articles

大きなモデルを「ビッグ Mac」から解放する これは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

大きなモデルを「ビッグ Mac」から解放するこれは、大きなモデルのパラメータの効率的な微調整に関する最新のレビューです。