ホームページ テクノロジー周辺機器 AI 検索強化生成技術を使用して人工知能の幻覚問題を解決する

検索強化生成技術を使用して人工知能の幻覚問題を解決する

Oct 27, 2023 am 11:13 AM
AI 大規模な言語モデル

著者| ラーフル・プラダン

##出典| https: / /www.infoworld.com/article/3708254/addressing-ai-hallucinations-with-retrieval-augmented-generation.html

人工知能は、私たちの社会で最も影響力のあるテクノロジーになると予想されています。時間 。 トランスフォーマーテクノロジーと生成人工知能の最近の進歩は、イノベーションと創意工夫を大規模に解き放つ可能性を実証しました。

ただし、生成 AI にも課題がないわけではありません。この革新的なテクノロジーの導入と価値創造を深刻に妨げる可能性さえある課題があります。生成 AI モデルは複雑さと機能が増大し続けるにつれて、入力データに基づいていない出力を生成するなど、特有の課題も抱えています。 「イリュージョン」とは、モデルによって生成された出力結果が、一貫性はあるものの、事実や入力されたコンテキストから切り離されていること。この記事では、生成人工知能の変革的影響を簡単に紹介し、このテクノロジーの欠点と課題を検討し、幻覚を軽減するために使用できる技術について説明します。

生成型人工知能の変革的効果

次のように言い換えます: 生成型人工知能モデルは、次のように活用します。ディープラーニング 大規模なデータセット内のパターンを特定し、この情報を使用して新しく魅力的な出力を作成する複雑な計算プロセス。これらのモデルは、機械学習テクノロジーでニューラル ネットワークを使用します。これは、人間の脳が情報を処理および解釈する方法にインスピレーションを受けており、時間の経過とともに継続的に学習して改善されます。
OpenAI の GPT 生成 AI モデル-4 と Google の PaLM 2 は、自動化、データ分析、ユーザー エクスペリエンスに革新をもたらすことを約束します。これらのモデルは、コードを記述したり、記事を要約したり、さらには病気の診断にも役立ちます。ただし、これらのモデルの実現可能性と最終的な価値は、その精度と信頼性に依存します。医療、金融、法律サービスなどの重要な分野では、精度の信頼性が非常に重要です。しかし、すべてのユーザーが生成 AI の可能性を最大限に発揮するには、これらの課題に対処する必要があります。

大規模言語モデルの欠点

# #LLM は基本的に確率的かつ非決定的。特定の単語シーケンスが次に出現する可能性に基づいてテキストを生成します。 LLM には知識の概念がなく、推奨エンジンとしてトレーニング済みデータのコーパスを介したナビゲーションに完全に依存しています。通常、生成されるテキストは文法的および意味論的な規則に従いますが、完全にプロンプ​​トとの統計的一貫性に基づいています。
LLM のこの確率的な性質は、長所でもあり短所でもあります。正しい答えに到達すること、または答えに基づいて重要な決定を下すことが目的である場合、幻覚は悪いものであり、損害を引き起こす可能性さえあります。ただし、目標が創造的な取り組みである場合、LLM を使用して芸術的な創造性を促進することができ、その結果、アートワーク、ストーリーライン、脚本が比較的迅速に作成されます。

ただし、目標に関係なく、LLM モデルの出力を信頼できない場合は、重大な結果を招く可能性があります。これは、これらのシステムの機能に対する信頼を損なうだけでなく、人間の生産性とイノベーションの加速における AI の影響も大幅に減少させることになります。

最終的に、人工知能の性能は、トレーニングに使用されたデータによって決まります。

LLM の錯覚は、主にデータセットとトレーニングの欠陥によって引き起こされます。これには、次のような側面が含まれます。:

過学習: 過学習は、モデルがトレーニング データ (ノイズや外れ値を含む) を学習しすぎると発生します。モデルの複雑さ、ノイズの多いトレーニング データ、または不十分なトレーニング データはすべて、過学習につながる可能性があります。その結果、モデルが新しいデータに対して適切に一般化されず、低品質のパターン認識が発生し、分類エラーや予測エラー、事実に反する出力、低い信号対雑音比の出力、または完全な幻覚につながります。

  • データ品質: トレーニングに使用されるデータの誤ったラベル付けと誤った分類は、幻覚効果に影響を与える可能性があります。データに偏りがあるか、関連データが欠如していると、モデルが推奨する意思決定の範囲によっては、実際には正確に見えるモデル出力が有害であることが判明する可能性があります。
  • データ不足: データ不足、または最新または関連性の高いデータの必要性が幻想を生み出し、企業の妨げとなります。採用 生成人工知能における重要な問題の 1 つ。最新のコンテンツとコンテキスト データでデータを更新すると、錯覚や偏見を軽減できます。
  • #大規模な言語モデルでの幻覚への対処
  • 幻覚を解決するにはいくつかの方法があります
LLM のイリュージョン問題。微調整、キュー エンジニアリング、検索拡張生成 (RAG) などの手法が含まれます。
  • 微調整とは、ドメイン固有のデータセットを使用してモデルを再トレーニングし、そのドメインに関連するコンテンツをより正確に生成することを指します。ただし、モデルの再トレーニングや微調整には長い時間がかかり、さらに継続的にトレーニングを行わないとデータはすぐに古くなってしまいます。さらに、モデルの再トレーニングには多大なコスト負担も伴います。
  • ヒント プロジェクトは、## を支援することを目的として、LLM が生成するヒントとして入力内のより説明的で説明的な機能を提供します。高品質の結果。モデルに追加のコンテキストを提供し、事実に基づいてモデルを作成すると、モデルが幻覚を見ている可能性が低くなります。
  • Retrieval Enhanced Generation (RAG) は、最も正確で最新のデータを使用することに重点を置いた方法です。 -LLM の日付情報 基本的なフレームワークを提供します。 LLM の応答性は、外部知識ベースからのファクトをモデルにリアルタイムで供給することで改善できます。
検索拡張生成とリアルタイム データ

検索拡張生成は、データを改善するための最も有望な手法の 1 つです。 1.大規模な言語モデルの精度。 RAG をリアルタイム データと組み合わせると、幻覚を大幅に軽減できることがわかりました。

RAG を使用すると、企業は最新の独自データとコンテキスト データを活用して LLM を活用できます。さらに、RAG は入力コンテンツを特定のコンテキスト情報で強化することもできるため、言語モデルがより正確でコンテキストに関連した応答を生成するのに役立ちます。エンタープライズ環境では、微調整は現実的ではないことがよくありますが、RAG は、パーソナライズされた情報に基づいたユーザー エクスペリエンスを提供するための、低コストで高収益の代替手段を提供します

#効率を向上させるため

RAG モデルの場合、エンコードされたテキストの意味を使用して、LLM のネイティブ言語、つまりエンベディングと呼ばれる高次元の数学ベクトルでデータを保存できる運用データ ストアと RAG を組み合わせる必要があります。ユーザーがクエリを行うと、データベースはそれを数値ベクトルに変換します。このようにして、同じ用語が含まれているかどうかに関係なく、関連するテキストをベクトル データベースを通じて照会できます。

セマンティック検索を使用して大量の非構造化データを保存およびクエリできる可用性の高い高性能データベースは、

RAG プロセスの重要なコンポーネントです。

以上が検索強化生成技術を使用して人工知能の幻覚問題を解決するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Jun 28, 2024 am 03:51 AM

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

Groq Llama 3 70B をローカルで使用するためのステップバイステップ ガイド Groq Llama 3 70B をローカルで使用するためのステップバイステップ ガイド Jun 10, 2024 am 09:16 AM

翻訳者 | Bugatti レビュー | Chonglou この記事では、GroqLPU 推論エンジンを使用して JanAI と VSCode で超高速応答を生成する方法について説明します。 Groq は AI のインフラストラクチャ側に焦点を当てているなど、誰もがより優れた大規模言語モデル (LLM) の構築に取り組んでいます。これらの大型モデルがより迅速に応答するためには、これらの大型モデルからの迅速な応答が鍵となります。このチュートリアルでは、GroqLPU 解析エンジンと、API と JanAI を使用してラップトップ上でローカルにアクセスする方法を紹介します。この記事では、これを VSCode に統合して、コードの生成、コードのリファクタリング、ドキュメントの入力、テスト ユニットの生成を支援します。この記事では、独自の人工知能プログラミングアシスタントを無料で作成します。 GroqLPU 推論エンジン Groq の概要

Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Jun 10, 2024 am 11:08 AM

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

GenAI および LLM の技術面接に関する 7 つのクールな質問 GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります 微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります Jun 11, 2024 pm 03:57 PM

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

OpenHarmony で大規模な言語モデルをローカルにデプロイする OpenHarmony で大規模な言語モデルをローカルにデプロイする Jun 07, 2024 am 10:02 AM

この記事は、第 2 回 OpenHarmony テクノロジー カンファレンスで実証された「OpenHarmony での大規模言語モデルのローカル デプロイメント」の結果をオープンソース化します。オープンソースのアドレス: https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdparty。 /InferLLM/docs/hap_integrate.md。実装のアイデアと手順は、軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmony 標準システムに移植し、OpenHarmony 上で実行できるバイナリ製品をコンパイルすることです。 InferLLM はシンプルで効率的な L

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

あなたが知らない機械学習の 5 つの流派 あなたが知らない機械学習の 5 つの流派 Jun 05, 2024 pm 08:51 PM

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

See all articles