火山エンジンと大型モデルを使用してデータフライホイールを「点火」します-AI-php.cn

ホームページ

テクノロジー周辺機器

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します

王林

Sep 20, 2023 pm 09:21 PM

火山エンジンプロジェクト

大きなモデルが何千もの業界を変革する過程で、Volcano Engine はデータ業界にパーソナライズされた答えを提供する上で先導者となりました。

#9月19日、上海で開催された「Data Flywheel V-Tech Data-Driven Technology Summit」において、Volcano Engineはデジタルインテリジェンスプラットフォームの大規模アプリケーションモデルを発表しました。 VeDI (大規模言語モデル) 機能。

製品のアップグレード後は、自然言語を使用して「数値を検索」し、データウェアハウスモデルの開発を支援し、コードを最適化し、さらにビジュアルチャートの生成や会話中のアトリビューション分析などの機能を実装。コーディングのスキルを持たない一般のオペレーターでも、すぐに数値を見つけて分析できます。現在、VeDI 関連のデータ製品がテストに招待されています。

#データ製品のアップグレードにより、データ利用の敷居が大幅に下がりました。 以前は、一般のオペレーターが番号を見つけたい場合、多くの場合、番号を取得するためのコードを作成する研究開発担当者に依頼する必要がありました。データの分析には、多くの専門知識を組み合わせる必要がありました。アップグレードされたデータ製品の助けを借りて、オペレーターはいつでも自然言語でニーズを入力し、必要なデータをリアルタイムで取得できるようになりました。

#これにより、データの価値がさらに高まります。企業内では、使用量のしきい値が低くなることで、データ消費チェーンのより多くの人がデータにアクセスして使用できるようになり、これまで実際のしきい値によって抑制されていたデータのニーズが満たされ、データに基づいたビジネス上の洞察が得られるようになります。よりタイムリーになり、意思決定もよりタイムリーになり、より科学的でデータに基づいたビジネスの想像力が解き放たれるようになります。

#デジタル化が進む企業では、データの価値がより高い頻度で流通し、データのフライホイールがさらに加速することになります。

#大規模なモデルは完全なデータリンクに統合され、データ生成と使用のしきい値がさらに削減されます。

小規模モデルと比較して、大規模モデルには強力な一般化推論機能、外部ツール検索機能、およびコード生成機能があります。これらの機能はデータ製品に大きな影響を与えます。

一般化された推論能力が強化されるということは、より高い知性を意味しますが、同時に、数学や分析能力などのさまざまな能力を調整するための多くのツールと組み合わせる必要もあります。補足として。

大規模モデルの時代に開かれた自然言語対話モデルは、データ製品の使用に新たな想像力の余地をもたらしました。

今年 3 月から、Byte 社内では大規模なモデルとデータ製品を組み合わせ始めました。迅速な反復による小規模なテストでは、Luo Xuan チームがすぐにそれを実行しました。データ製品の主要なシナリオでは、大規模なモデルによってもたらされる改善と変更が明らかであることがわかりました。その後、チームはデータ製品シナリオの大規模な実験を開始し、シナリオの優先順位を常に定量化し、製品への大規模モデルの実装を推進しました。

ビッグモデルがデータ業界を変革するプロセスにおいて、シナリオの選択は最も重要なステップの 1 つです。

. 適切な使用シナリオには、以下のことが必要です。現在のテクノロジーまたは予測可能なテクノロジーのみに基づいて、より多くのデータ消費価値をもたらし、データ生産をさらに推進しながら、大規模なモデルを追加した後にユーザーまたはビジネス関係者がより良いエクスペリエンスを得ることができるようにすることも必要です。

Luo Xuan 氏は、たとえば、一部のシナリオでは、大規模なモデルを使用した後、遅延の問題により、元のソリューションに 1 ～ 2 秒しかかからない場合があると共有しました。大規模なモデルでは、自然言語を使用すると 5 秒以上かかる可能性があり、その場合、このシナリオはビジネスの適時性エクスペリエンスの要件を満たすことができず、無効になります。

「しかし、たとえば、ショートコード生成プロセスでは、自然言語を追加すると、シーンの効率が大幅に向上します。将来的には、パフォーマンスが向上するにつれて、大規模モデルのデータは引き続き改善されており、リンク全体のあらゆる側面において、大規模モデルがもたらすインテリジェントな変化には、さらに期待する価値があります。」今回の「Data Flywheel・V-Tech Data Driven at "Technology Summit"」では、Volcano Engineが発表したデジタルインテリジェンスプラットフォームVeDIの製品アップグレードには主にDataLeapとDataWindが含まれます。その中で、DataLeap の「Number Assistant」は質疑応答形式で数値の検索をサポートし、「Development Assistant」は自然言語での SQL コードの生成と最適化をサポートし、DataWind - Analysis Assistant は自然言語での数値検索をサポートします。データ視覚化のクエリと分析を完了するための言語。

数値の検索、取得、分析のリンク全体をカバーし、データの生成と使用のプロセス全体の技術的な敷居を下げます。

DataLeap - 番号検索アシスタント

「番号の検索」は通常、データ消費チェーン全体の最初のステップは、データ消費を実現するための適切なデータ資産を見つけることです。しかし、従来のプロセスで「数字を見つける」ことは簡単な作業ではなく、ビジネスの専門知識の入力に大きく依存する必要があり、通常はキーワード検索、手作業によるスクリーニング、または専門のデータ開発者を探すことによってのみ確認できます。

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します

^{## DataLEAP を使用する - アシスタントの検索 "Find"}

## " " 関数を、大規模言語モデル (LLM) は、「数値を見つける」という敷居を大幅に下げます。

「数値検索アシスタント」を使用すると、コーディングスキルのない人でも自然言語を通じて「擬人化」クエリを実行できます

たとえば、電子商取引オペレーターは、「Haowu Live Broadcast Room の運営状況」を直接尋ねることができます。過去 7 日間にどのテーブルを使用する必要がありますか?」 DataLeap - データ検索アシスタントは、ビジネス知識ベースに基づいてビジネス条件に関連するテーブルを推奨し、各テーブルに対応するデータディメンションを説明します。

現在、「数値アシスタント」は、Hive テーブル、データセット、ダッシュボード、データインジケーター、ディメンションなど、さまざまなデータタイプに関する質疑応答を実装できます。および関連するビジネス知識擬人化クエリを実現するための検索。

さらに、「数字検索」を簡単にするだけでなく、「数字検索アシスタント」と大規模モデルの機能を組み合わせることで、「数字検索」の精度をさらに向上させることができます。「。」過去の従来の技術ソリューションでは、データ資産の取得は構造化データ管理に依存していました。非構造化ビジネスデータには接続が欠落している可能性があります。検索にキーワードを使用すると、リンクの断片化の問題が発生する可能性があり、ビジネスに基づくデータの数が大幅に減少する可能性があります。効率的に見つけて消費します。また、検索ではキーワードに基づいて回答候補が提示されるため、手動での選別や確認が必要であり、直接的な回答ではないため、ユーザーにとって快適な体験が得られません。

ユーザーとの会話プロセスにおいて、大規模言語モデル (LLM) がユーザーの真の意図を理解できるようになり、検索プロセスがより集中的になり、人間の時間が節約されます。コスト、「数字を見つける」こと自体が高速化すると同時に、モデルの意味理解・解析能力が徐々に向上し、単純なキーワード検索よりも会話型検索の方がリンク全体での検索効率が高くなりました。

DataLeap - 開発アシスタント

データの生成および処理プロセスでは、「開発」「アシスタント」自然言語の使用をサポートし、SQL コードを自動的に生成できます。バグ修復、コードの最適化、既存のコードの説明と注釈を自動的に実装できます。また、ドキュメント検索、関数の使用法、コード例なども実現できます。対話による SQL の使用法クラス。

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します ## SQL コードの自動開発

開発アシスタントの最下層では大きな言語が使用されます。モデル (LLM) は、大規模なコードとコーパスのトレーニング後、ユーザーの自然言語入力に従ってテーブルスキーマを含むメタデータ情報を自動的に関連付け、高品質のデータ処理コードを生成し、データを理解し、書き換え、質疑応答する機能を備えています。コード。

^{アウトアウトアウトダウンアウト ' ' ' ' ' ' ' ' ダウン ' ダウン ' 一緒に' ウェイ' 一緒にウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイ開発アシスタントは言語の壁を打ち破り、データ開発の敷居を大幅に下げます。「本来、データを（処理）するには、SQL や Python などのプログラミング言語の知識が必要であり、比較的強いスキル要件となります。しかし、現在ではプログラミング言語は必要なく、自然言語を使用できるようになりました。つまり、これは、これを行う人々の要件がさらに軽減されたことを意味します。」}

データ消費の需要があるアナリストやオペレーターにとって、SQL を理解していません。基本的な ETL も実行できます。

オペレーターは、DataLeap に都市別の注文販売数や時間帯別のライブブロードキャストルームのトラフィックなどのビジネス条件に対応するデータ要求コードを自動的に生成させることができます。オペレーターは、「このテーブルの実行中に最適化計画はありますか?」など、コードの意味について尋ねたり、「このコード文字列のチェックと修正を手伝ってください」と会話したりすることもできます。生成されたコードをワンクリックで解析し、SQL ツールを呼び出してテーブルを確認し、クリックして AI 自動修復を確認してデータ資産をさらに最適化することもできます。

さらに重要なのは、プロの開発者にとって、DataLeap-Development Assistant は、基本的な作業を実行したり、データアナリストからのデータを処理したり、データに依存したりするのに役立ちます。業務担当者のニーズに応え、エンジニアは最後に生成されたコードを修正して正確性を確認するだけで済みます。その結果、研究開発担当者はより創造的な作業に集中し、複雑なシナリオのニーズにさらに集中し、開発アシスタントを使用してコードを最適化し、研究開発の生産性とコードの品質を向上させることができます。

DataWind - Analysis Assistant

検索と取得の実装数値その後、データ分析リンクが登場しました。大規模なモデル機能を組み合わせた DataWind - Analysis Assistant は、分析以外の立場にある人々が、データ視覚化クエリや自然言語対話による分析などの一連のビジネス探索を完了するのに役立ち、このリンクの敷居を下げます。

最初は「データセット」の作成です。データ資産では、オペレーターは DataWind のドラッグアンドドロップ方式を使用してデータセットを作成し、自然言語を使用して、「有名人の生放送期間」のデータを直接チェックするなど、さまざまなフィールドのロジックを定義します。

#＃フィールドジェネレーション

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します

#チェック後、オペレーターは視覚的に分析して探索できます。従来のBIツールはドラッグ＆ドロップによる操作方法が一般的であり、ダッシュボード制作の敷居は下がってきましたが、分析やインサイトの分野においては、依然としてデータをより深く理解するために多くの専門知識が必要となります。これが「しきい値」です。

##視覚探査

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します

# DataWind は、さまざまな機能に基づいて、基本的な仮定と検証を実施し、分析アイデアを提案することができました。 DataWindが提供するAI自動分析機能は、チャートをもとにさらなる原因の探索をサポートします。例えば、生成された「時間帯別ライブ配信室トラフィックグラフ」や「ライブ配信室売上上位エリア」などのビジュアルチャートをAIが自動分析し、オペレーターは分析結果を基に対話を通じてさらなるアトリビューションを行うだけで済みます。

同時に、DataWind は Feishu などのオフィスコラボレーションツールとも接続し、IM メッセージの購読や自然な対話を通じて、より拡張的な分析を行うことができ、いつでも柔軟な分析を実現できます。データセット、ビジュアルインサイト、メッセージサブスクリプションなど、チェーン全体にわたってセルフサービスインテリジェンスを提供し、チャイナユニコムのオフィス統合により、データ分析を日常生活にシームレスに統合できます。

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します

^{# IMメッセージサブスクリプションと協力して拡張分析を実施する。言語の対話は結果を直接理解することができ、データ分析と思考サイクルは大幅に短縮されます。過去の分析と洞察を活用し、データ分析サイクルを短縮します。}

この段階で、DataWind - Analysis Assistant のアプリケーションシナリオはすでに非常に充実しています。コア分析シナリオでの会話による探索を可能にすることに加えて、Anaization Assistant はその機能も拡張します。以前はより技術的なしきい値が必要だった数式生成などのシナリオで。

#大規模モデルはデータフライホイールを加速し、企業のデータドリブン化を支援します

ByteDance には深いデータ駆動型の遺伝子があります。設立以来、ByteDance内のほぼすべてのシナリオがA/Bテストの対象となり、Douyinビデオ品質の最適化効果が良いか、レコメンデーションアルゴリズム戦略の最適化が適切かなど、ビジネス戦略を推進するためにデータフィードバックを通じて調整が行われています。正確であり、Toutiao の名前も A/B テスト済みです。

バイト内では、データ消費の範囲は非常に広いです。組織的には、経営トップから中間管理職、現場の従業員までが基本的にデータを閲覧し、会社の経営状況、収支、事業進捗、商品戦略などの評価に活用することができます。ライブ e コマースでのリアルタイムマーケティングなどの特定のシナリオでは、運用はリアルタイムデータに基づいて対応するマーケティング戦略を設計し、推進します。

Byte は、データ消費を通じて科学的な意思決定と機敏な行動を実現し、ビジネス価値の向上をもたらします。また、頻繁なデータ消費とビジネス上のメリットを通じて、的を絞った低コストの構築も可能にします。ビジネスアプリケーションをより適切にサポートするための高品質のデータ資産。

今年 4 月、ByteDance の 10 年以上にわたるデータ駆動型の実践経験に基づいて、Volcano Engine はエンタープライズデジタルインテリジェンスアップグレードのための新しいパラダイムである「データフライホイール」をリリースしました。「データフライホイール」は、エンタープライズデータフローがビジネスフローに完全に統合された後のデータ資産とビジネスアプリケーションの改善によるフライホイール効果を要約するために使用されます。

デジタル化の全体的な傾向の下、何千もの業界の企業ビジネスはデジタル化に近づき、企業にとってデータの重要性はますます高まっています。データは新たな生産要素として、企業のデジタル化とインテリジェント化をサポートしています。しかし、客観的に見ると、多くの企業はデジタル構築を進めてきたにもかかわらず、データの価値を十分に解放できていないのです。

「企業はデータ製品を高額で導入しているかもしれませんが、実際に社内で使用している人はほとんどいないかもしれません。データの流れが難しい場合は、 Luo Xuan 氏は、データ製品市場において、デジタル構築を進めている多くの企業が、高額なデータ構築および管理コスト、データ製品の使用に対する高い障壁、低いデータ資産価値などの問題を抱えていると観察しています。。

#デジタル化プロセス全体の観点から見ると、「データドリブン」を実現することは難しいですが正しいです。 Byteを例に挙げると、Luo Xuan氏は現在、ByteDanceの従業員の80％がデータ製品を直接使用でき、管理可能で運用可能なデータ資産が日々の分析シナリオの80％をカバーしていることを明らかにした。 Byte の経験から判断すると、これは、企業内で良好な「データフライホイール」を形成するには、企業内の内部データ製品の利用率と、シナリオ内で管理可能および運用可能なデータ資産の範囲をより高いレベルまで高める必要があることを意味します。会社。。

#このプロセスでは、大規模なモデルによってサポートされるデータ製品が、企業の目標達成を支援する重要な原動力となる可能性があります。

大規模モデル機能を備えてアップグレードされたデジタルインテリジェンスプラットフォーム VeDI は、数値の検索、数値の取得、データ分析など、データの生成と消費のプロセス全体をさらに削減します。同じレベルの需要の下で、アップグレードされた VeDI を使用することで、社内でデータ製品を使用できる人の数がプロのデータアナリストから、データを必要とするすべての人々 (運用、上司、プロダクトマネージャー、など、データ消費は包括的になります。

「閾値を下げてデータを活用してこそ、データが流通する中でどのような価値を生むのかが分かる。」デジタル化プロセスに参入したばかりの企業へ, つまり、データの価値は発見には程遠い宝物であり、敷居の低いデータプロダクトがそれを解く鍵となる可能性があります。

#大規模モデルのサポートにより、企業内の「データフライホイール」の回転が加速します。

同社のビジネスはより強力なエンジンを備えており、ビジネス担当者は「数秒でデータ出力」からデータのフィードバックを迅速に取得できるため、ビジネスをより迅速に最適化できます。データフローが加速する過程で、より多くの高品質のデータ資産が継続的に提供されます。降水はビジネスにより多くの洞察をもたらし、最終的にはビジネス上の意思決定をより科学的かつ機敏に行うことができます。

以上が火山エンジンと大型モデルを使用してデータフライホイールを「点火」しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7936

Java チュートリアル

1652

CakePHP チュートリアル

1412

Laravel チュートリアル

1303

PHP チュートリアル

1250

Related knowledge

ControlNet の作者がまたヒット作を出しました!写真から絵画を生成し、2 日間で 1.4,000 個のスターを獲得する全プロセス Jul 17, 2024 am 01:56 AM

これも Tusheng のビデオですが、PaintsUndo は別の道を歩んでいます。 ControlNet 作者 LvminZhang が再び生き始めました!今回は絵画の分野を目指します。新しいプロジェクト PaintsUndo は、開始されて間もなく 1.4kstar を獲得しました (まだ異常なほど上昇しています)。プロジェクトアドレス: https://github.com/lllyasviel/Paints-UNDO このプロジェクトを通じて、ユーザーが静止画像を入力すると、PaintsUndo が線画から完成品までのペイントプロセス全体のビデオを自動的に生成するのに役立ちます。。描画プロセス中の線の変化は驚くべきもので、最終的なビデオ結果は元の画像と非常によく似ています。完成した描画を見てみましょう。

オープンソース AI ソフトウェアエンジニアのリストのトップに立つ UIUC のエージェントレスソリューションは、SWE ベンチの実際のプログラミングの問題を簡単に解決します Jul 17, 2024 pm 10:02 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この論文の著者は全員、イリノイ大学アーバナシャンペーン校 (UIUC) の Zhang Lingming 教師のチームのメンバーです。博士課程4年、研究者

RLHF から DPO、TDPO に至るまで、大規模なモデルアライメントアルゴリズムはすでに「トークンレベル」になっています Jun 24, 2024 pm 03:04 PM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 人工知能の開発プロセスにおいて、大規模言語モデル (LLM) の制御とガイダンスは常に中心的な課題の 1 つであり、これらのモデルが両方とも確実に機能することを目指しています。強力かつ安全に人類社会に貢献します。初期の取り組みは人間のフィードバックによる強化学習手法に焦点を当てていました (RL

OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる Jul 19, 2024 am 01:29 AM

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

arXiv 論文は「弾幕」として投稿可能、スタンフォード alphaXiv ディスカッションプラットフォームはオンライン、LeCun は気に入っています Aug 01, 2024 pm 05:18 PM

乾杯！紙面でのディスカッションが言葉だけになると、どんな感じになるでしょうか?最近、スタンフォード大学の学生が、arXiv 論文のオープンディスカッションフォーラムである alphaXiv を作成しました。このフォーラムでは、arXiv 論文に直接質問やコメントを投稿できます。 Web サイトのリンク: https://alphaxiv.org/ 実際、URL の arXiv を alphaXiv に変更するだけで、alphaXiv フォーラムの対応する論文を直接開くことができます。この Web サイトにアクセスする必要はありません。その中の段落を正確に見つけることができます。論文、文: 右側のディスカッションエリアでは、ユーザーは論文のアイデアや詳細について著者に尋ねる質問を投稿できます。たとえば、次のような論文の内容についてコメントすることもできます。

リーマン予想の大きな進歩!陶哲軒氏はMITとオックスフォードの新しい論文を強く推薦し、37歳のフィールズ賞受賞者も参加した Aug 05, 2024 pm 03:32 PM

最近、2000年代の7大問題の一つとして知られるリーマン予想が新たなブレークスルーを達成した。リーマン予想は、数学における非常に重要な未解決の問題であり、素数の分布の正確な性質に関連しています (素数とは、1 とそれ自身でのみ割り切れる数であり、整数論において基本的な役割を果たします)。今日の数学文献には、リーマン予想 (またはその一般化された形式) の確立に基づいた 1,000 を超える数学的命題があります。言い換えれば、リーマン予想とその一般化された形式が証明されれば、これらの 1,000 を超える命題が定理として確立され、数学の分野に重大な影響を与えることになります。これらの命題の一部も有効性を失います。 MIT数学教授ラリー・ガスとオックスフォード大学から新たな進歩がもたらされる

最初の Mamba ベースの MLLM が登場しました!モデルの重み、トレーニングコードなどはすべてオープンソースです Jul 17, 2024 am 02:46 AM

AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。はじめに近年、さまざまな分野でマルチモーダル大規模言語モデル (MLLM) の適用が目覚ましい成功を収めています。ただし、多くの下流タスクの基本モデルとして、現在の MLLM はよく知られた Transformer ネットワークで構成されています。

公理的トレーニングにより、LLM は因果推論を学習できます。6,700 万個のパラメータモデルは、1 兆個のパラメータレベル GPT-4 に匹敵します。 Jul 17, 2024 am 10:14 AM

LLM に因果連鎖を示すと、LLM は公理を学習します。 AI はすでに数学者や科学者の研究を支援しています。たとえば、有名な数学者のテレンスタオは、GPT などの AI ツールを活用した研究や探索の経験を繰り返し共有しています。 AI がこれらの分野で競争するには、強力で信頼性の高い因果推論能力が不可欠です。この記事で紹介する研究では、小さなグラフでの因果的推移性公理の実証でトレーニングされた Transformer モデルが、大きなグラフでの推移性公理に一般化できることがわかりました。言い換えれば、Transformer が単純な因果推論の実行を学習すると、より複雑な因果推論に使用できる可能性があります。チームが提案した公理的トレーニングフレームワークは、デモンストレーションのみで受動的データに基づいて因果推論を学習するための新しいパラダイムです。

See all articles

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

火山エンジンと大型モデルを使用してデータフライホイールを「点火」します