大規模モデルの開発には限界があり、説明可能な AI 理論の作成が必要です-AI-php.cn

ホームページ

テクノロジー周辺機器

大規模モデルの開発には限界があり、説明可能な AI 理論の作成が必要です

王林

Jan 16, 2024 pm 10:00 PM

大型モデル説明可能なAI

GPT-4 の制限は、GPT-4 が対話できるのはデジタル世界のみであり、最終的には物理世界と対話する必要があることです。このため、ロボットの出現は身体化された知能の実現を意味するため、特に重要です。 Zhang Bo氏は、人型ロボットを開発する必要はなく、過度に複雑なハードウェアも必要としないと指摘した。彼は、特定のハードウェアに基づいて強化学習研究を実施することを提唱しています。このようなアプローチにより、元の意味を変更することなく微調整が可能になります。

全世界が大型モデルの強力な機能と可能性に驚いていますが、その理由は説明できず、それが「出現」現象によるものであると考えることしかできません。人工知能産業の健全な発展のためには、科学研究、技術革新、産業発展を統合する必要があります。第 3 世代の人工知能を開発するには、説明可能で堅牢な理論と手法が確立されなければなりません。そうでなければ、AI テクノロジーは決して説得力を持たないでしょう。

大規模モデルの開発には限界があり、説明可能な AI 理論の作成が必要です

大規模な言語モデルには上限があります。

一般的な人工知能への道は依然として困難ですが、大規模な言語モデルは AI 業界に大きな道を切り開きました。 Zhipu AI 2024 Annual Technology Open Day で、学者の Zhang Bo 氏は、大規模モデルは一般的なハードウェアとソフトウェアの開発の機会を提供すると述べました。

従来の AI パラダイムは、特定のタスクを完了するために特定のアルゴリズムとルールを使用します。生成 AI パラダイムは、基本モデルと呼ばれる一般的なモデルに基づいており、広範なテキストデータトレーニングを通じてオープンドメイン (オープンドメイン) でトレーニングされます。人間レベルに近い高品質のテキスト、画像、その他のコンテンツを生成でき、微調整などの方法で幅広い下流タスクに適応できます。生成 AI は一般的な AI への一歩を踏み出し、第 2 ステップは AI エージェント、そして第 3 ステップは身体化されたインテリジェンスです。 Zhang Bo氏は、GPT-4はデジタル世界にしか対応できず、最終的には物理世界にも対応しなければならず、それにはロボット、つまり身体化された知性が必要になると語った。身体化されたインテリジェンスの提案は、完全なインテリジェントエージェントを構築するのに役立ち、インテリジェントエージェントが知覚と思考の両方を行うことができるようになります。「人型ロボットを作る必要はありません。多くの場合、必要なのは手や足だけであり、ハードウェアをそれほど複雑にする必要はないからです。」同氏は、特定のハードウェアに基づいて強化学習の研究を行うことを提唱しています。

生成 AI の大規模モデルには、3 つの主要な機能と 1 つの主要な欠点があります。 1 つ目は強力な生成機能で、さまざまなコンテキストや過去の会話を含む一貫したテキストを生成する能力で人々を驚かせます。次に、強力な移行機能を備えています。つまり、エージェントタスクのトレーニングと微調整を通じて、対象の下流タスクに適用できます。 3 つ目は、人間とコンピューターの対話、複数のエージェント間の対話、環境との対話などの強力な対話機能であり、AI がさまざまな分野で人間と同等の知能レベルを発揮できるようになります。ただし、これらの大きなモデルには、錯覚という欠点もあります。場合によっては、理にかなっているように見える、でっちあげの答えや意味不明な答えを生成することがあります。

人工知能は経済成長の促進に貢献します建設、保守、設置などの業界は自動化や知能化が難しいですが、管理管理などのホワイトカラーの仕事はAIに代替される可能性があります。 AI は人間のほとんどの仕事の質と効率を向上させることができますが、AI に完全に置き換えられる仕事はまだ少数です。 AI がまだほとんどの仕事を置き換えることができない理由は、大規模モデルにはまだ乗り越えられない上限があるためです。 Zhang Bo氏は、大規模モデルのすべての作業はプロアクティブではなく外部からのプロンプトであり、人間の作業は内部の意図によって駆動されるのに対し、確率的予測を使用して外部からのプロンプトの下でタスクを完了すると述べた。大規模言語モデルで生成される言語と人間の言語生成は動作が似ているだけで、内部メカニズムは根本的に異なります。大規模言語モデルには、無認識、制御不能な品質、信頼性のなさ、堅牢性のなさなどの上限があります。異なるプロンプト単語が与えられます。大規模モデルは異なる答えを出力します。大きな模型も幻覚を引き起こす可能性があります。「模型がどれほど大きくても、幻覚という欠点は常に存在します。」

同氏は、第 3 世代の人工知能を開発するには、説明可能で堅牢な人工知能の理論と手法を確立し、安全で制御可能、信頼性があり、信頼性が高くスケーラブルな AI 技術を開発し、AI の革新的な応用と産業化を促進する必要があると提案しました。説明可能で堅牢な人工知能理論が確立できなければ、AI 技術は信頼性を失い、決して信頼できるものではなくなります。「これまで、この理論は確立されていないため、人工知能の開発は遅く、曲がりくねっています。この理論が確立できない理由は、3 つの特定の制限があるためです。以前は、特定のモデルしか使用できませんでした」特定の分野の特定の課題を解決するには、どのようにして一般理論を確立することができるのでしょうか? 大きなモデルの出現により、この理論が確立される可能性が得られます。」

Zhang Bo 氏は、大型モデルは一般的なハードウェアとソフトウェアを開発する機会を提供してくれると述べました。人工知能は着実な発展段階に入り、あらゆる分野に多大な影響を及ぼしており、私たちは人工知能産業を発展させるチャンスを掴まなければなりません。しかし、AIは予測不可能で制御できないため、依然として多くの不確実性があります。全世界が大規模モデルの強力な生成、移行、および対話機能に驚いていますが、それを説明することはできず、それを「創発」のせいにすることしかできません。したがって、人工知能産業の健全な発展のためには、科学研究、技術革新、産業発展を組み合わせる必要があります。

以上が大規模モデルの開発には限界があり、説明可能な AI 理論の作成が必要ですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7467

CakePHP チュートリアル

1376

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

ビッグモデルアプリ Tencent Yuanbao がオンラインになりました! Hunyuan がアップグレードされ、どこにでも持ち運べるオールラウンドな AI アシスタントが作成されました Jun 09, 2024 pm 10:38 PM

5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアンアプレットバージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネスシナリオにおける豊富で大規模なポーランドテクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Jun 05, 2024 pm 07:59 PM

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグモデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

Shengteng AI テクノロジーを使用した秦嶺・秦川交通モデルは、西安のスマート交通イノベーションセンターの構築を支援します Oct 15, 2023 am 08:17 AM

「高度な複雑性、高度な断片化、およびクロスドメイン」は、輸送業界のデジタル化およびインテリジェントなアップグレードに向かう上で常に主要な問題点でした。最近、チャイナビジョン、西安雁塔区政府、西安未来人工知能コンピューティングセンターが共同で構築したパラメータースケール1000億の「秦嶺・秦川交通モデル」は、スマート交通・交通分野を指向している。西安とその周辺地域にサービスを提供しており、この地域はスマート交通イノベーションの拠点となるでしょう。「秦嶺・秦川交通モデル」は、オープンシナリオにおける西安の膨大な地元交通生態データ、中国科学ビジョンが自社開発したオリジナルの高度なアルゴリズム、そして西安未来人工知能コンピューティングセンターのShengteng AIの強力なコンピューティング能力を組み合わせたものです。道路網の監視を提供するため、緊急指令、メンテナンス管理、公共交通機関などのスマートな交通シナリオは、デジタルでインテリジェントな変化をもたらします。交通管理には都市ごとに異なる特徴があり、道路の交通状況も異なります。

NVIDIA の大規模モデル推論フレームワークを明らかにする: TensorRT-LLM Feb 01, 2024 pm 05:24 PM

1. TensorRT-LLM の製品位置付け TensorRT-LLM は、NVIDIA が開発した大規模言語モデル (LLM) 向けのスケーラブルな推論ソリューションです。 TensorRT 深層学習コンパイルフレームワークに基づいて計算グラフを構築、コンパイル、実行し、FastTransformer の効率的なカーネル実装を利用します。さらに、デバイス間の通信には NCCL を利用します。開発者は、カットラスに基づいてカスタマイズされた GEMM を開発するなど、技術開発や需要の違いに基づいて特定のニーズを満たすためにオペレーターをカスタマイズできます。 TensorRT-LLM は、NVIDIA の公式推論ソリューションであり、高いパフォーマンスを提供し、実用性を継続的に向上させることに尽力しています。 TensorRT-LL

GPT-4をベンチマーク！中国移動の九天大型モデルが二重登録を通過 Apr 04, 2024 am 09:31 AM

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタックローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータバージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

新しいテストベンチマークがリリース、最も強力なオープンソースのLlama 3が困惑 Apr 23, 2024 pm 12:13 PM

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

産業ナレッジグラフの高度な実践 Jun 13, 2024 am 11:59 AM

1. 背景の紹介まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータガバナンスの普及により、より効率的なデータガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

Xiaomi Byteが力を合わせます！ Xiao Ai の Doubao へのアクセスの大規模モデル: 携帯電話と SU7 にすでにインストールされています Jun 13, 2024 pm 05:11 PM

6月13日のニュースによると、Byteの「Volcano Engine」公開アカウントによると、Xiaomiの人工知能アシスタント「Xiao Ai」はVolcano Engineとの協力に達し、両社はbeanbao大型モデルに基づいて、よりインテリジェントなAIインタラクティブ体験を実現するとのこと。。 ByteDance が作成した大規模な豆包モデルは、毎日最大 1,200 億のテキストトークンを効率的に処理し、3,000 万個のコンテンツを生成できると報告されています。 Xiaomi は、Doubao 大型モデルを使用して、独自モデルの学習能力と推論能力を向上させ、ユーザーのニーズをより正確に把握するだけでなく、より速い応答速度とより包括的なコンテンツサービスを提供する新しい「Xiao Ai Classmate」を作成しました。たとえば、ユーザーが複雑な科学的概念について質問する場合、&ldq

See all articles

大規模モデルの開発には限界があり、説明可能な AI 理論の作成が必要です

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック