7 月 5 日、2024 年世界人工知能会議の「信頼できる大規模モデルは産業イノベーションと開発に役立つ」フォーラムで、Ant Group は自社開発の Bailing モデルの最新の開発進捗状況を発表しました。Bailing モデルには「見る」機能があります。 「聞く」、「話す」、「描く」というネイティブのマルチモーダル機能により、オーディオ、ビデオ、画像、テキストなどのマルチモーダル データを直接理解してトレーニングできます。ネイティブ マルチモダリティは、AGI を実現する唯一の方法であると考えられています。中国では、この機能を実現しているのは少数の大手モデル メーカーだけです。記者はカンファレンスでのデモンストレーションから、マルチモーダル技術によって大型モデルがより人間のように認識し、対話できるようになり、Bailing のマルチモーダル機能が「Alipay Intelligent Assistant」に適用され、インテリジェントボディエクスペリエンスのアップグレードがサポートされることがわかりました。将来的には、Alipay でのよりインテリジェントなエージェントのアップグレードをサポートします。
1. (Ant Group 副社長の Xu Peng 氏が、Bailing Large Model のネイティブ マルチモーダル機能を紹介しました)発表会場では、Ant Group 副社長 Xu Peng が、新たにアップグレードされたマルチモーダルのさらに多くのアプリケーション シナリオをデモンストレーションしました。テクノロジーは次のことを実現できます:
Bailing の大規模モデルのマルチモーダル機能に基づいて、Ant Group は業界に大規模なアプリケーションを導入する実践を模索してきました。
フォーラムで同時に公開された「Alipay Multi-modal Medical Model」は、この探求の実践です。 Alipay のマルチモーダル医療モデルには、レポート、画像、医薬品、その他のマルチモーダル情報を含む数百億の中国語と英語のグラフィックスとテキスト、数千億の医療テキスト コーパス、および数千万の高度な情報が追加されていると理解されています。質の高い医療知識マップ、専門的な医療知識を持ち、中国医学LLM評価リストであるpromptCBLUEのAリストで1位、Bリストで2位にランクされています。
Bailing 大型モデルのマルチモーダル機能に基づいて、Ant Group と武漢大学が共同開発したリモート センシング モデルである SkySense もフォーラムでオープンソース計画を発表しました。 SkySense は現在、最大のパラメータスケール、最も包括的なタスク範囲、および最高の認識精度を備えたマルチモーダルリモートセンシング基本モデルです。
「単一テキストの意味理解からマルチモーダル機能まで、これは人工知能テクノロジーの重要な反復であり、マルチモーダルテクノロジーによって生み出される「見る、聞く、書く、描く」というアプリケーションシナリオにより、AIのパフォーマンスが向上します。現実的であり、人間に近づくために、Ant はネイティブのマルチモダリティ技術の研究開発に投資し続けます」と Xu Peng 氏は述べました。
以上がAnt Bailing 大規模モデルの最新の進歩: すでにネイティブのマルチモーダル機能を備えていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。