最近、AI 分野の誰もが考えていることは 1 つあります。業界で大規模なマルチモーダル モデルを実装する最善の方法は何でしょうか? 汎用人工知能の時代が到来 AIラージモデル技術は、デジタル経済におけるインフラ構築の重要なサポートとなり、また、社会の核となる「エンジン」となっています産業のインテリジェントな変革 AI 大型モデルの産業応用により、前例のない開発の機会が到来しました。 10月28日に開催されたCNCC 2023「Super Intelligence Fusion AI Large Model Application Implementation Development Forum」において、Sophon Engineは「Yuancheng Xiang Chatimg3.0」をリリースし、最新の機能を披露しました。マルチモーダル汎用生成モデル「Yuancheng Xiang Chatimg3.0」の進捗と実装の検討。 Chatimg3.0のコアテクノロジーのアップグレードと反復Yuancheng Xiang Chatimg3。 0 超微細な認識と幻覚の少ない大型マルチモーダルモデルであり、マルチ画像理解、物体位置決め、OCR などの機能もサポートしています。 Chatimg3.0 はハードウェア デバイスに頭脳を装備し、より自然でスムーズなヒューマン マシン コミュニケーションを可能にし、産業アプリケーションを強化する AI マルチモーダル大規模モデルの強固な基盤を築きます。 Chatimg2.0 と比較して、Chatimg3.0 は主に 2 つの点でアップグレードされています。その 1 つは事前学習の第 1 段階 (記述、検出、OCR およびその他のマルチ機能) です。タスク トレーニング ) と指導の微調整の第 2 段階 (高品質の手動による精密スクリーニング指導セット)。 マルチモーダル大規模モデルの機能をより適切に評価するために、Sophon Engine は説明、推論、検出、質問からなる新しいマルチモーダル対話テスト セットを構築しました。モデル能力をQ&A、ビジネスの5つの側面から評価し、Q&A、ビジネス能力の点でGPT-4Vに追いつき、国産大型モデルの優れた開発可能性を示した。
テストにおける GPT-4V と比較した Chatimg3.0 の具体的なパフォーマンスは次のとおりです:
# 左: Chatimg3.0、右: GPT-4V。 ##推論:
テスト:
# 左: Chatimg3.0、右: GPT-4V。
# 问答:
左: Chatimg3。 0、右:GPT-4V。
##現在、Sophon Engineは「Yuancheng Xiang Chatimg3.0」をグローバルな予防・制御やドローン検査などの分野に適用しており、ドローンや電子プローブなどのフロントエンドセンシング機器との統合により、従来の検査と検査をアップグレードしています。セキュリティは、AIの欠陥特定、異常検出、動作分析、主要監視、自律検査、リスク予測などの機能を実現し、AIエンジニアリングの革新プロセスを促進します。
中国初のマルチモーダル大型モデル R&D チームとして、Sophon Engine は人材と技術において生来の優位性を持っているだけでなく、複数の有名な投資機関や IT 業界のリーダーからのエンジェル投資によって、会社を「さらに成長させた」強力です。」 iSoftStone、ChinaSoft Technology、その他の有名企業の協力を得て、「Yuancheng Xiang Chatimg3.0」によって開発された「Sophon Sky」と「Sophon」 Skyscanner」システムは、発売されるとすぐに業界の注目を集めました。この製品は、都市ガバナンス、スマートパワー、パイプライン検査、公園管理、農業、金融、その他の産業アプリケーションシナリオですぐに使用され、徐々に試験運用を開始しています。展開。
今後、大規模モデル業界アプリケーションの実装を加速し、デジタル経済の持続可能な発展を促進するために、Sophon Engine はモデルのトレーニングと機能を強化し続けます。業界トップの人材と有利なリソースを集め、大型モデルの産業アップグレードをサポートする努力を惜しみません。コアモデル「Yuancheng Xiang Chatimg」は、今後もAIエージェント、身体化インテリジェンスなどの方向で努力を続け、業界の注目をさらに集めるだろう。 以上がYuanchengxiang Chatimg3.0: GPT-4V を超える産業アップグレードのための新しい戦略の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。