iFlytek は、1 月 30 日に Spark Cognitive Large Model の V3.5 アップグレード カンファレンスを開催します。 iFlytek の Liu Qingfeng 会長と Liu Cong 研究所長は、初の国家産業用コンピューティング能力トレーニングに基づいて iFlytek Spark V3.5 を正式にリリースしました。
iFlytekは、数兆のパラメータを持つ大規模モデルのトレーニングをサポートするWanka初の国内コンピューティングパワープラットフォーム「Flying Star One」を2023年10月24日にリリースし、正式に開始すると発表しました。発売から 90 日以上にわたり、iFlytek Spark は、「Flying Star One」に基づいて GPT-4 をベンチマークするために、より大きなパラメーターを使用した大規模なモデル トレーニングを開始し、その結果、1 月 30 日に iFlytek Spark V3.5 アップグレードがリリースされました。
National Open Large Model トレーニングに基づいて、National Open Large Model Fire V3.5 は、言語理解、テキスト生成、知識の質問と回答、論理的推論、数学的能力、コーディングの 7 つの側面で包括的な結果を達成しました。能力とマルチモーダル能力のアップグレード。その中で、言語理解と数学的能力は GPT-4 Turbo を上回り、コードは GPT-4 Turbo の 96% に達し、マルチモーダル理解は GPT-4V の 91% に達しました。
現在、iFlytek Spark は、China Pacific Insurance との協力、Spark Pacific Insurance との協力、および Spark Pacific を通じて、保険、銀行、エネルギー、自動車、通信などの分野の大手企業に力を与えています。社内のナレッジサービス、オフィス、監査、展示会業界などに権限を与え、保険分野でのデジタルレイバー適用のベンチマークを作成する計画であり、交通銀行と共同で顧客サービス、展示会業界、オフィス、研究、展示会業界などに権限を与える。銀行分野におけるコード機能のアプリケーションベンチマークの作成に焦点を当てた開発など、National Energy Group と共同で、石炭における中央企業グループの統合連携のための大規模なモデルアプリケーションベンチマークを作成できるようにする。国家エネルギーグループと協力して石炭、電力、運輸、化学産業などに力を与え、中央企業グループの統合連携の大規模モデルを構築している。アプリケーションのベンチマーク。
さらに、国内のコンピューティング能力に深く適応した「iFlytek Spark オープンソース大規模モデル」が初めてリリースされ、最先端のシーンアプリケーション効果を備え、Shengsi オープンソースコミュニティが共同でこれを立ち上げました。オンライン。
このオープン ソースには、基本モデル iFlytekSpark-13B-base、微調整モデル iFlytekSpark-13B-chat、およびファイン モデルを含む 1 億 3,000 万個のパラメータ (13B) があります。 -チューニングツールiFlytekSpark-13B-Lora、パーソナリティカスタマイズツールiFlytekSpark-13B-Charter。学術企業の研究は、フルスタックの自律的で制御可能な Spark 最適化スイートに基づいて、独自の専用の大規模モデルをより簡単にトレーニングできます。
Liu Qingfeng 氏は、Spark オープンソースの大規模モデルがテクノロジーにおいて差別化された利点を形成していることを明らかにしました。 Spark Open Source-13B は、テキスト生成、言語理解、テキスト書き換え、業界 Q&A、機械翻訳などの一般的なエンタープライズ シナリオにおいて、綿密な調査と分析を通じて、多くのよく知られた公開評価タスクの中で最高の評価を受けています。学習支援や言語理解などの分野での最適化により、パフォーマンスが大幅に向上し、複雑な自然言語タスクを処理する際にさらに便利になりました。
「Flying Star One」トレーニングに基づいた、Spark オープンソース大規模モデルのフルスタック国内適応と最適化は、シンプルで使いやすく、優れたシーン アプリケーション効果を備えています。トレーニング戦略は非常に最適化されています。 Ascend のコンピューティング能力が向上し、トレーニング効率は A100 90% に達します。これは、Ascend AI ハードウェアのさらに徹底的な最適化であるだけでなく、国内のコンピューティング能力が国際的な先進レベルに追いつく決意と能力を示しています。
オープンソースは、より多くのシナリオが実装された場合にのみ、生態学的協力をさらに強化できます。現在、Huawei Shengsi オープンソース コミュニティは、Spark Large Model Open Source Version-13B を正式に開始しました。これは学術および企業研究に完全に無料であり、学術協力と産業探査を同時に強化します。
2024 年の iFlytek Spark 大型モデルの開発を楽しみにしている Liu Qingfeng 氏は、次の 3 つの点を指摘しました。「まず、一般的な大型モデルの基礎となる機能を最先端の国際レベルと比較してベンチマークし続ける必要があります。アルゴリズムの研究から小規模な計算の組み込みまで、そのギャップを理解するには頭が冴えて合理的でなければなりません。現在、小サンプルの高速トレーニング、マルチモーダルディープラーニングなどの分野では、GPT-4 の最高レベルとの間にはまだギャップがあります。 iFlytek Spark は、今年上半期に現在の最高レベルの GPT-4 に追いつくことができると確信しています。 「今日の一般的な大規模モデルは、必ずしも人工知能の将来全体を表しているわけではありません。脳科学の相互作用、敵対的ネットワークの深い接続など、やるべきイノベーションはまだたくさんあります。これらには革新的なエコシステム全体が必要ですが、私たちは前に進む勇気と期待を持たなければなりません。最前線で」とLiu Qingfeng氏は指摘した。
「第二に、2024 年には、業界用途だけでなく、多くの主要な技術革新における大型モデルの連携においても、大型モデルの質と量を真に本格的に開始する必要があります。中国のビジネス界「
「第三に、高層ビルは安全で制御可能なプラットフォーム上に建設されなければなりません。また、私たちは独立した制御可能なプラットフォーム上で生態学的繁栄を達成しなければなりません。」Liu Qingfeng同氏は、アルゴリズムやデータ、アプリケーションシナリオからコンピューティングパワーに至るまで、完全に自律的で制御可能な豊かな人工知能エコシステムを構築するという目標を達成できると確信していると述べた。
以上が国家コンピューティングパワープラットフォーム「Flying Star One」トレーニングに基づいた iFlytek Spark V3.5 が正式リリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。