国内大型モデルは長期稼働期に入り、パラメータ優先から実用優先へ。
9 月 7 日、2023 Tencent Global Digital Ecology Conference で Tencent の Hunyuan 大型モデルが正式に発表され、これを外部の世界に公開すると発表しました。テンセントクラウド。
Tencent Hunyuan Large Model は、Tencent Full Link が自社開発したユニバーサル大規模言語モデルであり、1,000 億を超えるパラメータスケールと事前トレーニングを備えています。 20,000 を超える Yitoken のコーパスは、強力な中国語作成能力、複雑な文脈における論理的推論能力、および信頼できるタスク実行能力を備えています。
Tencent の渾源モデルは、「実践から生まれ、実践に向かう」実践レベルのモデルであることは注目に値します。 Tencent Cloud、Tencent Advertising、Tencent Games、Tencent Financial Technology、Tencent Conference、TencentDocuments、WeChat Souyisou、QQ Browser を含む 50 を超える Tencent のビジネスと製品が、Tencent Hunyuan 大型モデルに接続されてテストされ、初期の目標を達成しました。結果。 。
Hunyuan の大規模モデルは Tencent Cloud MaaS サービスのベースとして機能することがわかっており、顧客は API を通じて Hunyuan を直接呼び出すことができるだけでなく、 Hunyuan をベース モデルとして使用して、さまざまな産業シナリオ向けの専用アプリケーションを構築します。
テンセント グループの上級執行副社長兼クラウドおよびスマート インダストリー グループの CEO、Tang Daosheng 氏は次のように述べています。 「インテリジェンスは次のテクノロジーになりつつあります。デジタル開発の重要な推進力は、業界の問題点を解決するための新しいアイデアももたらします。最大の価値を生み出すには、大規模なモデルが産業シナリオに基づいており、企業データと統合される必要があります。」
Jiuweigong、自社開発のフルリンク技術
Jiang 氏によるとTencent Group 副社長 Jie 氏 Tencent Hunyuan の大型モデルは、最初のトークンからゼロからトレーニングされ、モデル アルゴリズムから機械学習フレームワーク、AI インフラストラクチャに至るフルリンクの自社開発テクノロジーを習得しました。
Tencent グループ副社長 Jiang Jie
2021 年から Tencent はスタートしますは、数千億、数兆のパラメータを備えた大規模なスパース NLP モデルを次々と発表し、CLUE ランキングの 3 つの主要記録を破り、中国語理解能力における新たなブレークスルーを達成しました。
#現時点では、業界における大型モデルの適用はまだ限られており、主に耐障害性が高く単純なタスクを伴うレジャーシーンに焦点が当てられています。 Tencent は、モデルの信頼性と成熟度を向上させるために、アルゴリズム レベルで一連の自己研究革新を実施しました。大規模なモデルが「意味不明」になりやすいという問題に対応して、Tencent は事前トレーニング アルゴリズムと戦略を最適化し、Hunyuan の錯覚を大きくしました。主流のオープンソースよりも優れたモデル 大規模なモデルが 30% から 50% 削減されました; 強化学習手法を通じて、モデルはトラップの問題を特定することを学習できます; 位置コーディングの最適化を通じて、非常に長いドキュメントの処理効果とパフォーマンスが向上しました; 大規模なモデルが人間と同じように実際のアプリケーション シナリオに基づいて推論し、意思決定できるようにするための思考連鎖の新しい戦略が提案されました。
さらに、テンセントは独自の機械学習フレームワーク Angel も開発しました。これは、業界の主流フレームワークと比較して、トレーニング速度が 2 倍、推論速度が 1.3 倍になります。回。
Tencent Hunyuan 大型モデルのフルリンク自己調査
を取得テンセントの自社開発したフルリンク技術のおかげで、テンセントのHunyuan大型モデルは文脈の意味を理解し、長い文章を記憶する能力があり、専門分野で複数ラウンドの会話をスムーズに行うことができます。さらに、文学作品、テキストの要約、ロールプレイなどのコンテンツを作成して、ユーザーの意図を完全に理解し、タイムリーな応答を効率的かつ正確に提供することもできます。
中国情報通信技術院の「大規模事前学習モデル技術と応用の評価方法」の標準準拠テストでは、合計能力項目に関しては、「モデル開発」と「モデル能力」という 2 つの重要な分野の総合評価で、現時点で最高のスコアを獲得しました。主流の評価セット MMLU、CEval、AGI-eval では、Hunyuan ラージ モデルは、特に中国科学、大学入試問題、数学、その他の下位項目
で優れたパフォーマンスを発揮します。 上海財経大学学長の劉源春氏は次のように考えています。産業チェーン、人材チェーン、テクノロジー チェーン、イノベーション チェーン。そして最終的に、一般的な人工知能を開発するための中国の道を見つけ、デジタル テクノロジー イノベーションにおける画期的な進歩を達成するのに役立ちます。」 ##Tencent は大規模モデルを全面的に採用 Jiang Jie 氏は次のように述べています。「大規模モデル開発における私たちの目標は、高いスコアを獲得することではありません」評価ではなく、実際のシナリオにテクノロジーを適用するためです。テンセントはこの大きなモデルを全面的に採用します。」 今回のカンファレンスで、Jiang Jie 氏は次のことを示しました。 Tencentカンファレンス、Tencentドキュメント、Tencent広告など。TencentのHunyuan大規模モデルにアクセスした後の複数のビジネスの実際のアプリケーション。 たとえば、Tencent Conference は、Hunyuan の大規模モデルに基づいて AI アシスタントを作成しました。簡単な自然言語命令だけで、会議情報の抽出とコンテンツ分析を完了できます。など。複雑なタスクの場合は、会議後にインテリジェントな要約議事録を生成できます。実際の測定によると、Hunyuan 大型モデルは、指示の理解、会議中の Q&A、会議の概要、会議の To-Do 項目など、多くの面で高いユーザー採用率を達成しています。 #Tencent カンファレンスにおける Tencent Hunyuan 大規模モデルの適用 # 点では、 Tencent Hunyuan の大型モデルは、文書処理において数十のテキスト作成シナリオをサポートしており、Tencent Documents が開始したインテリジェント アシスタント機能で使用されています。同時に、Hunyuan はワンクリックで標準形式のテキストを生成することもでき、何百もの Excel の数式に精通しており、自然言語生成関数をサポートし、表の内容に基づいてグラフを生成します。これらの関数は現在内部テスト段階にあり、今後提供される予定です。成熟するとユーザーに公開されます。 広告ビジネス シナリオでは、テンセントの渾源モデルは、業界や地域の特性に適応し、何千ものユーザーのニーズを満たすことができるインテリジェントな広告素材の作成をサポートします。テキスト、写真、ビデオの自然な統合を実現します。さらに、Hunyuan 大型モデルの機能に基づいて、インテリジェント ショッピング ガイドを広告することで、企業の WeChat などのシナリオで販売者がサービスの品質と効率を向上させることができます。 # 理解されていますTencent Cloud は今年 6 月に Model as a Service (MaaS) ソリューションを開始し、モデルの事前トレーニング、モデルの微調整、インテリジェントなアプリケーション開発をカバーするワンストップの業界大規模モデル サービスを提供しました。 最近、Tencent Cloud は、Llama 2 や Bloom などの 20 以上の主流モデルにも完全に統合されており、Hunyuan と同様に、それらはすべて直接展開呼び出しをサポートしています。お客様は、Hunyuan に基づいて独自の独自のインダストリ モデルを作成したり、実際のニーズに基づいてオープン ソース モデルを作成したりできます。
以上がTencentが自社開発したHunyuan大型モデルが正式に公開され、Tencent Cloudを通じて外部に公開されるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。