この記事では、Tencent が独自に開発したユニバーサル大規模言語モデル、つまり Hunyuan ラージ モデルについて理解していただきます。
2023 年 9 月 7 日朝、テンセント グローバル デジタル エコロジー カンファレンスで、テンセント グループ上級副社長兼テンセント クラウドおよびスマート インダストリー グループ CEO の唐道生氏は、テンセントが「完全な時代」に突入すると発表しました。ビッグモデルの採用」と同時に、Tencent が独自に開発した汎用大規模言語モデルである Hunyuan が業界に正式に公開されたことが発表されました。 Tencent 関係者によると、Hunyuan モデルの中国機能は GPT3.5 を超えています
Hunyuan モデルのリリース後は、Tencent Cloud MaaS サービスの基盤として機能し、ユーザーは Tencent Cloud を通じてそれを体験できますAPI インターフェイスを呼び出すことにより、Hunyuan をベース モデルとして使用し、企業の実際のニーズに応じてパブリック クラウド上でカスタマイズすることもできます。
1. Hunyuan モデルの概要
2. 請求
Tencent Hunyuan モデルは、ホワイトリスト A で実名認証された Tencent Cloud エンタープライズ アカウントに提供されます。合計 100,000 の無料通話トークンが利用可能です。企業がサービスをアクティブ化すると、対応する無料クォータを使用できるようになります。このように、最初に体験してニーズを満たすかどうかを確認し、その後の請求コストを検討することができます。
インターフェースの現在の価格は、依然としてかなりリーズナブルです。企業の無料割り当てが使い果たされると、次の価格で請求されます。Tencent Hunyuan Large Model Premium Edition の料金は、1,000 トークンあたり 0.14 元です。 (トークン1個に相当し、漢字1文字または英字3文字に相当します。合計すると1.4セントで2~3回程度のインターフェース呼び出しが完了します。)
決済方法は後払い日払い方式を採用しております。ユーザーアクティベーション申請書を提出し、合格した後は、サービス規定に従ってサービスを使用することができ、Tencent Cloud 担当者が実際の使用量に基づいて請求し、対応する相当額をアカウントから直接差し引きます。
3. コンピューティング能力
公式ニュースによると、テンセントの渾源モデルには現在 1,000 億を超えるパラメーターと 2 兆を超えるトークンの事前トレーニング コーパスが含まれています。中国語の理解力、創造力、論理的思考力など。
写真
4. 現在のアクセス環境シナリオ
Tencentグループ副社長のJiang Jie氏はメディアのインタビューでこう語った。現在、Tencent Cloud、Tencent Advertising、Tencent Games、Tencent Financial Technology、Tencent Meetings、Tencent Documents、WeChat Souyisou、QQ Browser を含む 50 以上の Tencent のビジネスと製品がすべて Tencent Hunyuan 大型モデルでテストされ、次のような成果を達成しています。暫定結果 結果は有望であり、将来の開発の見通しも非常に有望です。
5. Hunyuan Large Model の利点
Tencent Hunyuan Large Model は、複数のシナリオで超長いテキストを処理できるようになりました。位置コーディング最適化テクノロジーにより、Hunyuan Large Model は長いテキストを処理できます。 . 処理とパフォーマンスが向上しました。さらに、Hunyuan の大規模モデルには「罠」を識別する機能もあり、簡単に言えば、強化学習手法による「誘導」を拒否します。
簡単な例: ユーザーが答えるのが難しい、または不可能な質問をする場合、そのようなセキュリティ ガイダンスの質問に対する拒否率は 20% 増加する可能性があります。これにより、エラーや無効な回答が大幅に減少し、Tencent AI 大型モデル自体が回答する内容の信頼性が高まります。これは Tencent AI の大規模モデルのハイライトでもあります
6. Hunyuan 大規模モデルの典型的なアプリケーション - Tencent Hunyuan Assistant
写真
写真
以上がこの記事では、Tencent が独自に開発したユニバーサル大規模言語モデル、つまり Hunyuan ラージ モデルについて理解していただきます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアン アプレット バージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。 、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネス シナリオにおける豊富で大規模なポーランド テクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタック ローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータ バージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

1. 背景の紹介 まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータ ガバナンスの普及により、より効率的なデータ ガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

Tencent QQデスクトップクライアントは一連の抜本的な改革を経たと理解されています。高いメモリ使用量、大きすぎるインストール パッケージ、遅い起動などのユーザーの問題に対応して、QQ 技術チームはメモリに関する特別な最適化を行い、段階的に進歩してきました。最近、QQ 技術チームは InfoQ プラットフォームに関する紹介記事を公開し、メモリの特別な最適化における段階的な進歩を共有しました。レポートによると、QQ の新バージョンのメモリの課題は主に次の 4 つの側面に反映されています。 製品形式: 複雑な大型パネル (さまざまな複雑さの 100 以上のモジュール) と一連の独立した機能ウィンドウで構成されます。ウィンドウとレンダリングプロセスは 1 対 1 に対応しており、ウィンドウプロセスの数は Electron のメモリ使用量に大きく影響します。その複雑な大型パネルの場合、

6月13日のニュースによると、Byteの「Volcano Engine」公開アカウントによると、Xiaomiの人工知能アシスタント「Xiao Ai」はVolcano Engineとの協力に達し、両社はbeanbao大型モデルに基づいて、よりインテリジェントなAIインタラクティブ体験を実現するとのこと。 。 ByteDance が作成した大規模な豆包モデルは、毎日最大 1,200 億のテキスト トークンを効率的に処理し、3,000 万個のコンテンツを生成できると報告されています。 Xiaomi は、Doubao 大型モデルを使用して、独自モデルの学習能力と推論能力を向上させ、ユーザーのニーズをより正確に把握するだけでなく、より速い応答速度とより包括的なコンテンツ サービスを提供する新しい「Xiao Ai Classmate」を作成しました。たとえば、ユーザーが複雑な科学的概念について質問する場合、&ldq

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A
