著者 | Xu Jiecheng
レビュアー | Yun Zhao
GPT4 の早期リリースは、Baidu に大きなプレッシャーを与えます。 ChatGPT がチャットボットの分野に爆発的な影響を与えてから数か月後、私たちはついに中国初の生成対話製品を導入しました。
3月16日14時、Baidu Wenxinyiyan記者会見がBaidu北京本社で正式に開催されました。 Baidu の創設者、会長兼 CEO である Robin Li 氏も以前の約束を果たし、クールなテクノロジーを誰もが必要とする製品に変えました。
Wenxin Yiyan (英語名: ERNIE Bot) は、Wenxin 大型モデル技術に基づいて Baidu によって発売された生成対話製品であり、自然でスムーズな人間とコンピューターのインタラクションを実現できると報告されています。 . . Baidu の中核テクノロジーの 1 つである Wenxin 大型モデル ERNIE は、クロスモーダルおよびクロス言語の深い意味理解と生成機能を備えています。 Wenxinyiyan は ERNIE テクノロジーに基づいており、人工知能テクノロジーと人間の言語コミュニケーション機能の統合に成功しており、ユーザーに高品質でインテリジェントなインタラクティブなエクスペリエンスを提供できます。
現在、大規模言語モデルと生成 AI は、新しい技術パラダイムを生み出しており、世界中のすべての企業にとって見逃せないチャンスです。 Baidu Wenxinyiyan は、人工知能ベース モデルの強化プラットフォームとして位置付けられており、金融、エネルギー、メディア、政府事務など、何千もの業界のインテリジェントな変革を支援します。
記者会見で、ロビン・リー氏は、ウェン・シンイーヤンの5つのコア機能と、文学作品の作成、ビジネスコピーライティングの作成、数学的計算、中国語理解、マルチモーダル生成を含む5つの使用シナリオにおけるパフォーマンスをデモンストレーションしました。
文学創作の場面で、温信宜燕は有名な SF 小説「三体問題」の核となる内容を対話形式の質疑応答に基づいて要約し、複数の続編を提案しました。 「三体問題」へ 》ご提案とアイデア。さらに、文信宜燕は質問の内容に基づいて、「三体」の作者、「三体」のテレビシリーズの登場人物、その他の事実情報にも正確に答えた。
現在の生成 AI の主な欠点は、質問への回答の正確性を保証することが難しいことです。 Baidu の知識を強化した大規模モデルの概念を採用し、事実に関する質問の精度を大幅に向上させます。 「Yu Hewei と Zhang Luyi の共通点は何ですか?」「Yu Hewei と Zhang Luyi ではどちらが背が高いですか?」などの質問に直面した Wen Shinyiyan さんも、情報検索能力と推論能力を頼りに正しい答えを導き出しました。
ビジネスコピーライティングの現場で、温信宜燕は会社のネーミングを成功裏に完了し、会社のスローガン「会社設立プレスの執筆」を書きました。リリースやその他のクリエイティブなタスク。 3 回連続のコンテンツ作成で、Wen Xinyiyan はユーザーの意図を正確に理解しただけでなく、ユーザーのフィードバックを明確に表現することを完成させました。
これが、膨大なデータに基づいて起こる「知性の創発」です。報告によると、Wenxin Yiyan 大規模モデルのトレーニング データには、数兆の Web ページ データ、数十億の検索データと画像データ、毎日の数百億の音声通話データ、5,500 億の事実のナレッジ グラフなどが含まれています。中国語の理解と処理という点では、世界中の他のほとんどすべての大型モデルよりも優れています。
数学的計算に関して、温信宜燕は思考能力、数学的推論能力、論理的推論能力に頼って成功しました。完全 「同じ檻の中のニワトリとウサギ」など、人間の論理的思考を働かせる古典的な例への回答。
このリンクでは、Wen Xinyiyan は質問の問題を特定しただけでなく、人間のように問題の解決策を見つけることに成功し、正しい手順を段階的に実行しました。質問に対する正確な答え。
Wen Xinyiyan は、新世代の知識強化型大規模言語モデルとして、ERNIE および PLATO シリーズ モデルに基づいて開発されています。その主要テクノロジーには、教師あり微調整、人間のフィードバックによる強化学習、プロンプト、知識強化、検索強化、対話強化が含まれます。
最初の 3 つは、このような大規模な言語モデルで使用されるテクノロジであり、ERNIE と PLATO にも適用され蓄積され、Wen Xinyiyan でさらに強化され、洗練されています。 3 つの項目は、Baidu の既存の技術的優位性を再革新したものであり、Wen Xinyiyan の今後の成長の基礎でもあります。
温信宜燕の知識向上には、主に知識の内部化と知識の外部への応用が含まれます。知識の内部化は、大規模な知識とラベルのないデータからの意味単位学習、知識を使用したトレーニング データの構築、および知識のモデル パラメーターへの学習に基づいています。知識の外部応用とは、外部のマルチソースの異種知識を導入して、知識の推論、迅速な構築などを実行することです。
Wen Xinyiyan の検索機能強化は、意味的理解と意味的マッチングをコア技術とする新世代の検索アーキテクチャから生まれています。検索結果を導入することで、大規模モデルの参考情報をタイムリーかつ正確に提供し、ユーザーのニーズに応えます。
Wen Xinyiyan の対話強化は、対話テクノロジーとアプリケーションの蓄積に基づいており、Wen Xinyiyan にはメモリ メカニズム、コンテキスト理解、および対話の一貫性、合理性、論理性を向上させるための対話計画機能。
最近、多くの友人が私に「なぜ今日なの?本当に準備はできているの?」と尋ねます。実際、ある意味、私たちはこれに向けて長年準備をしてきました。私たちは 10 年以上前に AI 研究への投資を開始し、2019 年に文心ビッグ言語モデルを立ち上げました。今日の文心韻は、過去数年間にわたる私たちの取り組みの継続です。年。 「しかし、完全に準備ができているとは言えません。Wen Xinyiyan の ChatGPT に対するベンチマーク、さらには GPT-4 に対するベンチマークも非常に高いです。主要な世界的メーカーはまだ作成しておらず、Baidu が最初です。」私自身のテストでは、まだ多くの不完全な点があると感じています。個人の選択。
この記者会見を見て、誰もが私のことを持っていると思います。自分自身のさまざまな感情。最終的な分析として、ユーザー、特に文化コンテンツの分野では、国内のテクノロジー企業が実際に大規模な中国語コーパスを使用して、中国の環境により適したローカライズされた高品質の大規模モデルをトレーニングする必要があります。
今、百度は国内 AIGC のパイオニアとして、この分野で第一歩を踏み出しました。百度は今後この道をさらに突き進むことができるのか? より多くの優れた国内テクノロジー企業がこの地に足を踏み入れることになるのだろうか? こうした先駆者の集積の下で中国のAIGC生態系はどのような変化を遂げるのだろうか?様子を見ましょう。
以上がWen Xinyiyan が正式に社内招待を開始します!ロビン・リー: この経験は完璧ではありません。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。