ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く
智物
著者 | ZeR0
編集者 | 莫英
Zhidongxi は 5 月 18 日、Yuncong Technology が本日 Congrong モデルを発表し、質疑応答、提案文の作成、意図の理解、複数ラウンドの対話、英語のライティング、機械翻訳、プログラミング、クロスモーダルな画像と文章を理解し、実際の高校入試問題を解くことができる。大型モデルは現在、内部テスト段階にあります。
デモンストレーションによると、冷静モデルは、事前にアップロードされた約500~600ページの書籍「西洋美術史」について、書籍の関連内容を質問したり、どのような内容なのかを要約したりするなど、徹底的な理解を行いました。本だった、指定された要件の写真を見つけるなど。
昨年の高校入試の実際の問題に答えるための Convergence ラージ モデル、ChatGPT、および GPT-4 の能力をテストした結果、Yuncongcong は ChatGPT よりも速く、歴史と生物学の質問の解答スコアは ChatGPT よりわずかに低かった、地理の質問への回答のスコアは ChatGPT よりわずかに低かったですが、スコアは ChatGPT と同じで、政治的な質問、倫理、法律に関する質問への回答のパフォーマンスは ChatGPT よりも優れていました。 GPT-4.0 の現在のレベルは、他のシステムよりも大幅に優れています。
現場では、Big Model Information and Innovation Ecological Alliance が正式に設立され、そのメンバーには Youked、厦門文化観光、Huawei Shengteng、Nansha Public Control、CSDN、Zhongshu Information Technology などが含まれており、イノベーションとイノベーションの促進を目的としています。大型モデル技術の開発、さまざまな業界での人工知能の応用を促進します。
Yunchong Technology は、CCIC、Shenzhou Information、Shenzhen News、Jiadu Technology、Jin Shiyuan、Youzu Networks、Aiden Technology とも協力して、高品質モデル、金融モデル、エンターテイメント モデル、輸送モデルを立ち上げる予定です。 、大型ゲームモデル、大型医療モデルなど。
1. 基本的な能力の実証: 画像とテキストのクロスモーダル理解をサポートし、ChatGPT よりも早く中間試験の問題に答えることができます
Congrong Large Model の対話インターフェイスは ChatGPT に似ています。 Yunchong Technology の技術管理部門のディレクターである Ye Mao 氏は、Rongrong 大型モデルの基本的な機能を現場でデモンストレーションしました。
Q&A に関して言えば、冷静モデルの応答スタイルは簡潔かつ実用的であり、いくつかの罠の質問の落とし穴を回避できます。
作文面では、昨年の四川省の高校入試の作文問題「最も美しい色をタイトルにした600字以上の作文を書け」に対して、私は冷静に作文を書きました。大きな模型がその場に。白で書き直す、より深みを求める、病気の子供の視点から書くように変更するなど、さらに修正や制限の要件を提示した後、最も美しい色は医療従事者の白衣から来るなどです。 、大きなモデルは意図を理解することができ、複数ラウンドの対話を実行する能力を実証しました。
Congrong モデルの現場では、英語の採用通知書の作成を正常に完了し、必要に応じて署名を修正しました。中国語への翻訳を依頼したところ、最初の返答はかなりぶっきらぼうな直訳で、その後「中国語の習慣に合わせて書き直す」という新たな要件に従って通知を書き直した。
プログラミングに関しては、穏やかな大きなモデルが最初にコードを書く能力を実証し、素早い並べ替えのためのコードを書きました。
「このコードの時間計算量はどれくらいですか?」という比較的専門的なトピックを尋ねます。冷静で大規模なモデルの返答には何も問題はありません。
コード コメントを追加する必要がありますが、これもすぐに完了できます。
さらに難しいのは、C プログラマーが理解できるコードを作成させることです。タスクを完了するだけでなく、前の要件に従ってコメントも追加します。
読解の観点では、ゆったりとした大規模モデルは、長い文書または複数の文書の集合の理解をサポートし、画像とテキストのクロスモーダルな理解をサポートします。
ユンコンの技術スタッフは、「西洋美術の歴史」という500~600ページほどの本を事前にアップロードしており、コングロンモデルはその本の内容を深く理解し、その内容に基づいて作業を進めました。本の内容について質問したり、どのような本なのかを要約したりするなど、ナレッジカテゴリでユーザーと対話します。
下の図に示すように、インターフェイスの中央部分は本のテキスト、右側は対話型インタラクティブ インターフェイスです。Calm モデルにはいくつかの質問サンプルが用意されています。サンプルをクリックすると、サンプルが表示されます。返信を含む返信をリアルタイムで生成します。内容に関するヒントがいくつかあります。これらの手がかりをクリックすると、本の中の対応する箇所の位置にリンクします。使いやすい大きなモデルを使用すると、ユーザーは画像の説明を入力し、書籍内で画像をすばやく見つけることができます。
Yunchong Technology は、Congrong の大型モデルである ChatGPT および GPT-4 をテストし、2022 年の高校入試におけるさまざまな科目の実際の問題を解く能力を判定しました。
テスト結果から判断すると、Yuncong Calm は ChatGPT よりも速く質問に答えます。歴史と生物学の質問への回答のスコアは ChatGPT よりわずかに低く、地理の質問への回答のスコアは ChatGPT と同じです。政治的な質問への回答のスコアは ChatGPT と同じです。質問、倫理、法的質問は ChatGPT と同じで、パフォーマンスは ChatGPT より優れています。 GPT-4.0 の現在のレベルは、他のシステムよりも大幅に優れています。
2. 業界への応用例: 都市交通管理、設備メンテナンス、金融業務、政策ソリューション
Congrong の基本的な大規模モデルを本当に役立つものにするには、業界の大規模モデルを構築する必要があります。
Yunchong Technology の共同創設者で広東会社のゼネラルマネージャーである Yao Zhiqiang 氏は、公共サービス向けの One Language Intelligent Office、公務員向けの Intelligent Governance Elf など、草の根ガバナンス シナリオにおける穏やかな大規模モデルの適用について共有しました。およびグリッドチーム、およびアプリケーション開発 ユーザーのプログラミングアシスタントと都市交通管理センターの統合コマンド。
都市運営管理センターのシーンでは、都市運営インテリジェント大画面AIアシスタントのデモンストレーションが大画面で上映されました。指揮官が「5番目の画面を真ん中に移動させて」と命令すると、AIは命令を理解して素早く実行します。
その後、指揮官は「このあたりには人や車が多いですか?」と尋ねました。すると、大型 AI モデルがマルチモーダル機能を使用して人や車の流れを自動的に分析し、最も交通量の多いルートのビデオ映像を選択しました。 「動画の内容に基づく」「湖周辺の交通状況は良好ですが、道路占拠や違法駐車が行われている車両が存在します。また、人が多く混雑している場所もあります。」秩序を維持するために警備員を配置することをお勧めします。」
司令官は続けて尋ねました:「今日の旅行について市民にどのような提案がありますか?」大型 AI モデルが気象条件に反応し、「旅行に適している」と「適切な日焼け止め」についての提案を行いました。
設備保守管理シナリオの例としては、業界の大規模モデルに基づいて Yunceg Technology が開発したインテリジェント保守付随システムがあります。
保守計画は 2 つのソースから得られます: 1 つは機器の分類、機器の過去の保守記録、最近の生産計画などに基づいて保守計画が自動的に作成されます。2 つ目は、ロボットの検査中に検査ロボットまたはプローブが使用されます。一時的なものである可能性がある問題をどこかで検出し、その障害が何であるか、その可能性はどれくらいか、修理リクエストを送信する必要があるかどうかを認識します。
メンテナンスの準備の過程で、メンテナンスマニュアル、メンテナンス記録、専門家のアドバイスを学習することで、大型機械は徐々に「マスターマスター」レベルのメンテナンススキルを習得しました。メンテナンス前に、システムは画像、テキスト、音声、ビデオ、およびメンテナンスの主要ポイントを含む完全なプレビューコースを提供します。これにより、メンテナンスエンジニアは、修理対象の機器の潜在的な障害、障害の原因、およびツールをプレビューできます。修理、スペアパーツの交換など。
保守プロセス中、Yuncong インテリジェント保守付随システムは 2 つの典型的なソリューションを提供します: 1 つは「指導」で、エンジニアは大型モデルに機器の故障の修復方法を尋ねることができます。もう 1 つは「監督」で、大型モデルは監視できます。エンジニア メンテナンス作業が標準化されているかどうか、また重要な修理が漏れていないかどうか。
メンテナンス作業指示が完了すると、作業者が自分で作業指示を作成する必要はありません。システムはビデオ記録全体を自動的に分析して、メンテナンスのコアビデオコンテンツを伴うグラフィックメンテナンス記録を作成します。修理し、その後の修理のための知識源を提供します。
財務シナリオの場合、大規模なモデルは銀行内部の業務運営の効率を向上させることができます。この大規模モデルは、銀行の膨大なデータリソースをより価値のある情報に変換し、専門知識の供給ボトルネックを打破し、包括的金融、銀行業務、実体経済へのサービスにおける銀行の能力の向上に役立ちます。財務管理に関する専門的な質問に答える AI バーチャル アカウント マネージャーのパフォーマンスが現場で実証されました。
一般的な大規模モデルと比較して、ローカル知識ベースで最適化された業界大規模モデルは、より専門的で厳密な回答を提供し、ランダムな製造を回避できます。
関税政策 AI エルフを例に挙げると、税関政策 AI エルフは税関総署からの 2,000 以上の資料に基づいており、セマンティック セグメンテーション、セマンティック検索、即時学習などのテクノロジーを通じてローカルの知識ベースを形成しています。これにより、大規模モデルの正確な情報が構築され、プロンプトの言葉によって大規模モデルの機能が最大限に発揮され、ユーザーに正確なポリシーの回答が提供されます。
Yunchong Technology は、社内で多くの大規模なモデル アプリケーション起業家プロジェクトも育成しており、たとえば、Damai デジタル ヒューマン ライブ ブロードキャスト プラットフォームでは、ライブ ブロードキャスト ルームのインテリジェントな構築やライブブロードキャストの予熱コーパスの提供などの機能を実現できます。 。
教育シナリオの場合、インテリジェントな教育 AI ウィザードは、既存のコースのシラバス、質問バンク、その他の基本モデルに基づいて自己生成の質問バンクを形成し、学生の日々の成績に基づいてカスタマイズされた演習や学習計画を生成し、自動的に生成することができます。生徒の成績に基づいた総合評価に対応し、教師の日々の負担を軽減する分析。
結論: 今後数年間、テクノロジーはシナリオを解き明かし続けるでしょう
言語、数学、推論などの基本的な一般能力を実証した後、大型モデルは産業界に移行し、金融、法律、医学、政策などの専門知識分野での応用可能性を示しています。
Yunchong Technology の会長兼ゼネラルマネージャーである Zhou Xi 氏は、大規模モデルは従来のインタラクション方法を覆すものであり、主に質問と回答、コンパニオンシップ、ホスティングの 3 つの形式で表示されると考えています。このうち、「質疑応答」は現行の GPT を指し、「伴奏」は AI が友達のように色々なことを同行してくれることを意味し、「ホスティング」は主に 1 つのことを AI に任せることを意味し、同様にオンラインゲームにおける「オンフックトレーニング」。 「ホスティング」段階に達すると、人々はより有意義で興味深いことを自由に行うことができます。
彼は、プラットフォーム全体のフレームワークと、基本的な大型モデルを通じて構築された基本機能を使用して、業界大型モデルのスキル パッケージを継続的に追加し、より強力な業界システムを構築できると述べました。このシステムは、To G、To B、To C を含むあらゆる階層にサービスを提供できます。
周熙氏の見解では、強力な基本的な大規模モデルがなければ、業界の大規模モデルを直接構築しても長期的に持続可能な活力は得られません。なぜなら、業界の大規模モデルを十分に実用的なものにしたいのであれば、基本的な大規模モデルを訓練する必要があるからです。大型インダストリ モデルを業界で量産するには、極限まで効率とコスト管理を達成する必要があり、究極の最適化には基本的な大型モデルを習得する必要があります。
将来の産業の発展は新たな技術のブレークスルーに依存しており、産業用途は単に創造性に依存するだけでなく、技術的なサポートも必要とします。今後数年間、テクノロジーは新たなアプリケーション シナリオを開拓し続け、シナリオ当事者も業界の効率とエクスペリエンスを再構築する試みを続けるでしょう。
以上がユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解くの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアン アプレット バージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。 、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネス シナリオにおける豊富で大規模なポーランド テクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

1. 背景の紹介 まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータ ガバナンスの普及により、より効率的なデータ ガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

本サイトの7月31日のニュースによると、テクノロジー大手アマゾンは火曜日、クラウドコンピューティング技術に関連するアマゾンの十数件の特許を侵害しているとして、フィンランドの通信会社ノキアをデラウェア州連邦裁判所に告訴した。 1. Amazon は訴訟の中で、Nokia が自社のクラウド サービス製品を強化するために、クラウド コンピューティング インフラストラクチャ、セキュリティおよびパフォーマンス テクノロジを含む Amazon クラウド コンピューティング サービス (AWS) 関連テクノロジを悪用したと述べました。訴状によると、アマゾンは2006年にAWSを立ち上げ、その画期的なクラウドコンピューティング技術は2000年代初頭から開発されていたという。訴状には「アマゾンはクラウドコンピューティングのパイオニアだが、現在ノキアはアマゾンの特許取得済みのクラウドコンピューティング技術革新を許可なく使用している」と書かれている。アマゾン、ブロック差し止めを裁判所に求める

6月13日のニュースによると、Byteの「Volcano Engine」公開アカウントによると、Xiaomiの人工知能アシスタント「Xiao Ai」はVolcano Engineとの協力に達し、両社はbeanbao大型モデルに基づいて、よりインテリジェントなAIインタラクティブ体験を実現するとのこと。 。 ByteDance が作成した大規模な豆包モデルは、毎日最大 1,200 億のテキスト トークンを効率的に処理し、3,000 万個のコンテンツを生成できると報告されています。 Xiaomi は、Doubao 大型モデルを使用して、独自モデルの学習能力と推論能力を向上させ、ユーザーのニーズをより正確に把握するだけでなく、より速い応答速度とより包括的なコンテンツ サービスを提供する新しい「Xiao Ai Classmate」を作成しました。たとえば、ユーザーが複雑な科学的概念について質問する場合、&ldq

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A
