ホームページ > テクノロジー周辺機器 > AI > ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

WBOY
リリース: 2023-05-29 14:03:04
転載
1211 人が閲覧しました

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

智物

著者 | ZeR0

編集者 | 莫英

Zhidongxi は 5 月 18 日、Yuncong Technology が本日 Congrong モデルを発表し、質疑応答、提案文の​​作成、意図の理解、複数ラウンドの対話、英語のライティング、機械翻訳、プログラミング、クロスモーダルな画像と文章を理解し、実際の高校入試問題を解くことができる。大型モデルは現在、内部テスト段階にあります。

デモンストレーションによると、冷静モデルは、事前にアップロードされた約500~600ページの書籍「西洋美術史」について、書籍の関連内容を質問したり、どのような内容なのかを要約したりするなど、徹底的な理解を行いました。本だった、指定された要件の写真を見つけるなど。

昨年の高校入試の実際の問題に答えるための Convergence ラージ モデル、ChatGPT、および GPT-4 の能力をテストした結果、Yuncongcong は ChatGPT よりも速く、歴史と生物学の質問の解答スコアは ChatGPT よりわずかに低かった、地理の質問への回答のスコアは ChatGPT よりわずかに低かったですが、スコアは ChatGPT と同じで、政治的な質問、倫理、法律に関する質問への回答のパフォーマンスは ChatGPT よりも優れていました。 GPT-4.0 の現在のレベルは、他のシステムよりも大幅に優れています。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

現場では、Big Model Information and Innovation Ecological Alliance が正式に設立され、そのメンバーには Youked、厦門文化観光、Huawei Shengteng、Nansha Public Control、CSDN、Zhongshu Information Technology などが含まれており、イノベーションとイノベーションの促進を目的としています。大型モデル技術の開発、さまざまな業界での人工知能の応用を促進します。

Yunchong Technology は、CCIC、Shenzhou Information、Shenzhen News、Jiadu Technology、Jin Shiyuan、Youzu Networks、Aiden Technology とも協力して、高品質モデル、金融モデル、エンターテイメント モデル、輸送モデルを立ち上げる予定です。 、大型ゲームモデル、大型医療モデルなど。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

1. 基本的な能力の実証: 画像とテキストのクロスモーダル理解をサポートし、ChatGPT よりも早く中間試験の問題に答えることができます

Congrong Large Model の対話インターフェイスは ChatGPT に似ています。 Yunchong Technology の技術管理部門のディレクターである Ye Mao 氏は、Rongrong 大型モデルの基本的な機能を現場でデモンストレーションしました。

Q&A に関して言えば、冷静モデルの応答スタイルは簡潔かつ実用的であり、いくつかの罠の質問の落とし穴を回避できます。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

作文面では、昨年の四川省の高校入試の作文問題「最も美しい色をタイトルにした600字以上の作文を書け」に対して、私は冷静に作文を書きました。大きな模型がその場に。白で書き直す、より深みを求める、病気の子供の視点から書くように変更するなど、さらに修正や制限の要件を提示した後、最も美しい色は医療従事者の白衣から来るなどです。 、大きなモデルは意図を理解することができ、複数ラウンドの対話を実行する能力を実証しました。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

Congrong モデルの現場では、英語の採用通知書の作成を正常に完了し、必要に応じて署名を修正しました。中国語への翻訳を依頼したところ、最初の返答はかなりぶっきらぼうな直訳で、その後「中国語の習慣に合わせて書き直す」という新たな要件に従って通知を書き直した。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

プログラミングに関しては、穏やかな大きなモデルが最初にコードを書く能力を実証し、素早い並べ替えのためのコードを書きました。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

「このコードの時間計算量はどれくらいですか?」という比較的専門的なトピックを尋ねます。冷静で大規模なモデルの返答には何も問題はありません。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

コード コメントを追加する必要がありますが、これもすぐに完了できます。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

さらに難しいのは、C プログラマーが理解できるコードを作成させることです。タスクを完了するだけでなく、前の要件に従ってコメントも追加します。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

読解の観点では、ゆったりとした大規模モデルは、長い文書または複数の文書の集合の理解をサポートし、画像とテキストのクロスモーダルな理解をサポートします。

ユンコンの技術スタッフは、「西洋美術の歴史」という500~600ページほどの本を事前にアップロードしており、コングロンモデルはその本の内容を深く理解し、その内容に基づいて作業を進めました。本の内容について質問したり、どのような本なのかを要約したりするなど、ナレッジカテゴリでユーザーと対話します。

下の図に示すように、インターフェイスの中央部分は本のテキスト、右側は対話型インタラクティブ インターフェイスです。Calm モデルにはいくつかの質問サンプルが用意されています。サンプルをクリックすると、サンプルが表示されます。返信を含む返信をリアルタイムで生成します。内容に関するヒントがいくつかあります。これらの手がかりをクリックすると、本の中の対応する箇所の位置にリンクします。使いやすい大きなモデルを使用すると、ユーザーは画像の説明を入力し、書籍内で画像をすばやく見つけることができます。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

Yunchong Technology は、Congrong の大型モデルである ChatGPT および GPT-4 をテストし、2022 年の高校入試におけるさまざまな科目の実際の問題を解く能力を判定しました。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

テスト結果から判断すると、Yuncong Calm は ChatGPT よりも速く質問に答えます。歴史と生物学の質問への回答のスコアは ChatGPT よりわずかに低く、地理の質問への回答のスコアは ChatGPT と同じです。政治的な質問への回答のスコアは ChatGPT と同じです。質問、倫理、法的質問は ChatGPT と同じで、パフォーマンスは ChatGPT より優れています。 GPT-4.0 の現在のレベルは、他のシステムよりも大幅に優れています。

2. 業界への応用例: 都市交通管理、設備メンテナンス、金融業務、政策ソリューション

Congrong の基本的な大規模モデルを本当に役立つものにするには、業界の大規模モデルを構築する必要があります。

Yunchong Technology の共同創設者で広東会社のゼネラルマネージャーである Yao Zhiqiang 氏は、公共サービス向けの One Language Intelligent Office、公務員向けの Intelligent Governance Elf など、草の根ガバナンス シナリオにおける穏やかな大規模モデルの適用について共有しました。およびグリッドチーム、およびアプリケーション開発 ユーザーのプログラミングアシスタントと都市交通管理センターの統合コマンド。

都市運営管理センターのシーンでは、都市運営インテリジェント大画面AIアシスタントのデモンストレーションが大画面で上映されました。指揮官が「5番目の画面を真ん中に移動させて」と命令すると、AIは命令を理解して素早く実行します。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

その後、指揮官は「このあたりには人や車が多いですか?」と尋ねました。すると、大型 AI モデルがマルチモーダル機能を使用して人や車の流れを自動的に分析し、最も交通量の多いルートのビデオ映像を選択しました。 「動画の内容に基づく」「湖周辺の交通状況は良好ですが、道路占拠や違法駐車が行われている車両が存在します。また、人が多く混雑している場所もあります。」秩序を維持するために警備員を配置することをお勧めします。」

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

司令官は続けて尋ねました:「今日の旅行について市民にどのような提案がありますか?」大型 AI モデルが気象条件に反応し、「旅行に適している」と「適切な日焼け止め」についての提案を行いました。

設備保守管理シナリオの例としては、業界の大規模モデルに基づいて Yunceg Technology が開発したインテリジェント保守付随システムがあります。

保守計画は 2 つのソースから得られます: 1 つは機器の分類、機器の過去の保守記録、最近の生産計画などに基づいて保守計画が自動的に作成されます。2 つ目は、ロボットの検査中に検査ロボットまたはプローブが使用されます。一時的なものである可能性がある問題をどこかで検出し、その障害が何であるか、その可能性はどれくらいか、修理リクエストを送信する必要があるかどうかを認識します。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

メンテナンスの準備の過程で、メンテナンスマニュアル、メンテナンス記録、専門家のアドバイスを学習することで、大型機械は徐々に「マスターマスター」レベルのメンテナンススキルを習得しました。メンテナンス前に、システムは画像、テキスト、音声、ビデオ、およびメンテナンスの主要ポイントを含む完全なプレビューコースを提供します。これにより、メンテナンスエンジニアは、修理対象の機器の潜在的な障害、障害の原因、およびツールをプレビューできます。修理、スペアパーツの交換など。

保守プロセス中、Yuncong インテリジェント保守付随システムは 2 つの典型的なソリューションを提供します: 1 つは「指導」で、エンジニアは大型モデルに機器の故障の修復方法を尋ねることができます。もう 1 つは「監督」で、大型モデルは監視できます。エンジニア メンテナンス作業が標準化されているかどうか、また重要な修理が漏れていないかどうか。

メンテナンス作業指示が完了すると、作業者が自分で作業指示を作成する必要はありません。システムはビデオ記録全体を自動的に分析して、メンテナンスのコアビデオコンテンツを伴うグラフィックメンテナンス記録を作成します。修理し、その後の修理のための知識源を提供します。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

財務シナリオの場合、大規模なモデルは銀行内部の業務運営の効率を向上させることができます。この大規模モデルは、銀行の膨大なデータリソースをより価値のある情報に変換し、専門知識の供給ボトルネックを打破し、包括的金融、銀行業務、実体経済へのサービスにおける銀行の能力の向上に役立ちます。財務管理に関する専門的な質問に答える AI バーチャル アカウント マネージャーのパフォーマンスが現場で実証されました。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

一般的な大規模モデルと比較して、ローカル知識ベースで最適化された業界大規模モデルは、より専門的で厳密な回答を提供し、ランダムな製造を回避できます。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

関税政策 AI エルフを例に挙げると、税関政策 AI エルフは税関総署からの 2,000 以上の資料に基づいており、セマンティック セグメンテーション、セマンティック検索、即時学習などのテクノロジーを通じてローカルの知識ベースを形成しています。これにより、大規模モデルの正確な情報が構築され、プロンプトの言葉によって大規模モデルの機能が最大限に発揮され、ユーザーに正確なポリシーの回答が提供されます。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

Yunchong Technology は、社内で多くの大規模なモデル アプリケーション起業家プロジェクトも育成しており、たとえば、Damai デジタル ヒューマン ライブ ブロードキャスト プラットフォームでは、ライブ ブロードキャスト ルームのインテリジェントな構築やライブブロードキャストの予熱コーパスの提供などの機能を実現できます。 。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

教育シナリオの場合、インテリジェントな教育 AI ウィザードは、既存のコースのシラバス、質問バンク、その他の基本モデルに基づいて自己生成の質問バンクを形成し、学生の日々の成績に基づいてカスタマイズされた演習や学習計画を生成し、自動的に生成することができます。生徒の成績に基づいた総合評価に対応し、教師の日々の負担を軽減する分析。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

結論: 今後数年間、テクノロジーはシナリオを解き明かし続けるでしょう

言語、数学、推論などの基本的な一般能力を実証した後、大型モデルは産業界に移行し、金融、法律、医学、政策などの専門知識分野での応用可能性を示しています。

Yunchong Technology の会長兼ゼネラルマネージャーである Zhou Xi 氏は、大規模モデルは従来のインタラクション方法を覆すものであり、主に質問と回答、コンパニオンシップ、ホスティングの 3 つの形式で表示されると考えています。このうち、「質疑応答」は現行の GPT を指し、「伴奏」は AI が友達のように色々なことを同行してくれることを意味し、「ホスティング」は主に 1 つのことを AI に任せることを意味し、同様にオンラインゲームにおける「オンフックトレーニング」。 「ホスティング」段階に達すると、人々はより有意義で興味深いことを自由に行うことができます。

彼は、プラットフォーム全体のフレームワークと、基本的な大型モデルを通じて構築された基本機能を使用して、業界大型モデルのスキル パッケージを継続的に追加し、より強力な業界システムを構築できると述べました。このシステムは、To G、To B、To C を含むあらゆる階層にサービスを提供できます。

ユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解く

周熙氏の見解では、強力な基本的な大規模モデルがなければ、業界の大規模モデルを直接構築しても長期的に持続可能な活力は得られません。なぜなら、業界の大規模モデルを十分に実用的なものにしたいのであれば、基本的な大規模モデルを訓練する必要があるからです。大型インダストリ モデルを業界で量産するには、極限まで効率とコスト管理を達成する必要があり、究極の最適化には基本的な大型モデルを習得する必要があります。

将来の産業の発展は新たな技術のブレークスルーに依存しており、産業用途は単に創造性に依存するだけでなく、技術的なサポートも必要とします。今後数年間、テクノロジーは新たなアプリケーション シナリオを開拓し続け、シナリオ当事者も業界の効率とエクスペリエンスを再構築する試みを続けるでしょう。

以上がユンコンAI大型モデル参戦!画像と文字のクロスモーダル理解をサポートし、GPT-4で高校入試問題を解くの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:sohu.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート