Zhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしました-AI-php.cn

ホームページ

テクノロジー周辺機器

Zhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしました

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Oct 12, 2023 am 11:41 AM

知恵のスペクトルai 清華大学 cogvlm-b

鞭牛士 10 月 12 日のニュース、最近、Zhipu AI と清華 KEG は、マルチモーダル大型モデル CogVLM-17B を Moda コミュニティでリリースし、直接オープンソース化しました。 CogVLM は、ビジュアルエキスパートモジュールを使用して言語コーディングとビジュアルコーディングを深く統合する強力なオープンソースビジュアル言語モデルであり、14 の信頼できるクロスモーダルベンチマークで SOTA パフォーマンスを達成したことが報告されています。

Zhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしました

CogVLM-17B は現在、マルチモーダルの権威ある学術リストで最初の包括的なパフォーマンスを備えたモデルであり、14 のデータセットで最先端または 2 位の結果を達成しています。 CogVLMの効果は「視覚優先」、つまりマルチモーダルモデルにおいて視覚的な理解を優先するという考え方に依存します。 5B パラメーターのビジュアルエンコーダーと 6B パラメーターのビジュアルエキスパートモジュールを使用しており、画像の特徴をモデル化するために合計 11B のパラメーターがあり、テキストの 7B パラメーターよりもさらに多くなります

以上がZhipu AI は清華 KEG と協力して、CogVLM-17B と呼ばれるオープンソースのマルチモーダル大規模モデルをリリースしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7672

CakePHP チュートリアル

1393

C# チュートリアル

1206

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

Related knowledge

クリエイティブプロジェクトのための最高のAIアートジェネレーター（無料＆amp;有料） Apr 02, 2025 pm 06:10 PM

この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

ChatGpt 4 oは利用できますか？ Mar 28, 2025 pm 05:29 PM

CHATGPT 4は現在利用可能で広く使用されており、CHATGPT 3.5のような前任者と比較して、コンテキストを理解し、一貫した応答を生成することに大幅な改善を示しています。将来の開発には、よりパーソナライズされたインターが含まれる場合があります

Meta Llama 3.2を始めましょう - 分析Vidhya Apr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

ベストAIチャットボットが比較されました（chatgpt、gemini、claude＆amp; more） Apr 02, 2025 pm 06:09 PM

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

トップAIライティングアシスタントは、コンテンツの作成を後押しします Apr 02, 2025 pm 06:11 PM

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します