「MiniGPT-4 は、その驚くべき画像認識能力と複数の機能を証明しています。画像によるチャット、スケッチによる Web サイトの構築など。」
人間にとって絵の情報を理解することは些細なことであり、何も考えずに絵の意味を何気なく伝えることができます。下の写真のように、携帯電話が接続されている充電器はやや不適切です。人間なら一目で問題が分かるが、AIにとってはまだ非常に難しい。
GPT-4 の登場により、これらの問題が簡素化され始め、次のような問題をすぐに指摘できるようになります: VGA ケーブルによる iPhone の充電。
実のところ、GPT-4 の魅力はこれだけではありません。さらに魅力的なのは、手描きのスケッチを使用して Web サイトを直接生成し、その上に走り書きの図を描くことです。原稿を書き、写真を撮って送信します。 GPT-4 を与えて、図に従って Web サイトのコードを書き込ませます。おお、GPT-4 が Web ページのコードを書き込みます。
しかし、残念ながらGPT-4のこの機能はまだ一般公開されておらず、実際に使い始めて体験することはできません。しかし、これ以上待ちきれない人もおり、キング アブドラ科学技術大学 (KAUST) のチームが GPT-4 と同様の製品である MiniGPT-4 を開発しました。チームの研究者には、Zhu Deyao、Chen Jun、Shen Xiaoqian、Li Xiang、Mohamed H. Elhoseiny が含まれており、全員が KAUST の Vision-CAIR 研究グループの出身です。
- 論文アドレス: https://github.com/Vision-CAIR/MiniGPT- 4 /blob/main/MiniGPT_4.pdf
- Paper ホームページ: https://minigpt-4.github.io/
- コードアドレス: https://github.com/Vision-CAIR/MiniGPT-4
MiniGPT-4 写真を見るだけで話しやすい
MiniGPT-4の効果は何ですか?いくつかの例から始めましょう。さらに、MiniGPT-4 をより良く使用するために、テストには英語入力を使用することをお勧めします。まず、MiniGPT-4 の画像記述機能を調べてみましょう。左側の写真について、MiniGPT-4 が出した答えはおおよそ次のとおりです。「この写真は、凍った湖の上で成長するサボテンを描いています。サボテンの周りには巨大な氷の結晶があり、遠くには雪を頂いた山々があります...」 「このシナリオは現実世界で起こり得るでしょうか?」と尋ねると、 MiniGPT-4 が出した答えは、この画像は現実世界では一般的ではない、そしてその理由です。
## MiniGPT-4 を使用すると、写真に広告スローガンを書くことが非常に簡単になりました。 MiniGPT-4 に、左側のカップの広告コピーを書いてもらいます。 MiniGPT-4 は、コーヒー愛好家や猫愛好家に最適なカップ上の眠そうな猫のパターンを正確に指摘し、カップの素材なども指摘しました。 MiniGPT-4 は写真に基づいてレシピを生成することもでき、あなたをキッチンの専門家に変えます:
人気のミームについて説明します:
## 写真に基づいて詩を書きます:
さらに、MiniGPT-4 デモが公開されており、オンラインでプレイできることにも言及する価値があります。実際に体験してみることもできます(英語テストの利用をお勧めします):
##デモアドレス: https:// 0810e8582bcad31944.gradio.live/
このプロジェクトが公開されると、ネチズンから幅広い注目を集めました。たとえば、MiniGPT-4 で写真内のオブジェクトを説明してみましょう:
##ネチズンからのその他のテスト体験は以下の通りです:
##メソッドの紹介
Author It GPT-4 の高度なラージ言語モデル (LLM) が、その高度なマルチモーダル生成機能の主な理由であると考えられています。この現象を研究するために、著者らは、投影層を使用してフリーズされたビジュアル エンコーダとフリーズされた LLM (Vicuna) を位置合わせする MiniGPT-4 を提案しています。
#MiniGPT-4 は 2 段階でトレーニングされました。最初の従来の事前トレーニング段階では、約 500 万個の位置合わせされた画像とテキストのペアを使用して 4 つの A100 GPU でトレーニングするのに 10 時間かかりました。最初の段階の後、ビクーニャは画像を理解できるようになりました。しかし、Vicuna のテキスト生成能力は大きな影響を受けました。
この問題を解決し、使いやすさを向上させるために、研究者は、モデル自体と ChatGPT を通じて高品質の画像とテキストのペアを作成する新しい方法を提案しました。これに基づいて、研究では小規模だが高品質のデータセット (合計 3500 ペア) を作成しました。
2 番目の微調整ステージは、会話テンプレートを使用してこのデータセットでトレーニングされ、生成の信頼性と全体的な使いやすさが大幅に向上します。このステージは計算効率が高く、A100GPU を必要とするだけで完了までに約 7 分かかります。
その他の関連作品:
- VisualGPT: https://github.com/Vision-CAIR/VisualGPT
- ChatCaptioner: https://github.com/Vision-CAIR/ChatCaptioner
さらに、BLIP2 などのオープンソース コード ライブラリも使用されますプロジェクトでは、ラヴィスとビクーニャ。
以上が「MiniGPT-4 は、その驚くべき画像認識能力と複数の機能を証明しています。画像によるチャット、スケッチによる Web サイトの構築など。」の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









vue.jsのオブジェクトに文字列を変換する場合、標準のjson文字列にはjson.parse()が推奨されます。非標準のJSON文字列の場合、文字列は正規表現を使用して処理し、フォーマットまたはデコードされたURLエンコードに従ってメソッドを削減できます。文字列形式に従って適切な方法を選択し、バグを避けるためにセキュリティとエンコードの問題に注意してください。

この記事では、MySQLデータベースの操作を紹介します。まず、MySQLWorkBenchやコマンドラインクライアントなど、MySQLクライアントをインストールする必要があります。 1. mysql-uroot-pコマンドを使用してサーバーに接続し、ルートアカウントパスワードでログインします。 2。CreatedAtaBaseを使用してデータベースを作成し、データベースを選択します。 3. createTableを使用してテーブルを作成し、フィールドとデータ型を定義します。 4. INSERTINTOを使用してデータを挿入し、データをクエリし、更新することでデータを更新し、削除してデータを削除します。これらの手順を習得することによってのみ、一般的な問題に対処することを学び、データベースのパフォーマンスを最適化することでMySQLを効率的に使用できます。

Vue axiosのタイムアウトを設定するために、Axiosインスタンスを作成してタイムアウトオプションを指定できます。グローバル設定:Vue.Prototype。$ axios = axios.create({Timeout:5000});単一のリクエストで:this。$ axios.get( '/api/users'、{timeout:10000})。

700万のレコードを効率的に処理し、地理空間技術を使用したインタラクティブマップを作成します。この記事では、LaravelとMySQLを使用して700万を超えるレコードを効率的に処理し、それらをインタラクティブなマップの視覚化に変換する方法について説明します。最初の課題プロジェクトの要件:MySQLデータベースに700万のレコードを使用して貴重な洞察を抽出します。多くの人は最初に言語をプログラミングすることを検討しますが、データベース自体を無視します。ニーズを満たすことができますか?データ移行または構造調整は必要ですか? MySQLはこのような大きなデータ負荷に耐えることができますか?予備分析:キーフィルターとプロパティを特定する必要があります。分析後、ソリューションに関連している属性はわずかであることがわかりました。フィルターの実現可能性を確認し、検索を最適化するためにいくつかの制限を設定しました。都市に基づくマップ検索

概要:Vue.js文字列配列をオブジェクト配列に変換するための次の方法があります。基本方法:定期的なフォーマットデータに合わせてマップ関数を使用します。高度なゲームプレイ:正規表現を使用すると、複雑な形式を処理できますが、慎重に記述して考慮する必要があります。パフォーマンスの最適化:大量のデータを考慮すると、非同期操作または効率的なデータ処理ライブラリを使用できます。ベストプラクティス:コードスタイルをクリアし、意味のある変数名とコメントを使用して、コードを簡潔に保ちます。

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

リモートシニアバックエンジニアの求人事業者:サークル場所:リモートオフィスジョブタイプ:フルタイム給与:$ 130,000- $ 140,000職務記述書サークルモバイルアプリケーションとパブリックAPI関連機能の研究開発に参加します。ソフトウェア開発ライフサイクル全体をカバーします。主な責任は、RubyonRailsに基づいて独立して開発作業を完了し、React/Redux/Relay Front-Endチームと協力しています。 Webアプリケーションのコア機能と改善を構築し、機能設計プロセス全体でデザイナーとリーダーシップと緊密に連携します。肯定的な開発プロセスを促進し、反復速度を優先します。 6年以上の複雑なWebアプリケーションバックエンドが必要です

MySQLパフォーマンスの最適化は、インストール構成、インデックス作成、クエリの最適化、監視、チューニングの3つの側面から開始する必要があります。 1。インストール後、INNODB_BUFFER_POOL_SIZEパラメーターやclose query_cache_sizeなど、サーバーの構成に従ってmy.cnfファイルを調整する必要があります。 2。過度のインデックスを回避するための適切なインデックスを作成し、説明コマンドを使用して実行計画を分析するなど、クエリステートメントを最適化します。 3. MySQL独自の監視ツール(ShowProcessList、ShowStatus)を使用して、データベースの健康を監視し、定期的にデータベースをバックアップして整理します。これらの手順を継続的に最適化することによってのみ、MySQLデータベースのパフォーマンスを改善できます。
