目次
は、簡単に言うと、大規模モデルとナレッジ グラフを組み合わせたものです。
ホームページ テクノロジー周辺機器 AI 視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

Nov 26, 2023 pm 08:22 PM
idea ビジョン

視覚的なプロンプトを使用すると、どのようなエクスペリエンスが得られますか?

画像にランダムな輪郭を描くだけで、同じカテゴリがすぐにマークされます。

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

GPT-4V では穀物計数ステップさえも処理が困難です。すべての米粒を見つけるには、手動で箱を引くだけです。

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

新しいターゲット検出パラダイムが登場しました。

閉幕したばかりのIDEA年次会議で、IDEA研究所の創設会長であり、国家工程院の外国人学者でもある沈祥陽氏は、最新の研究結果を発表した -

ビジュアル プロンプト モデル T-Rex のコンテンツを書き直す必要がある

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

インタラクティブ プロセス全体はすぐに使用できるようになっており、わずか数ステップで完了できます。

以前は、Meta のオープンソース SAM はすべてのモデルをセグメント化しており、CV 分野で GPT-3 の瞬間が直接到来しました。しかし、それは依然としてテキスト プロンプト パラダイムに基づいており、対処がより困難になるでしょういくつかの複雑でまれなシナリオ。

これで、写真を写真に交換することで、簡単に問題を解決できます。

さらに、カンファレンス全体には、Think-on-Graph 知識主導型大規模モデル、開発者プラットフォーム MoonBit、AI 科学研究成果物 ReadPaper アップデート 2.0、SPU 機密コンピューティング コプロセッサなど、有益な情報が満載です。 、制御可能なポートレートビデオ生成プラットフォーム HiveNet など。

最後に、沈祥陽氏は、過去数年間で最も多くの時間を費やしたプロジェクト、低高度経済についても共有しました。

#低空経済が比較的成熟すると、深センの空には毎日 10 万機のドローンが飛び立ち、毎日数百万機のドローンが飛び立つことになると私は信じています

#視覚を使用してプロンプトを作成します
##基本的なシングルラウンド プロンプト機能に加えて、T-Rex は 3 つの高度なモードもサポートしています

##マルチラウンド ポジティブ モード

    これは複数ラウンドの対話に似ており、より正確な結果を生成し、検出の見逃しを回避できます
  • #肯定的および否定的な例モード

これは適切です視覚的な手がかりがあいまいで誤検出を引き起こすシナリオ向け。
  • クロスグラフ モードを使用すると、グラフを再設計してレイアウトし、データや情報を簡単に視覚化できます
1 つの参照グラフを使用して他の画像を検出することにより、

レポートによると、ティラノサウルスは事前に定義されたカテゴリに制限されず、視覚的な例を使用して検出対象を指定できるため、特定のオブジェクトを言葉で完全に表現することが難しいという問題が解決され、迅速な効率が向上します。特に一部の産業シナリオにおける複雑なコンポーネントの場合、その効果は特に顕著です

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

さらに、ユーザーと対話することで、いつでも迅速に評価することもできます。結果を確認し、エラー訂正などを実行します。

ティラノサウルスの構成には、主にイメージ エンコーダ、プロンプト エンコーダ、フレーム デコーダの 3 つのコンポーネントが含まれています。

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

この作品は、IDEA Research Institute Computer Vision とロボット研究センター。

チームが以前オープンソースで開発していたターゲット検出モデル DINO は、COCO ターゲット検出リストで 1 位にランクされた最初の DETR モデルであり、Github で人気となっています

(これまでに 11,000 個のスターを獲得しています)視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。 ゼロサンプル検出器である Grounding DINO、およびあらゆるものを検出してセグメント化できる Grounded SAM。技術的な詳細については、記事の最後にあるリンクをクリックしてください。

カンファレンス全体は有益な情報でいっぱいです

さらに、IDEAカンファレンスではいくつかの研究結果も共有されました。 たとえば、

Think-on-Graph ナレッジ駆動型大規模モデル

は、簡単に言うと、大規模モデルとナレッジ グラフを組み合わせたものです。

大規模モデルは意図の理解と自律学習に優れていますが、ナレッジ グラフは構造化された知識の保存方法により、論理連鎖推論に優れています。

Think-on-Graph は、大規模なモデル エージェントにナレッジ グラフ上で「思考」させ、徐々に最適な答えを検索および推論します (ナレッジ グラフの関連エンティティを段階的に検索および推論します)。推論のすべてのステップで、大規模なモデルが個人的に関与し、ナレッジ グラフを使用して互いの長所と短所を学習します。

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

MoonBit は、Wasm を利用し、クラウド コンピューティングとエッジ コンピューティング向けに設計された開発者プラットフォームです。

このシステムは、ユニバーサル プログラミング言語設計を提供するだけでなく、コンパイラ、ビルド システム、統合開発環境 (IDE)、展開ツールなどのモジュールを統合して、開発エクスペリエンスと効率を向上させます

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

以前にリリースされた科学研究成果物 ReadPaper も 2.0 にアップデートされ、記者会見では副操縦士の読み取りや副操縦の研磨などの新機能がデモされました。

視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。

記者会見の最後に、沈祥陽氏は「低地経済発展白書(2.0) - 完全デジタルソリューション」を発表した。 Airspace System, SILAS) として、時間空間プロセスの新しい概念が提案されました。

T-Rex リンク:
https://trex-counting.github.io/

以上が視覚を利用してプロンプトを表示してください。 Shen Xiangyang 氏は、トレーニングや微調整を必要とせず、すぐに使用できる IDEA Research Institute の新しいモデルを披露しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

アイデアコミュニティ版とプロフェッショナル版の違い アイデアコミュニティ版とプロフェッショナル版の違い Nov 07, 2023 pm 05:23 PM

IDEA Community Edition と Professional Edition の違いには、認証方法、機能、サポートとアップデート、プラグイン サポート、クラウド サービスとチーム コラボレーション、モバイル開発サポート、教育と学習、統合とスケーラビリティ、エラー処理とデバッグ、セキュリティとプライバシーが含まれます。保護など詳細な紹介: 1. 認証方法. コミュニティ バージョンは無料で、使用されているオペレーティング システムに関係なく、すべての開発者に適しています. コミュニティ バージョンは、オープン ソース プロジェクトと商用プロジェクトをサポートしています. プロフェッショナル バージョンは有料で、商用開発に適しています. professional バージョンには 30 日間の試用期間があり、その後継続して使用するにはライセンスを購入する必要があります。

ORB-SLAM3を超えて! SL-SLAM: 低照度、重度のジッター、弱いテクスチャのシーンはすべて処理されます。 ORB-SLAM3を超えて! SL-SLAM: 低照度、重度のジッター、弱いテクスチャのシーンはすべて処理されます。 May 30, 2024 am 09:35 AM

以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

複数の SpringBoot プロジェクトを開始する方法のアイデア 複数の SpringBoot プロジェクトを開始する方法のアイデア May 28, 2023 pm 06:46 PM

1. 準備 Idea を使用して helloworld SpringBoot プロジェクトをビルドします。開発環境説明: (1) SpringBoot2.7.0 (2) アイデア:IntelliJIDEA2022.2.2 (3) OS:MacOS環境が異なり、一部操作が若干異なりますが、全体的な考え方は同じです。 2. SpringBoot2.1 を複数起動する 解決策 1: 設定ファイルのポートを変更する SpringBoot プロジェクトでは、設定ファイルでポート番号を設定できるため、最も簡単な解決策は設定ファイルのポートを変更することです。ファイル application.(properties/yml)

自動運転の初の純粋な視覚的静的再構築 自動運転の初の純粋な視覚的静的再構築 Jun 02, 2024 pm 03:24 PM

純粋に視覚的な注釈ソリューションでは、主に視覚に加えて、GPS、IMU、および車輪速度センサーからのデータを動的注釈に使用します。もちろん、量産シナリオでは、純粋な視覚である必要はありません。一部の量産車両には固体レーダー (AT128) などのセンサーが搭載されています。大量生産の観点からデータの閉ループを作成し、これらすべてのセンサーを使用すると、動的オブジェクトのラベル付けの問題を効果的に解決できます。しかし、私たちの計画には固体レーダーはありません。したがって、この最も一般的な量産ラベル ソリューションを紹介します。純粋に視覚的な注釈ソリューションの中核は、高精度のポーズ再構築にあります。再構築の精度を確保するために、Structure from Motion (SFM) のポーズ再構築スキームを使用します。でもパスする

コードを効率的に記述するための 5 つの IntelliJ IDEA プラグイン コードを効率的に記述するための 5 つの IntelliJ IDEA プラグイン Jul 16, 2023 am 08:03 AM

人工知能 AI は現在、将来のトレンドと開発の方向性として広く認識されています。 AI がすべての仕事を置き換えるのではないかと心配する人もいますが、実際には、AI が置き換えるのは反復性が高く、生産性の低い仕事だけです。したがって、私たちは一生懸命働くのではなく、より賢く働くことを学ぶ必要があります。この記事では、生産性を向上させ、退屈な繰り返し作業を軽減し、作業をより効率的かつ便利にする 5 つの AI 駆動 Intellij プラグインを紹介します。 1GithubCopilotGithubCopilot は、OpenAI と GitHub が共同開発した人工知能コード支援ツールです。 OpenAI の GPT モデルを使用してコードのコンテキストを分析し、新しいコードを予測して生成します

NeRFとは何ですか? NeRF ベースの 3D 再構成はボクセルベースですか? NeRFとは何ですか? NeRF ベースの 3D 再構成はボクセルベースですか? Oct 16, 2023 am 11:33 AM

1 はじめに Neural Radiation Fields (NeRF) は、深層学習とコンピューター ビジョンの分野におけるかなり新しいパラダイムです。この技術は、ECCV2020 の論文「NeRF: Representing Scenes as Neural Radiation Fields for View Synthesis」(最優秀論文賞を受賞) で紹介され、それ以来非常に人気となり、現在までに 800 件近く引用されています [1]。このアプローチは、機械学習による 3D データの従来の処理方法に大きな変化をもたらします。神経放射線場のシーン表現と微分可能なレンダリング プロセス: カメラ光線に沿って 5D 座標 (位置と視線方向) をサンプリングして画像を合成し、これらの位置を MLP に入力して色と体積密度を生成し、体積レンダリング技術を使用してこれらの値を合成します。 ; レンダリング関数は微分可能であるため、渡すことができます。

アイデア springBoot プロジェクトに空のマッパーが自動的に挿入される問題を解決する方法 アイデア springBoot プロジェクトに空のマッパーが自動的に挿入される問題を解決する方法 May 17, 2023 pm 06:49 PM

SpringBoot プロジェクトで、永続層フレームワークとして MyBatis が使用されている場合、自動インジェクションを使用するとマッパーが null ポインター例外を報告するという問題が発生する可能性があります。これは、自動挿入中に SpringBoot が MyBatis の Mapper インターフェイスを正しく識別できず、追加の構成が必要になるためです。 1. Mapper インターフェイスにアノテーションを追加する @Mapper アノテーションを Mapper インターフェイスに追加して、このインターフェイスが Mapper インターフェイスでありプロキシする必要があることを SpringBoot に伝えます。例は次のとおりです: @MapperpublicinterfaceUserMapper{//...}2

IntelliJ IDEA で Java Stream 操作をデバッグする方法 IntelliJ IDEA で Java Stream 操作をデバッグする方法 May 09, 2023 am 11:25 AM

ストリーム操作は Java8 のハイライトです。 java.util.stream は非常に強力ですが、実際の作業ではほとんど使用していない開発者がまだ多くいます。最も不満の理由の 1 つは、デバッグが難しいということです。実際、最初の頃はそうでした。 as stream は DEBUG では使用できません 1 行のコードだと、実際には次のステップになると多くの操作が一度に渡されるため、どの行に問題があるのか​​判断するのが困難です。プラグイン: JavaStreamDebugger 使用している IDEA バージョンが比較的新しい場合、このプラグインはすでに含まれているため、インストールする必要はありません。まだインストールされていない場合は、手動でインストールしてから以下に進みます。

See all articles