バークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。
自動運転技術が進化を続ける中、車両の挙動と軌道予測は効率的かつ安全な運転にとって非常に重要な意味を持ちます。動的モデル演繹やアクセシビリティ分析などの従来の軌道予測手法には、明確な形式と強力な解釈可能性という利点がありますが、環境とオブジェクト間の相互作用のモデリング機能は、複雑な交通環境では比較的制限されます。したがって、近年では、さまざまな深層学習手法 (LSTM、CNN、Transformer、GNN など) や、BDD100K、nuScenes、Stanford Drone、ETH などのさまざまなデータセットに基づいて、多数の研究と応用が行われています。 /UCY、INTERACTION、ApolloScape なども登場しており、ディープ ニューラル ネットワーク モデルのトレーニングと評価を強力にサポートしており、GroupNet、Trajectron、MultiPath などの多くの SOTA モデルが良好なパフォーマンスを示しています。
上記のモデルとデータセットは通常の道路運転シナリオに集中しており、車線や信号機などのインフラストラクチャと機能を最大限に利用して予測プロセスを支援します。交通規制の制限、ほとんどの車両の移動パターンも比較的明確です。しかし、自動運転と自動駐車の「ラスト マイル」のシナリオでは、次のような多くの新たな困難に直面することになります。
- 駐車場の交通ルール 車線と車線の要件車線の境界線は厳密ではなく、車両は意のままに運転して「近道をする」ことがよくあります。
- 駐車タスクを完了するために、車両は頻繁に後退するなど、より複雑な駐車動作を実行する必要があります。駐車、ステアリングなどドライバーが不慣れな場合、駐車に長時間かかる可能性があります。
- 駐車場内には障害物や乱雑な物が多く、車間距離も近いため、注意しないと駐車できなくなります。衝突や傷の原因となる可能性があります
-
歩行者は駐車場を自由に歩き回ることが多く、車両にはさらなる回避行動が必要です
そのようなシナリオでは、単純に既存の軌道予測モデルが理想的な結果を達成することは困難であり、再トレーニング モデルには対応するデータのサポートが不足しています。 CNRPark EXT や CARPK などの現在の駐車シーンベースのデータ セットは、無料の駐車スペース検出のみを目的として設計されており、写真は監視カメラの一人称視点から取得され、サンプリング レートが低く、オクルージョンが多いため、駐車スペースを検出することはできません。軌道予測に使用されます。
2022 年 10 月に閉幕したばかりの第 25 回 IEEE 高度道路交通システム国際会議 (IEEE ITSC 2022) で、 カリフォルニア大学バークレー校の研究者らが発表した駐車シーン用の最初の高解像度ビデオと軌跡データ セットを作成し、このデータ セットに基づいて、CNN と Transformer アーキテクチャを使用して、「ParkPredict」 と呼ばれる軌跡予測モデルを提案しました。
- 紙のリンク: https://arxiv.org/abs/2204.10777
- データセットのホームページ、トライアルおよびダウンロード アプリケーション: https://sites.google.com/berkeley.edu/dlp-dataset (アクセスできない場合は、代替ページを試すことができます https://www.php.cn/link/966eaa9527eb956f0dc8788132986707 )
- Dataset Python API: https://github.com/MPC - Berkeley/dlp-dataset
データセット情報
データセットはドローンによって収集され、合計時間は 3.5 時間、ビデオ解像度は4Kの場合、サンプリングレートは25Hzです。展望台の駐車場面積は約140m×80m、合計約400台収容可能です。データセットには正確に注釈が付けられており、合計 1,216 台の自動車、3,904 台の自転車、3,904 台の歩行者の軌跡が収集されました。
再処理後、軌跡データを JSON 形式で読み取り、接続グラフ (グラフ) のデータ構造にロードできます。 ): 2 つのダウンロード形式: JSON のみ (推奨) : JSON ファイルには、すべての個体のタイプ、形状、軌跡などが含まれます。オープンソースの Python API を通じて、情報を直接読み取り、プレビューし、セマンティック イメージ (セマンティック イメージ) を生成できます。研究目的が軌跡と行動の予測のみであれば、JSON 形式であらゆるニーズを満たすことができます。 元のビデオと注釈: 研究が以下に基づいている場合オリジナルのカメラ ターゲットの検出、分離、生画像の追跡などのマシン ビジョンの分野のトピックについては、オリジナルのビデオと注釈をダウンロードする必要がある場合があります。これが必要な場合は、研究のニーズをデータセット申請書に明確に記載する必要があります。さらに、アノテーション ファイル自体を解析する必要があります。 アプリケーション例として、次の論文「ParkPredict: Multimodal Intent and Motion Prediction for Vehicles in parking Lots with CNN」を参照してください。 IEEE ITSC 2022 と Transformer 」では、研究チームはこのデータセットを使用して、CNN と Transformer アーキテクチャに基づいて駐車場のシーンにおける車両の意図 (Intent) と軌道 (Trajectory) を予測しました。 チームは CNN モデルを使用して、セマンティック イメージを構築することで車両の意図 (Intent) の分布確率を予測しました。このモデルは車両のローカル環境情報を構築するだけでよく、現在の環境に応じて利用可能な意図の数を継続的に変更できます。 チームは、Transformer モデルを改良し、意図 (Intent) の予測結果、車両の移動履歴、周囲環境のセマンティック マップを提供しました。マルチモーダルな意図と行動の予測を実現するための入力として。
概要
以上がバークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









テキスト注釈は、テキスト内の特定のコンテンツにラベルまたはタグを対応させる作業です。その主な目的は、特に人工知能の分野で、より深い分析と処理のためにテキストに追加情報を提供することです。テキスト注釈は、人工知能アプリケーションの教師あり機械学習タスクにとって非常に重要です。これは、自然言語テキスト情報をより正確に理解し、テキスト分類、感情分析、言語翻訳などのタスクのパフォーマンスを向上させるために AI モデルをトレーニングするために使用されます。テキスト アノテーションを通じて、AI モデルにテキスト内のエンティティを認識し、コンテキストを理解し、新しい同様のデータが出現したときに正確な予測を行うように教えることができます。この記事では主に、より優れたオープンソースのテキスト注釈ツールをいくつか推奨します。 1.LabelStudiohttps://github.com/Hu

画像の注釈は、ラベルまたは説明情報を画像に関連付けて、画像の内容に深い意味と説明を与えるプロセスです。このプロセスは機械学習にとって重要であり、画像内の個々の要素をより正確に識別するために視覚モデルをトレーニングするのに役立ちます。画像に注釈を追加することで、コンピュータは画像の背後にあるセマンティクスとコンテキストを理解できるため、画像の内容を理解して分析する能力が向上します。画像アノテーションは、コンピュータ ビジョン、自然言語処理、グラフ ビジョン モデルなどの多くの分野をカバーする幅広い用途があり、車両が道路上の障害物を識別するのを支援したり、障害物の検出を支援したりするなど、幅広い用途があります。医用画像認識による病気の診断。この記事では主に、より優れたオープンソースおよび無料の画像注釈ツールをいくつか推奨します。 1.マケセンス

DDREASE は、ハード ドライブ、SSD、RAM ディスク、CD、DVD、USB ストレージ デバイスなどのファイル デバイスまたはブロック デバイスからデータを回復するためのツールです。あるブロック デバイスから別のブロック デバイスにデータをコピーし、破損したデータ ブロックを残して正常なデータ ブロックのみを移動します。 ddreasue は、回復操作中に干渉を必要としないため、完全に自動化された強力な回復ツールです。さらに、ddasue マップ ファイルのおかげでいつでも停止および再開できます。 DDREASE のその他の主要な機能は次のとおりです。 リカバリされたデータは上書きされませんが、反復リカバリの場合にギャップが埋められます。ただし、ツールに明示的に指示されている場合は切り詰めることができます。複数のファイルまたはブロックから単一のファイルにデータを復元します

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

iPhone のモバイル データ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラー インターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する 場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください 修正 2 – データ モードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、
