自動運転技術が進化を続ける中、車両の挙動と軌道予測は効率的かつ安全な運転にとって非常に重要な意味を持ちます。動的モデル演繹やアクセシビリティ分析などの従来の軌道予測手法には、明確な形式と強力な解釈可能性という利点がありますが、環境とオブジェクト間の相互作用のモデリング機能は、複雑な交通環境では比較的制限されます。したがって、近年では、さまざまな深層学習手法 (LSTM、CNN、Transformer、GNN など) や、BDD100K、nuScenes、Stanford Drone、ETH などのさまざまなデータセットに基づいて、多数の研究と応用が行われています。 /UCY、INTERACTION、ApolloScape なども登場しており、ディープ ニューラル ネットワーク モデルのトレーニングと評価を強力にサポートしており、GroupNet、Trajectron、MultiPath などの多くの SOTA モデルが良好なパフォーマンスを示しています。
上記のモデルとデータセットは通常の道路運転シナリオに集中しており、車線や信号機などのインフラストラクチャと機能を最大限に利用して予測プロセスを支援します。交通規制の制限、ほとんどの車両の移動パターンも比較的明確です。しかし、自動運転と自動駐車の「ラスト マイル」のシナリオでは、次のような多くの新たな困難に直面することになります。
2022 年 10 月に閉幕したばかりの第 25 回 IEEE 高度道路交通システム国際会議 (IEEE ITSC 2022) で、 カリフォルニア大学バークレー校の研究者らが発表した駐車シーン用の最初の高解像度ビデオと軌跡データ セットを作成し、このデータ セットに基づいて、CNN と Transformer アーキテクチャを使用して、「ParkPredict」 と呼ばれる軌跡予測モデルを提案しました。
データセットはドローンによって収集され、合計時間は 3.5 時間、ビデオ解像度は4Kの場合、サンプリングレートは25Hzです。展望台の駐車場面積は約140m×80m、合計約400台収容可能です。データセットには正確に注釈が付けられており、合計 1,216 台の自動車、3,904 台の自転車、3,904 台の歩行者の軌跡が収集されました。
再処理後、軌跡データを JSON 形式で読み取り、接続グラフ (グラフ) のデータ構造にロードできます。 ): 2 つのダウンロード形式: JSON のみ (推奨) : JSON ファイルには、すべての個体のタイプ、形状、軌跡などが含まれます。オープンソースの Python API を通じて、情報を直接読み取り、プレビューし、セマンティック イメージ (セマンティック イメージ) を生成できます。研究目的が軌跡と行動の予測のみであれば、JSON 形式であらゆるニーズを満たすことができます。 元のビデオと注釈: 研究が以下に基づいている場合オリジナルのカメラ ターゲットの検出、分離、生画像の追跡などのマシン ビジョンの分野のトピックについては、オリジナルのビデオと注釈をダウンロードする必要がある場合があります。これが必要な場合は、研究のニーズをデータセット申請書に明確に記載する必要があります。さらに、アノテーション ファイル自体を解析する必要があります。 アプリケーション例として、次の論文「ParkPredict: Multimodal Intent and Motion Prediction for Vehicles in parking Lots with CNN」を参照してください。 IEEE ITSC 2022 と Transformer 」では、研究チームはこのデータセットを使用して、CNN と Transformer アーキテクチャに基づいて駐車場のシーンにおける車両の意図 (Intent) と軌道 (Trajectory) を予測しました。 チームは CNN モデルを使用して、セマンティック イメージを構築することで車両の意図 (Intent) の分布確率を予測しました。このモデルは車両のローカル環境情報を構築するだけでよく、現在の環境に応じて利用可能な意図の数を継続的に変更できます。 チームは、Transformer モデルを改良し、意図 (Intent) の予測結果、車両の移動履歴、周囲環境のセマンティック マップを提供しました。マルチモーダルな意図と行動の予測を実現するための入力として。
概要
以上がバークレーは、駐車シナリオにおける初の高解像度データセットと予測モデルをオープンソース化し、ターゲット認識と軌道予測をサポートしました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。