この記事では主に、自動運転技術で一般的に使用されるいくつかの座標系と、それらがどのように完了するかを紹介します。関連と変換、そして最後に統合された環境モデルを構築します。ここでの焦点は、車両からカメラの剛体への変換 (外部パラメータ)、カメラから画像への変換 (内部パラメータ)、および画像からピクセル単位への変換を理解することです。 3D から 2D への変換には、対応する歪み、変換などが発生します。
ポイント:自車座標系カメラボディ座標系書き換える必要があるのは、平面座標系ピクセル座標系 難易度: 必須 画像の歪みを考慮して、画像平面上で歪み除去と歪みを補正します。
座標系変換にあります。そして、変換は 同次座標 の表現を通じて完了する必要があります。 3 つのセンサー座標系
は、車線、車両、歩行者などの 2 次元画像から 3 次元世界の要素と情報を抽出および復元し、それらの要素とそれ自体に対する相対位置を計算します。 知覚アルゴリズムとカメラに関係する座標系には画像座標系(ピクセル座標系)とカメラ座標系がありますが、書き換える必要があるのは平面座標系です 3.1.1 画像座標系 (またはピクセル座標系)
コンピュータに保存されている写真や画像の場合、通常は左上隅が原点となり、正の x 方向は右、y は下方向です。正の方向では、最も一般的に使用される単位は「ピクセル」です。画像座標系は、(Xv, Yv) とラベル付けされた 2 次元座標系です。
書き換える必要がある内容は次のとおりです。 3.1.2 カメラ座標系
画像座標系の x 軸は次のとおりです。 y 軸は右にあり、y 軸は右にあるため、カメラ座標系はレンズの主光軸の中心を原点とします。一般に、正の方向は x 軸の右方向、正の方向は y 軸の下方向、正の方向は z 軸の前方向です。このように、x 方向と y 方向は画像座標系の方向と一致し、z 方向は被写界深度を表します。カメラ座標系は (Xc, Yc)
書き換える必要があるものは次のとおりです。 3.1.3 書き換える必要があるのは次のとおりです: 平面座標系 (または撮像座標系) )
3 次元空間から 2 次元画像へのマッピング関係を 定量的に記述するために、書き換える必要があるものをグラフィックスで導入します: 平面座標系。これはカメラ座標系の平行移動です。中心は依然としてカメラの主光軸上にあります。光軸の中心からの距離は、カメラの焦点距離に等しいです。
カメラが光軸の中心より後ろにあることはわかっています。縮小された倒立像がフィルム上に現れます。これが実像面 (Xf、Yf) です。ただし、解析・計算の都合上、光軸中心よりも前に虚像面を設けます。仮想像面上の像は正立像であり、その大きさは実際の倒立像と同じです。書き換える必要があるのは平面座標系#です。
## 3.5 世界座標系
##特定の状況に応じて、カメラによって導入される任意のオブジェクトを表すことができます。単位はメートル、カメラ座標系
、画像座標系
、ピクセルです。座標システム4 つのライダー座標系ライダー (光検出および測距) は、レーザー ビームを使用して物体の距離を測定する リモート センシング テクノロジー
。 360 度回転して光線を放射し、異なるターゲットの反射率に基づいて電気雲を形成します。自動運転やロボット工学の分野では、周囲環境の 3D 情報を取得するためのメインセンサーとして LiDAR がよく使用されます。ほとんどの場合、LiDAR 座標系は右手系ですが、具体的な定義は LiDAR の製造元によって異なる場合があります。XX 軸 : 通常、LIDAR の前を指します。レーザー ビームが真正面に発射されると、その方向からの距離測定により X 軸に正の値が生成されます。 Y 軸 : 通常、LIDAR の左側を指します。レーザー ビームが左に直接発射されると、その方向からの距離測定値は Y 軸に正の値を生成します。 Z 軸 : 通常、LIDAR の上、X 軸と Y 軸に垂直な点を指します。高さの測定は通常 Z 軸に沿って行われ、正の値はオブジェクトが LiDAR デバイスより高いことを表し、負の値はオブジェクトが LiDAR デバイスより低いことを表します。
、この座標系を世界座標系と呼びますが、自車座標系は一般的に車体後軸の中心を原点とします(後軸の中心は相対的に変化しないため)車の揺れに合わせて) 、左前上または右前 上部の空間座標系では、左(右)はほぼ水平、正面はほぼ垂直、上部は地上の空間を指します。座標系は車の動きに合わせて移動します。 感知して出力する必要があるすべての下流ターゲットは、独自の車両座標系の下にある必要があり、BEV 視点ターゲットもこの座標系の下で参照されます
## 一般に、3 次元空間座標系は、3 つの直交軸 X、Y、Z を使用してオブジェクトの 位置
を表し、その周りの回転角度を使用します。これら 3 つの直交軸 (ロール角、ピッチ角、ヨー角) は、物体の 姿勢を表します。時間座標系には 1 つの次元しかありません。表現の便宜上、通常、空間座標と時間座標を分けて説明します。 6 台のカメラの内部パラメータと外部パラメータ
カメラの内部パラメータは定数であり、使用中に変化しません が、使用前に調整する必要があります。カメラの撮影プロセスは、 3 次元カメラ座標系から 2 次元座標系、つまり平面座標系にマッピングし、さらに画像座標系にマッピングするプロセスに抽象化できます。 6.2 焦点距離 (f)
#
この行列は通常、内部パラメータ行列またはカメラ行列と呼ばれます。
距離や奥行き情報の取得など、2 次元画像を通じて 3 次元カメラ座標系におけるオブジェクトの位置を推定します。 。 2 次元画像から 3 次元の距離情報を取得する . ワールド座標系でのオブジェクトの位置を取得する必要がある場合は、# の姿勢も知る必要があります。 ## ワールド座標系のカメラ。。この姿勢表現はカメラの外部パラメータと呼ばれ、カメラ座標とワールド座標系との相対的な位置関係を決定するために使用されます。自動運転アプリケーションでは、この位置関係を得るために一連のキャリブレーションと位置決め作業が必要になります。カメラは、他の座標系を基準にして行列を回転および平行移動します。回転の外部パラメータは、前述のオイラー角 [ヨー、パッチ、ロール] です。回転順序は一般に (z-y-x)、単位度です。平行移動の外部パラメータは、平行移動です。カメラからターゲット座標系までの距離、単位メートル
7 車両座標系と世界座標系- 車両は世界を移動するため、自車座標系と世界座標系の関係は時間となります。変化。 - これら 2 つの座標系間で変換するには、通常、変換行列または変換 (通常は回転と平行移動で構成されます) が必要です。この変換は、さまざまなセンサー (GPS、IMU、LiDAR など) およびアルゴリズム (SLAM など) を通じて取得できます。 - 変換は 4x4 の同次座標行列として表現できるため、ある座標系から別の座標系に変換できます。
自車座標系と世界座標系は多くの場合同じであり、この記事ではこのように理解しています。8 つの座標系間の変換座標系の関係
、ワールド座標系からカメラ座標系への変換関係も同様です。異なる軸の周りで異なる角度を回転すると、異なる回転行列が生成されます。 Z 軸を中心に θ を回転させる概略図:
##最後に、回転行列として簡単にまとめることができます。
翻訳: カメラ座標点 () をワールド座標点まで移動し、移動距離は () です。 8.2 カメラ座標系を次のように変換します。画像座標系9 つのまとめ
自動運転のさまざまな座標系を整理し、それらの違いを示しました。自動運転の各種座標系の関係を求め、最終的にピクセル座標系とワールド座標系の変換関係を求めます。
以上が座標系の変換を本当にマスターしましたか?自動運転と切り離せないマルチセンサーの問題の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。