目次
01 Outlook の概要
02 背景と動機
03 新しいアルゴリズムの研究
04 実験と視覚化
ホームページ テクノロジー周辺機器 AI 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

Jun 06, 2024 pm 12:33 PM
アルゴリズム 検出

01 Outlook の概要

現在、検出効率と検出結果の適切なバランスを取ることは困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。

02 背景と動機

リモートセンシング技術の急速な発展により、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学リモートセンシング画像が使用されてきました。物体検出は、リモート センシング画像の解釈において重要な役割を果たし、リモート センシング画像のセグメント化、説明、ターゲット追跡に使用できます。ただし、従来のほとんどのデータセットには地上ビューが含まれているのに対し、航空光学式リモート センシング画像は、比較的広い視野と高高度の必要性により、スケールの多様性、視点の特異性、ランダムな向き、背景の複雑さの高さを示します。その結果、人工的な特徴検出を構築するために使用される技術には、従来、精度と速度に大きな違いがあるという記録がありました。社会のニーズと深層学習の発展の支援により、光学式リモートセンシング画像におけるターゲット検出にニューラルネットワークを使用することが必要となっています。

現在、深層学習を組み合わせて光学式リモートセンシング写真を分析するターゲット検出アルゴリズムは、教師あり、教師なし、弱教師ありの 3 つのタイプに分類できます。ただし、教師なしアルゴリズムや弱く教師ありのアルゴリズムは複雑で不確実性があるため、教師ありアルゴリズムが最も一般的に使用されます。さらに、教師あり物体検出アルゴリズムは 1 段階または 2 段階に分けることができます。航空機は通常空港に位置し、船舶は通常港や海洋に位置するという仮定に基づいて、ダウンサンプリングされた星画像で空港と港を検出し、検出された物体を元の超高解像度衛星画像にマッピングし直すことで、検出することができます。異なるサイズのオブジェクトを同時に。一部の研究者は、ターゲット方向のランダム化問題を解決することにより、リモートセンシング画像におけるターゲット検出の精度を向上させる、RCNN に基づく回転ターゲット検出方法を提案しました。

03 新しいアルゴリズムの研究

現在の YOLO シリーズ検出ヘッドのほとんどは FPN および PAFPN の出力特性に基づいています。その中で、YOLOv3 などの FPN ベースのネットワークとそのバリアントを図に示します。以下に、一方向融合機能を出力に直接利用します。 PAFPN アルゴリズムに基づく YOLOv4 および YOLOv5 は、これに基づいて低レベルから高レベルへのチャネルを追加し、低レベル信号を上向きに直接送信します (下図 b)。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

上の図に示すように、一部の研究では、TPH-YOLOv5 モデルの特定の検出タスクのために検出ヘッドが追加されました。上の図 b と図 c では、PAFPN 機能のみが出力に使用でき、FPN 機能は十分に活用されていません。したがって、上の図 d に示すように、YOLOv7 は 3 つの補助ヘッドを FPN 出力に接続しますが、補助ヘッドは「粗い選択」にのみ使用され、重み評価は低くなります。 SSDの検出ヘッドはYOLOネットワークのラフすぎるアンカーセット設計を改善するために提案されており、マルチスケールに基づいた緻密なアンカー設計構成を提案している。図 f に示すように、この戦略では PANet と FPN の機能情報を同時に利用できます。さらに、出力を直接追加する 64 倍のダウンサンプリング プロセスがあり、ネットワークに以前のグローバル情報が含まれるようになります。

マルチ検出ヘッド方式は、ネットワークの出力機能を有効に活用できます。改良された YOLO は、高解像度のリモート センシング写真用の物体検出ネットワークです。以下の図に示すように:

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

バックボーン ネットワークの基本構造は、C3 モジュールと畳み込みモジュールをコアとした CSP 高密度ネットワークです。データ拡張後、画像がネットワークに供給され、カーネル サイズ 6 の Conv モジュールによるチャネル ミキシングの後、多くの畳み込みモジュールが特徴の取得を実行します。 SPPF と呼ばれる機能拡張モジュールの後、Neck の PANet に接続されます。ネットワークの検出能力を向上させるために、双方向の特徴融合が実行されます。 Conv2d は、融合されたフィーチャ レイヤーを個別に拡張してマルチレイヤー出力を生成するために使用されます。以下の図に示すように、NMS アルゴリズムはすべての単層検出器の出力を結合して、最終的な検出フレームを生成します。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

以下の図 b は、改良された YOLO ネットワークの各モジュールの構造構成を示しています。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

Conv には 2D 畳み込み層、BN 層のバッチ正規化と Silu 活性化関数が含まれ、C3 には 2 つの 2D 畳み込み層とボトルネック層が含まれ、Upsample はアップサンプリング層です。 SPPF モジュールは SPP モジュールのアクセラレーション バージョンであり、MAB モジュールは前述のとおり、ECA は左下隅に示されているとおりです。次元削減を行わずにチャネルレベルのグローバル平均プーリングを行った後、サイズ k の高速 1D 畳み込みを使用してローカルのクロスチャネルインタラクション情報を取得し、各チャネルとその k 個の隣接チャネルの関係を考慮して、ECA を効率的に実行します。上記の 2 つの変換は、2 つの空間方向に沿って特徴を収集し、一対の方向認識特徴マップを生成します。その後、これらが連結され、畳み込み関数とシグモイド関数を使用して変更され、アテンション出力が提供されます。

04 実験と視覚化

SIMD データセットは、マルチ カテゴリ、オープン ソース、高解像度のリモート センシング物体検出データセットであり、図 4 に示すように、合計 15 のカテゴリが含まれています。さらに、SIMD データセットは中小規模のターゲット (w

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

SPPF モジュールの出力を出力ヘッダーに接続して、画像内の大きなターゲットを識別できます。ただし、SPPF モジュールの出力には複数の接続があり、複数のスケールのターゲットが含まれるため、大きなオブジェクトを識別するために検出ヘッドに直接使用すると、上の図に示すように、モデルの表現が不十分になります。 MAB モジュール 一部の検出結果のヒートマップを視覚的に比較します。 MAB モジュールを追加した後、検出ヘッドは大きなターゲットの検出に重点を置き、小さなターゲットの予測を他の予測ヘッドに割り当てます。これにより、モデルの表現効果が向上し、ターゲットに基づいて検出ヘッドを分割する要件により適合します。 YOLO アルゴリズムのサイズ。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

いくつかのテスト結果を上の写真に示します。それぞれの検出結果から判断すると、他のアルゴリズムと大きな違いはありませんが、私たちが研究したアルゴリズムは、他のアルゴリズムと比較して、時間の大幅な増加を避けながらモデルの検出効果を向上させ、アテンションメカニズムを使用しています。モデルの表現効果を高めます。

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用

以上が改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

i7-7700 が Windows 11 にアップグレードできない場合の解決策 i7-7700 が Windows 11 にアップグレードできない場合の解決策 Dec 26, 2023 pm 06:52 PM

i77700 のパフォーマンスは win11 を実行するのに完全に十分ですが、ユーザーは i77700 を win11 にアップグレードできないことがわかります。これは主に Microsoft によって課された制限が原因であるため、この制限をスキップする限りインストールできます。 i77700 は win11 にアップグレードできません: 1. Microsoft が CPU バージョンを制限しているためです。 2. win11 に直接アップグレードできるのは、Intel の第 8 世代以降のバージョンのみです 3. i77700 は第 7 世代として、win11 のアップグレードのニーズを満たすことができません。 4. ただし、i77700はパフォーマンス的にはwin11を快適に使用するのに完全に可能です。 5. したがって、このサイトの win11 直接インストール システムを使用できます。 6. ダウンロードが完了したら、ファイルを右クリックして「ロード」します。 7. ダブルクリックして「ワンクリック」を実行します。

CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 Mar 26, 2024 pm 12:41 PM

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる 人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる Mar 22, 2024 pm 10:10 PM

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

MIT の最新傑作: GPT-3.5 を使用して時系列異常検出の問題を解決する MIT の最新傑作: GPT-3.5 を使用して時系列異常検出の問題を解決する Jun 08, 2024 pm 06:09 PM

今日は、MIT が先週公開した記事を紹介します。GPT-3.5-turbo を使用して時系列異常検出の問題を解決し、時系列異常検出における LLM の有効性を最初に検証しました。プロセス全体に微調整はなく、GPT-3.5-turbo は異常検出に直接使用されます。この記事の核心は、時系列を GPT-3.5-turbo が認識できる入力に変換する方法とその設計方法です。 LLM が異常検出タスクを解決できるようにするためのプロンプトまたはパイプライン。この作品について詳しく紹介していきます。画像用紙タイトル:Large languagemodelscanbeゼロショタノマリデテ

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

See all articles