ホームページ バックエンド開発 Python チュートリアル Python でのオブジェクト検出の初心者ガイド

Python でのオブジェクト検出の初心者ガイド

Sep 07, 2024 pm 02:01 PM

A Beginner’s Guide to Object Detection in Python

物体検出は、コンピューター ビジョンの最も興味深い分野の 1 つであり、機械が画像やビデオ内の物体を認識して位置を特定できるようになります。このガイドでは、Python を使用したオブジェクト検出について紹介し、一般的なライブラリを使用して基本的な検出パイプラインを実装するのに役立ちます。初心者でも、既存のスキルをさらに強化したい場合でも、このチュートリアルは開始するための重要な洞察を提供します。


物体検出とは何ですか? ?

物体検出には 2 つの主要なタスクが含まれます:

  1. 画像分類: 画像内にどのオブジェクトが存在するかを決定します。
  2. オブジェクトの位置特定: 境界ボックスを使用してオブジェクトの位置を検索します。

これにより、モデルがクラス ラベルを予測するだけの単純な画像分類よりも複雑になります。物体検出には、画像内の物体のクラスと位置の両方を予測する必要があります。


人気の物体検出アルゴリズム ?

1. YOLO (一度だけ見てください)

  • スピードで知られる YOLO は、境界ボックスとクラス確率を同時に予測するリアルタイムの物体検出システムです。

2. SSD (シングルショットマルチボックス検出器)

  • SSD はシングル パスでオブジェクトを検出し、特徴マップを使用してさまざまなスケールでオブジェクトを検出することに優れています。

3. R-CNN の高速化

  • 最初に地域の提案を生成し、次にそれらを分類する 2 段階のモデル。 YOLO や SSD よりも正確ですが、速度は遅くなります。

Python 環境をセットアップする ?️

Python でオブジェクト検出を開始するには、いくつかのライブラリが必要です。

ステップ 1: Python をインストールする

python.org にアクセスし、Python の最新バージョン (3.8 以降) をダウンロードします。

ステップ 2: 必要なライブラリをインストールする

画像処理には OpenCV を使用し、オブジェクト検出には TensorFlow を使用します。

pip install opencv-python tensorflow
ログイン後にコピー

オプションで、Matplotlib をインストールして、検出結果を視覚化します。

pip install matplotlib
ログイン後にコピー

物体検出用の事前トレーニング済みモデル ?

最初からトレーニングする代わりに、TensorFlow のオブジェクト検出 API または PyTorch の事前トレーニングされたモデルを使用します。事前トレーニングされたモデルは、COCO (Common Objects in Context) などのデータセットを活用することでリソースを節約します。

このチュートリアルでは、高速で正確な事前トレーニング済みモデルである TensorFlow の ssd_mobilenet_v2 を使用します。


TensorFlow と OpenCV によるオブジェクト検出 ?‍?

シンプルなオブジェクト検出パイプラインを実装する方法は次のとおりです。

ステップ 1: 事前トレーニングされたモデルをロードする

import tensorflow as tf

# Load the pre-trained model
model = tf.saved_model.load("ssd_mobilenet_v2_fpnlite_320x320/saved_model")
ログイン後にコピー

モデルは TensorFlow のモデル ズーからダウンロードできます。

ステップ 2: 画像をロードして処理する

import cv2
import numpy as np

# Load an image using OpenCV
image_path = 'image.jpg'
image = cv2.imread(image_path)

# Convert the image to a tensor
input_tensor = tf.convert_to_tensor(image)
input_tensor = input_tensor[tf.newaxis, ...]
ログイン後にコピー

ステップ 3: オブジェクト検出を実行する

# Run inference on the image
detections = model(input_tensor)

# Extract relevant information like bounding boxes, classes, and scores
num_detections = int(detections.pop('num_detections'))
detections = {key: value[0, :num_detections].numpy() for key, value in detections.items()}
boxes = detections['detection_boxes']
scores = detections['detection_scores']
classes = detections['detection_classes'].astype(np.int64)
ログイン後にコピー

ステップ 4: 結果を視覚化する

# Draw bounding boxes on the image
for i in range(num_detections):
    if scores[i] > 0.5:  # Confidence threshold
        box = boxes[i]
        h, w, _ = image.shape
        y_min, x_min, y_max, x_max = box

        start_point = (int(x_min * w), int(y_min * h))
        end_point = (int(x_max * w), int(y_max * h))

        # Draw rectangle
        cv2.rectangle(image, start_point, end_point, (0, 255, 0), 2)

# Display the image
cv2.imshow("Detections", image)
cv2.waitKey(0)
cv2.destroyAllWindows()
ログイン後にコピー

このコードは画像をロードし、オブジェクトを検出し、境界ボックスでそれらを視覚化します。信頼性のしきい値は 50% に設定され、信頼性の低い検出が除外されます。


高度なトピック ?

物体検出スキルを次のレベルに引き上げる準備はできましたか?

  • カスタム オブジェクト検出: TensorFlow または PyTorch を使用して、独自のデータセットでカスタム モデルをトレーニングします。
  • リアルタイム検出: セキュリティや自動運転などのアプリケーションのライブ ビデオ ストリームに物体検出を適用します。
  • エッジ デバイスの導入: モバイルおよび IoT デバイスのオブジェクト検出モデルを最適化します。

結論 ?

Python のオブジェクト検出は、ヘルスケア、セキュリティ、自動運転などの業界に可能性の世界を開きます。 TensorFlow や OpenCV などのツールを使用すると、YOLO や SSD などの事前トレーニングされたモデルを使用して検出パイプラインを迅速に実装できます。基本を理解したら、リアルタイム検出やカスタム モデルのトレーニングなど、より高度なトピックを検討できます。

次に物体検出をどこに適用しますか?以下のコメント欄で話し合いましょう!


キーワード: 物体検出、Python、コンピューター ビジョン、OpenCV、TensorFlow、YOLO、SSD、高速 R-CNN

以上がPython でのオブジェクト検出の初心者ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

LinuxターミナルでPythonバージョンを表示するときに発生する権限の問題を解決する方法は? LinuxターミナルでPythonバージョンを表示するときに発生する権限の問題を解決する方法は? Apr 01, 2025 pm 05:09 PM

LinuxターミナルでPythonバージョンを表示する際の許可の問題の解決策PythonターミナルでPythonバージョンを表示しようとするとき、Pythonを入力してください...

中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか? 中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか? Apr 02, 2025 am 07:15 AM

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は? プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は? Apr 02, 2025 am 07:18 AM

10時間以内にコンピューター初心者プログラミングの基本を教える方法は?コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

あるデータフレームの列全体を、Python内の異なる構造を持つ別のデータフレームに効率的にコピーする方法は? あるデータフレームの列全体を、Python内の異なる構造を持つ別のデータフレームに効率的にコピーする方法は? Apr 01, 2025 pm 11:15 PM

PythonのPandasライブラリを使用する場合、異なる構造を持つ2つのデータフレーム間で列全体をコピーする方法は一般的な問題です。 2つのデータがあるとします...

uvicornは、serving_forever()なしでhttpリクエストをどのように継続的に聞いていますか? uvicornは、serving_forever()なしでhttpリクエストをどのように継続的に聞いていますか? Apr 01, 2025 pm 10:51 PM

UvicornはどのようにしてHTTPリクエストを継続的に聞きますか? Uvicornは、ASGIに基づく軽量のWebサーバーです。そのコア機能の1つは、HTTPリクエストを聞いて続行することです...

Investing.comの反クローラーメカニズムをバイパスするニュースデータを取得する方法は? Investing.comの反クローラーメカニズムをバイパスするニュースデータを取得する方法は? Apr 02, 2025 am 07:03 AM

Investing.comの反クラウリング戦略を理解する多くの人々は、Investing.com(https://cn.investing.com/news/latest-news)からのニュースデータをクロールしようとします。

See all articles