翻訳者|Cui Hao
レビュアー|Sun Shujuan
動物を正確に識別できるテクノロジーは、飼い主が迷子のペットと再会したり、農家が家畜を監視したり、研究者が野生動物を研究したりするのに役立ちます。上記の応用シナリオに基づくと、マイクロチップは最も一般的なペット識別方法です。しかし、チップの埋め込みには侵襲的手術、チップを読み取るための特殊な機器が必要であり、窃盗犯にマイクロチップを抜き取られるリスクも伴います。もう 1 つの方法は DNA 分析です。これは正確ではありますが、非常に高価で時間がかかります。今日は顔認識による動物の識別方法を紹介したいと思います。
コンピューター ビジョン ソリューションによるペットの顔認識は、上記のソリューションの代替として使用できます。このテクノロジーには欠点もありますが、特定の状況では高い精度を発揮できます。
それでは、ペットの顔認識はどのように機能するのでしょうか?技術の進歩を妨げている課題は何ですか?ペットの顔認識はどのように機能しますか?
一般に、ペットの顔認識ソリューションは主に 3 つのステップに分かれています。
(1) 画像のキャプチャ: 高解像度のカメラで動物の写真を撮影します。一部のアルゴリズムは事前定義されたポーズでのみ機能するため、これらの基準を満たす画像を選択する必要があります。
(2) 特徴抽出: 動物の生体データの適合性を評価し、必要に応じて前処理を実行します。次に、アルゴリズムは認識に必要な特徴セットを抽出します。
(3) 特徴マッチング: 抽出された特徴は数学的に表現され、他の画像とマッチングされます。たとえば、迷子のペット データベースで犬を探している場合、その犬の固有の特徴をデータベース内のすべての動物と照合します。
マッチングを実行するにはいくつかの方法があります。 1 つの方法は、クラスタリングに KNN や DBSCAN などのアルゴリズムを使用することです。これにより、ターゲット画像に非常に近い一連の画像が生成され、ユーザーは最適な画像を手動で選択できます。
さらに、確率的手法を導入して、最終結果を信頼水準として表現することもできます。たとえば、認識対象が猫で、アルゴリズムによって撮影画像が猫であると判断された場合、信頼度は 90%、犬であると判断された場合、信頼度は 10% となります。
ペットの顔認識
ペットの顔認識を実生活で使用する方法の例を次に示します。これらのシステムの中には、成功し、普及し、さらには商業的なソリューションとなっているものもあれば、仮説を検証するための学術的な試みであるものもあります。
迷子動物の捜索
ペットを失うことは、飼い主にとって悲痛な事です。統計によると、このような事件は人々が考えているよりも一般的です。米国では、世帯の 3 分の 1 が飼っているペット (犬/猫) の 80% が見つかっていません。飼い主がいなくなった友達を見つけるのに役立つペットの顔認識プログラムがいくつかあります。
ForPaws
ForPaws は、犬の鼻先と皮膚に基づいてペットの識別を使用する APP 製品です。色と毛皮の種類を確認して識別します。ペットのプロフィールを作成するには、飼い主が少なくとも 3 枚の写真をアップロードする必要があります。現在、このソリューションは 90% の精度で 130 の犬種を識別できます。
PIP
このペット識別会社は、ペットの飼い主が動物の写真を登録してアップロードできるアプリを開発しました。システムはペットの顔の特徴を分析します。 PiPは、飼い主が性別、大きさ、体重などの追加情報を提供できれば、迷子になったすべての犬や猫を特定できると主張している。
迷子のペットを見つけた人は誰でも、アプリを使用してペットの飼い主を見つけることができます。また、PiP のソリューションは、ソーシャル メディアで動物の投稿を継続的にスキャンし、関連するコミュニティの住民にペットの迷子の警告を送信します。
Love Lost
Petco の Love Lost は、ペットの飼い主と動物保護施設向けのアプリです。ユーザーは動物のプロフィールを作成できるため、ペットが行方不明になったときに、ソフトウェアがペットの生体情報と、保護施設に新たに到着した動物や他の候補動物との照合を開始できます。
特定のペットを識別する
トレーニング アルゴリズムを使用して、特定のペットを識別できます。たとえば、ペットの飼い主は自分のペットを正確に識別し、アラームを送信したり、ペットを入れるためにドアを開けたりするなど、その後のアクションを実行できます。
Aakaitz Garro フロントエンド エンジニアがペットのフェイシャル ソリューションを開発
WeTransfer のフロントエンド エンジニアである Arkaitz Garro は、近所の猫を識別し、その小さな男が玄関に現れたときに Garro (または指定された人) に警告を送信できるペットの顔認識ソリューションを開発しました。猫の写真を撮るために、ガロさんは小型カメラと動き検出ソフトウェアを備えた Raspberry Pi を使用しました。動物がカメラに近づくと写真が撮影され、AWS Recognition プラットフォームに送信され、Garro によってアップロードされた他の猫の画像と比較されます。一致が成功すると、エンジニアに通知されます。
ペット識別用の Microsoft IoT デバイス
同様に、Microsoft は、ユーザーがペットが家の中に入る場所にインストールできる IoT デバイスを開発しました。ペットが認識されると、デバイスのロックが解除され、動物を中に入れることができます。
科学研究の支援 - イルカの顔認識
家庭用ペットの識別に加えて、顔認識アルゴリズムを使用して他の種を検出することもできます。 『Journal of Marine Mammal Science』に掲載された研究では、イルカを識別するために必要な一連の特徴を調査しました。研究者らは12年間にわたって150頭のバンドウイルカを追跡し、写真を撮った。研究チームはイルカの一生を通じて顔と背びれを特定し、このアプローチの実現可能性を評価した。
これら 150 人の被験者を使用した結果、包括的なプロフィール (顔と背びれの左右の鮮明な写真) を持つイルカは 31 頭だけになりました。この研究は、人間の専門家の意見と統計的手法に基づいて、同じイルカの異なる画像間の類似性を検出しました。
この実験の結果は、イルカの顔の特徴は時間が経っても一貫しており、識別目的に使用できることを示しています。この技術は大人のイルカを識別し、イルカの成長の追跡を容易にすることができ、イルカ研究を大きく推進しました。
#同じイルカのさまざまな段階における特徴農家による家畜の監視を支援します
#家畜の識別は難しい場合があります。北京友瑞科技の創設者である趙金石氏は長年、農業分野のソフトウェア開発に携わっており、家畜の識別について独自の見解を持っている。同じですが、牛もそうします。比較的簡単です。牛は明らかに特別だからです。体の模様は白と黒で、形も異なります。」
牛とその「相互作用」 「しかし、牛の識別に関しては、カメラをどこに設置するかを決めるという課題が生じます。牛は好奇心旺盛な動物で、環境のわずかな変化でも注意を引きつけます。彼らはカメラを見つけると、それをなめることで「対話」します。しかし、課題はさておき、個々の牛を識別できるシステムを導入することは、ブリーダーにとって大きな助けとなるでしょう。このソリューションは、動物の健康状態、飲酒および食事のパターンを動物のアイデンティティと一致させます。人工知能の助けを借りて、動物の病気や異常行動の兆候を検出し、緊急時に飼育者に通知することが可能になります。
3. 顔認識の課題
ペットの顔認識ソリューションを実装する際には、主に 3 つの課題を考慮する必要があります。
#最適な機能セットの決定科学者は、顔認識用の特徴ベクトル。ただし、どの機能を使用する必要があり、それらをどのように解釈するかがわからないため、同じアプローチはペットには機能しません。たとえば、人々を扱う場合、科学者は変分オートエンコーダ (VAE) アーキテクチャを使用して顔から特徴を抽出できます。この方法では、人物の写真が、肌の色合いや表情などの必要な特徴を含むベクトルに圧縮されます。しかし、ペットの顔認識に関しては、現時点では信頼できる特徴ベクトルがありません。
信頼できる特徴ベクトル信頼できる特徴ベクトルを解決することは、この分野を大きく前進させるでしょう。オープンソースのサンプル DogFaceNet は、深層学習に基づいた犬認識の実装です。犬の目と鼻を特徴セットとして使用します。このソリューションは、全体的な目標が犬の品種を区別することである場合には、かなりうまく機能しますが、双子間の区別となると、そのパフォーマンスはかなり劣ります。
Animal Poseもう 1 つの例は、画像をピクセルに変換し、次のように操作するローカル バイナリ パターン ヒストグラム (LBPH) アルゴリズムを使用することです。異なる画像のピクセル値を比較します。この方法は動物の姿勢に依存するため、動物は姿勢の変化に敏感になります。このアプローチは時代遅れであることに言及する価値があります。現在、エンジニアはより高度な機能を使用する傾向があります。
動物にカメラに向かってポーズをとってもらう人間の場合、特定のポーズをとってじっと座ることは簡単です。しかし、犬や猫に特定のポーズで写真を撮らせようとすると、そう簡単ではありません。これには、ピクセルの類似性に依存するアルゴリズムなど、「姿勢に敏感な」顔認識アルゴリズムを適用する必要があります。
包括的なトレーニング データ セットを提供しますトレーニングを効果的にするには、データが多様であり、アルゴリズムが実行すると予想されるすべてのタスクをカバーしている必要があります。たとえば、アルゴリズムがさまざまな犬種を認識する場合、データセットにはさまざまな角度から取得され、正しくラベル付けされた情報ソースが含まれている必要があります。ここではさまざまなことが起こる可能性があります。たとえば、誰かが混合品種の画像を送信したり、誰かが画像に誤ってタグを付けたり、間違った品種名を割り当てたりする可能性があります。このような問題を回避するには、専門家がデータセット内のすべての写真を 1 つずつ確認して、画像の正当性とラベルの正確性を検証する必要があります。 ペットの顔認識分野の進捗状況研究者たちは、大規模な動物を正確に識別するために使用できる特徴の最適な組み合わせをまだ特定できていないという事実によって、研究の妨げとなっています。それにもかかわらず、特定の動物や家畜/野生動物の小グループの識別など、制限されたデータを処理して成功したアプリケーションがいくつかあります。独自のペットの顔認識システムを構築している場合は、動物は生体認証テクノロジーの非協力的なユーザーであることを忘れないでください。カメラをなめると主張する人もいれば、写真撮影を拒否する人もいます。不必要なトラブルを排除するために、姿勢や表情に依存しないアルゴリズムを設計できます。考慮すべきもう 1 つの問題は、プライバシー規制です。迷子のペットを見つけるアプリを構築したい場合、飼い主にペットの位置を明らかにする必要がありますか?飼い主の家にいるペットの写真でも、飼い主に関する個人情報が明らかになる可能性があります。 元のリンク: https://readwrite.com/pet-face-recognition-are-we-there-yet/ Cui Hao は、51CTO コミュニティ編集者兼シニア アーキテクトであり、ソフトウェア開発とアーキテクチャの経験が 18 年、分散アーキテクチャの経験が 10 年あります。元HPの技術専門家。彼は喜んで共有し、600,000 回以上読まれる人気の技術記事を多数執筆してきました。 『分散アーキテクチャの原則と実践』の著者。 4. 結論
翻訳著者紹介
以上がペットの顔認識は実装されていますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。