目次
動物の顔認識はどのように機能しますか?
迷子ペットの捜索
特定の動物を識別する
科学研究の支援 - イルカの顔認識
農家による家畜の監視を支援
動物の顔認識技術の実装における課題
最適な特徴セットを決定する
動物の姿勢に依存します
包括的なトレーニング データ セットを提供する
ホームページ テクノロジー周辺機器 AI 動物の顔認識技術は何に使用されますか?

動物の顔認識技術は何に使用されますか?

Apr 08, 2023 pm 01:41 PM
AI 顔認識 野生動物

動物を正確に識別できるテクノロジーは、飼い主が迷子になった動物を再会させたり、農家が家畜を監視したり、研究者が野生動物を研究したりするのに役立ちます。歴史的に、マイクロチップはこの点で動物識別の最も一般的な方法でした。ただし、チップの埋め込みには侵襲的な手術が必要です。特殊な機器がなければ読み取ることができず、窃盗犯がマイクロチップを抜き出す可能性があります。もう 1 つの方法は DNA 分析です。これは正確ですが、非常に高価で時間がかかります。

動物の顔認識技術は何に使用されますか?

コンピュータ ビジョン ソリューションを活用した動物の顔認識 (顔だけではない場合もあります) は、上記の方法に代わる実行可能な代替手段として機能します。この技術には欠点もありますが、特定の状況では高い精度を発揮します。では、動物の顔認識はどのように機能しますか?このテクノロジーの進歩を妨げている課題は何ですか?

動物の顔認識はどのように機能しますか?

動物の顔認識ソリューション一般には、次の 3 つの主なステップがあります。

画像キャプチャ: 高解像度カメラで動物の写真を撮ります。一部のアルゴリズムは事前定義されたポーズでのみ機能するため、これらの基準を満たす画像を選択する必要があります。

特徴抽出: 動物の生体データの適合性を評価し、必要に応じて前処理を実行します。次に、アルゴリズムは認識に必要な特徴セットを抽出します。

マッチング: 抽出された特徴は数学的に表現され、他の画像と照合されます。たとえば、迷子のペット データベースで犬を探している場合、その犬の固有の特徴をデータベース内のすべての動物と照合します。

マッチングを実行するにはいくつかの方法があります。 1 つの方法は、クラスタリングに KNN や DBSCAN などのアルゴリズムを使用して、ターゲット画像に非常に近い一連の画像を取得することで、ユーザーは最適な画像を手動で選択できます。あるいは、確率的手法を使用して、最終結果を信頼水準として表すこともできます。

迷子ペットの捜索

ペットを失うことは、飼い主にとって悲痛な出来事です。そして統計によると、これは人々が考えているよりもはるかに一般的です。米国では、家庭で飼われている犬や猫の 3 匹に 1 匹が生涯のある時点で行方不明になり、そのうち 80% はまだ見つかっていません。ペットの顔認識に基づいた、飼い主がいなくなった友達を見つけるのに役立つツールがいくつかあります。

ForPaws: この動物の顔認識ソリューションは、鼻の先、肌の色、毛皮の種類に基づいて犬を識別します。動物の飼い主は、動物の「個人プロフィール」を作成するために少なくとも 3 枚の写真をアップロードするよう求められます。現在、このプログラムは 90% の精度で 130 の犬種を識別できます。

PiP: この動物識別会社は、動物の飼い主が動物の写真を登録してアップロードできるアプリを開発しました。システムは彼らのユニークな顔の特徴を分析します。 PiP は、飼い主が性別、体格、体重などの詳細情報を提供すれば、迷子の猫や犬をすべて特定できると主張している。

迷子のペットを見つけた人は誰でも、アプリを使用して飼い主を見つけることもできます。また、PiP のソリューションは、ソーシャル メディアでペットの投稿を継続的にスキャンし、関連コミュニティの住民にペットの行方不明に関するアラートを送信します。

Love Lost: Petco の Love Lost は、ペットの飼い主とペット保護施設を支援するもう 1 つのアプリです。飼い主はペットのプロフィールを作成することをお勧めします。そうすれば、ペットが行方不明になったときに、ソフトウェアがその動物の生体情報を新しいシェルターのメンバーや他のペット候補と照合し始めることができます。

特定の動物を識別する

場合によっては、特定の動物を認識するようにアルゴリズムをトレーニングすることが合理的です。たとえば、動物の飼い主は、飼っている動物を正確に識別し、警報を発したり、ドアを開けて動物を中に入れるなどの適切な措置を講じるシステムから恩恵を受けることができます。 WeTransfer のフロントエンド エンジニアである Arkaitz Garro 氏は、近所の猫を識別し、その猫が玄関に現れたときに Garro に警告を送信できる動物の顔認識ソリューションを開発しました。

猫の写真を撮るために、ガロさんは小型カメラと動き検出ソフトウェアを備えた Raspberry Pi を使用しました。動物がカメラに近づくと、写真が撮影され、Garro によってアップロードされた他の猫の写真と比較するために AWS 認識プラットフォームに送信されます。一致する場合は、エンジニアに通知されます。

マイクロソフトは、動物認識を実行し、ペット ポータルに接続できるモノのインターネット (IoT) デバイスも開発しました。それがあなたのペットであることを認識すると、デバイスはドアを開けてペットを中に入れます。

科学研究の支援 - イルカの顔認識

顔認識アルゴリズムは、家庭用動物の識別に加えて、他の種の識別にも使用できます。 『Journal of Marine Mammal Science』に掲載された研究では、イルカを識別するために必要な一連の特徴を調べました。研究者らは12年間にわたって150頭のバンドウイルカを追跡し、写真を撮った。研究チームは、イルカの顔と背びれを生涯を通じて識別に使用するというアイデアを評価したいと考えていました。

150 人の実験被験者のうち、完全なプロフィール (つまり、顔の左右と背びれの鮮明な写真) を持っていたイルカは 31 頭だけでした。この研究は、人間の専門家の意見と統計的手法に基づいて、同じイルカの異なる画像間の類似性を検出しました。

実験結果は、イルカの顔の特徴は時間が経っても一貫しており、識別目的に使用できることを示しています。成体になっても子犬を識別できるため、イルカの研究が大幅に容易になりました。

農家による家畜の監視を支援

家畜の識別は困難なプロセスとなる場合があります。豚の場合は、すべての豚が同じに見えるため、さらに困難になります。でも牛は少し特殊で、白と黒で形も違います。しかし、牛の場合は、カメラをどこに設置するかという別の課題が生じます。牛は好奇心旺盛な動物で、周囲の小さな変化にも気づきます。彼らはしばしばカメラをなめたり、その他の方法でカメラと対話しようとします。

しかし、個々の牛を識別できるシステムを構築できれば、農家にとっては非常に役立つでしょう。このソリューションは、動物の健康状態と食事パターンを動物のアイデンティティに適合させます。人工知能で強化されたこのシステムは、病気や異常行動の兆候を検出し、緊急事態が発生した場合に農家に通知できるようになります。

Beijing Xiangchuang Technology の中核となるアルゴリズム プラットフォームは、豚、牛、羊、ロバなどの家畜のデータ収集と顔認識を実現し、1,000 万件を超える家畜の顔データを蓄積しました。これは、農家が洗練された繁殖管理を行うのを支援するだけでなく、銀行、保険、その他の金融機関が繁殖産業でビジネスを行う際のリスク評価と早期警告システムを確立するのにも役立ちます。

動物の顔認識技術の実装における課題

動物の顔認識技術は、現在のかなり高度な人間の顔認識技術に比べてはるかに遅れています。研究者らは約4年前に動物の顔認識の実験を始めたが、一般的な技術の精度は依然としてかなり低い。一方、特定の動物の識別など、特定の目的を持ったソリューションは正確である可能性があります。

動物の顔認識ソリューションを実装したい企業は、次の 3 つの主要な課題を考慮する必要があります。

最適な特徴セットを決定する

科学者は特徴ベクトルを指定しました。ユニークな顔認識。ただし、同じアプローチは動物には機能しません。どの特徴を使用する必要があり、それらをどのように解釈するかがわからないからです。たとえば、人々を扱う場合、科学者は変分オートエンコーダ (VAE) アーキテクチャを使用して顔から特徴を抽出できます。この方法では、人物の写真が、肌の色合いや表情などの必要な特徴を含むベクトルに圧縮されます。

動物の顔認識に関しては、現在、信頼できる特徴ベクトルはありません。信頼できる固有ベクトルの課題を解決することで、この分野の研究が大きく前進します。

これに関するオープンソースの例は、犬認識の深層学習ベースの実装である DogFaceNet です。犬の目と鼻を特徴セットとして使用します。このソリューションは、全体的な目的が犬の品種を区別することである場合にはかなりうまく機能しますが、個々の動物を区別することになると、パフォーマンスはかなり悪くなります。

動物の姿勢に依存します

別の例は、ローカル バイナリ パターン ヒストグラム (LBPH) アルゴリズムを使用することです。このアルゴリズムは、画像をピクセルに変換し、異なる画像のピクセル値を比較することで動作します。画像。この方法は動物の姿勢に依存するため、姿勢の変化に敏感になります。

人間にとって、特定のポーズをとってじっと座ることは簡単です。しかし、犬や猫を特定の位置で静止させようとすると、事態はさらに複雑になります。

包括的なトレーニング データ セットを提供する

トレーニングを効果的にするには、データが多様であり、アルゴリズムが実行すると予想されるすべてのタスクをカバーしている必要があります。たとえば、アルゴリズムがさまざまな犬種を識別することを想定している場合、データセットはさまざまな角度からキャプチャされたすべての犬種を適切にカバーし、適切にラベル付けする必要があります。ここで問題が発生する可能性があることがいくつかあります。たとえば、誰かが雑種の写真を投稿したり、誰かがその写真に間違ったラベルを付けたり、間違った品種名を割り当てたりする可能性があります。このような問題を回避するには、専門家がデータセット内のすべての写真を 1 つずつ確認して、画像の正当性とラベルの正確性を検証する必要があります。

動物の顔認識分野の進歩は、大規模な動物を正確に識別するために使用できる最適な特徴の組み合わせを研究者がまだ特定できていないために妨げられています。それでも、特定の動物や家畜や野生動物の小グループの識別など、限られたデータを操作して成功しているアプリケーションもいくつかあります。

独自の動物の顔認識システムを構築している場合は、動物は非協力的な生体認証ユーザーであることに留意してください。カメラをなめると主張する人もいれば、写真を撮るために立つことを拒否する人もいます。


以上が動物の顔認識技術は何に使用されますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Bytedance Cutting が SVIP スーパー メンバーシップを開始: 継続的な年間サブスクリプションは 499 元で、さまざまな AI 機能を提供 Jun 28, 2024 am 03:51 AM

このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Rag と Sem-Rag を使用したコンテキスト拡張 AI コーディング アシスタント Jun 10, 2024 am 11:08 AM

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

GenAI および LLM の技術面接に関する 7 つのクールな質問 GenAI および LLM の技術面接に関する 7 つのクールな質問 Jun 07, 2024 am 10:06 AM

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります 微調整によって本当に LLM が新しいことを学習できるようになるのでしょうか: 新しい知識を導入すると、モデルがより多くの幻覚を生成する可能性があります Jun 11, 2024 pm 03:57 PM

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

あなたが知らない機械学習の 5 つの流派 あなたが知らない機械学習の 5 つの流派 Jun 05, 2024 pm 08:51 PM

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

SKハイニックスは8月6日に12層HBM3E、321層NANDなどのAI関連新製品を展示する。 SKハイニックスは8月6日に12層HBM3E、321層NANDなどのAI関連新製品を展示する。 Aug 01, 2024 pm 09:40 PM

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス

SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 Jul 17, 2024 pm 06:37 PM

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性​​を実証しています。 「S」で始まる関連研究

See all articles