ホームページ よくある問題 顔認識の 3 つの古典的なアルゴリズムは何ですか?

顔認識の 3 つの古典的なアルゴリズムは何ですか?

Aug 21, 2020 am 11:03 AM
顔認識 アルゴリズム

顔認識の 3 つの古典的なアルゴリズムは、Eigenface、ローカル バイナリ パターン (LBP)、および Fisherface アルゴリズムです。

顔認識の 3 つの古典的なアルゴリズムは何ですか?

顔認識のための 3 つの古典的なアルゴリズム

Eigenface メソッド (Eigenface)

Eigenface テクノロジーは、顔または一般的な剛体認識、および顔処理を伴うその他の方法のために最近開発された方法です。顔認識に固有顔を使用する方法は、Sirovich と Kirby (1987) (「人間の顔の特徴付けのための低次元手順」) によって最初に提案され、Matthew Turk と Alex Pentland (「認識のための固有顔」) によって顔の分類に使用されました。 。まず、顔画像のバッチが、初期トレーニング画像セットの基本コンポーネントである「固有顔」と呼ばれる特徴ベクトルのセットに変換されます。認識プロセスは、新しい画像を固有面部分空間に投影し、部分空間内の投影点の位置と投影線の長さによってそれを決定および識別することです。

顔認識の 3 つの古典的なアルゴリズムは何ですか?

画像を別の空間に変換すると、同じカテゴリの画像は集まりますが、異なるカテゴリの画像は遠くに集まります。元のピクセル空間の異なるカテゴリの画像分布上、単純な線や面で区切ることは難しいですが、別の空間に変換することでうまく区切ることができます。

Eigenfaces が選択した空間変換手法は PCA (主成分分析) です。PCA は顔分布の主成分を取得するために使用されます。具体的な実装は、すべての顔画像の共分散行列の固有値分解を実行することです。対応する固有ベクトルが取得され、これらの固有ベクトルが「固有面」となります。各固有ベクトルまたは固有顔は、人間の顔間の変化や特徴を捕捉または記述することに相当します。これは、各面がこれらの固有面の線形結合として表現できることを意味します。

ローカル バイナリ パターン (LBP)

ローカル バイナリ パターン (LBP) は、コンピューター ビジョンの分野で分類に使用される視覚アルゴリズムです。画像テクスチャの特徴を記述するために使用される演算子である LBP は、1996 年にフィンランドのオウル大学の T. Ojala らによって提案されました (「特徴のある分布に基づく分類によるテクスチャ測定の比較研究」)。 2002 年に、T. Ojala らは、LBP に関する別の記事 (「ローカル バイナリ パターンによる多重解像度グレースケールおよび回転不変テクスチャ分類」) を PAMI に発表しました。この記事では、多重解像度、グレースケール不変性、回転不変性、および等価モードの改良された LBP 機能について非常に明確に説明しています。 LBP の中心となるアイデアは、中心ピクセルのグレー値をしきい値として使用し、それをそのフィールドと比較して、ローカル テクスチャ特徴を表す対応するバイナリ コードを取得することです。

顔認識の 3 つの古典的なアルゴリズムは何ですか?

#LBP は、識別の基礎として局所的な特徴を抽出します。 LBP 法の大きな利点は、照明の影響を受けないことですが、それでも姿勢や表情の問題は解決できません。しかし、固有顔法に比べて、LBP の認識率は大幅に向上しました。

Fisherface アルゴリズム

線形判別分析は、次元を削減しながらカテゴリー情報を考慮します。1936 年に統計学者 R.A. フィッシャー卿によって発明されました (「分類学的問題における複数の測定値の使用」) 》)。クラス間分散を最大化し、クラス内分散を最小化する機能を組み合わせる方法を見つけるため。考え方は単純です。低次元表現では、同じクラスがしっかりとクラスター化され、異なるクラスは可能な限り離れている必要があります。 1997 年、ベルヒューマーはフィッシャー判別基準を顔分類に適用することに成功し、線形判別分析に基づくフィッシャーフェイス法を提案しました (「固有顔対フィッシャーフェイス: クラス固有の線形射影を使用した認識」)。

顔認識の 3 つの古典的なアルゴリズムは何ですか?

関連知識の詳細については、PHP 中国語 Web サイト をご覧ください。

以上が顔認識の 3 つの古典的なアルゴリズムは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 CLIP-BEVFormer: BEVFormer 構造を明示的に監視して、ロングテール検出パフォーマンスを向上させます。 Mar 26, 2024 pm 12:41 PM

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 C++ での機械学習アルゴリズムの実装: 一般的な課題と解決策 Jun 03, 2024 pm 01:25 PM

C++ の機械学習アルゴリズムが直面する一般的な課題には、メモリ管理、マルチスレッド、パフォーマンスの最適化、保守性などがあります。解決策には、スマート ポインター、最新のスレッド ライブラリ、SIMD 命令、サードパーティ ライブラリの使用、コーディング スタイル ガイドラインの遵守、自動化ツールの使用が含まれます。実践的な事例では、Eigen ライブラリを使用して線形回帰アルゴリズムを実装し、メモリを効果的に管理し、高性能の行列演算を使用する方法を示します。

C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる C++sort 関数の基礎となる原則とアルゴリズムの選択を調べる Apr 02, 2024 pm 05:36 PM

C++sort 関数の最下層はマージ ソートを使用し、その複雑さは O(nlogn) で、クイック ソート、ヒープ ソート、安定したソートなど、さまざまなソート アルゴリズムの選択肢を提供します。

人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる 人工知能は犯罪を予測できるのか? CrimeGPT の機能を調べる Mar 22, 2024 pm 10:10 PM

人工知能 (AI) と法執行機関の融合により、犯罪の予防と検出の新たな可能性が開かれます。人工知能の予測機能は、犯罪行為を予測するためにCrimeGPT (犯罪予測技術) などのシステムで広く使用されています。この記事では、犯罪予測における人工知能の可能性、その現在の応用、人工知能が直面する課題、およびこの技術の倫理的影響について考察します。人工知能と犯罪予測: 基本 CrimeGPT は、機械学習アルゴリズムを使用して大規模なデータセットを分析し、犯罪がいつどこで発生する可能性があるかを予測できるパターンを特定します。これらのデータセットには、過去の犯罪統計、人口統計情報、経済指標、気象パターンなどが含まれます。人間のアナリストが見逃す可能性のある傾向を特定することで、人工知能は法執行機関に力を与えることができます

改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 改良された検出アルゴリズム: 高解像度の光学式リモートセンシング画像でのターゲット検出用 Jun 06, 2024 pm 12:33 PM

01 今後の概要 現時点では、検出効率と検出結果の適切なバランスを実現することが困難です。我々は、光学リモートセンシング画像におけるターゲット検出ネットワークの効果を向上させるために、多層特徴ピラミッド、マルチ検出ヘッド戦略、およびハイブリッドアテンションモジュールを使用して、高解像度光学リモートセンシング画像におけるターゲット検出のための強化されたYOLOv5アルゴリズムを開発しました。 SIMD データセットによると、新しいアルゴリズムの mAP は YOLOv5 より 2.2%、YOLOX より 8.48% 優れており、検出結果と速度のバランスがより優れています。 02 背景と動機 リモート センシング技術の急速な発展に伴い、航空機、自動車、建物など、地表上の多くの物体を記述するために高解像度の光学式リモート センシング画像が使用されています。リモートセンシング画像の判読における物体検出

DingTalk顔認証の入り方 DingTalk顔認証の入り方 Mar 05, 2024 am 08:46 AM

インテリジェントなサービス ソフトウェアとして、DingTalk は学習や仕事において重要な役割を果たすだけでなく、その強力な機能を通じてユーザーの効率を向上させ、問題を解決することにも尽力しています。技術の継続的な進歩により、顔認識技術は徐々に私たちの日常生活や仕事に浸透してきました。それでは、DingTalk アプリを使用して顔認識入力を行う方法を以下に編集者が詳しく紹介します。さらに詳しく知りたいユーザーは、この記事の写真とテキストを参照してください。 DingTalk で顔を記録するにはどうすればよいですか?携帯電話で DingTalk ソフトウェアを開いた後、下部にある [ワークベンチ] をクリックし、[出席と時計] を見つけてクリックして開きます。 2. 次に、出席ページの右下の「設定」をクリックして入力し、設定ページの「私の設定」をクリックして切り替えます。

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

Apple フォンで顔認識をオフにする方法_Apple フォンの設定で顔認識を無効にする方法 Apple フォンで顔認識をオフにする方法_Apple フォンの設定で顔認識を無効にする方法 Mar 23, 2024 pm 08:20 PM

1. 寝る前に Siri に「これは誰の携帯電話ですか?」と尋ねることができます。Siri は顔認識を無効にするのに自動的に役立ちます。 2. 無効にしたくない場合は、Face ID をオンにして、[Face ID を有効にするには視線が必要] をオンにすることを選択できます。このようにすると、ロック画面は監視しているときにのみ開くことができます。