コンピュータービジョン画像分類
この記事は、著者 Beishang が執筆した WeChat 公開アカウント「AI Origin」から転載したものです。この記事を転載するには、AI Yuanqi 公開アカウントにご連絡ください。
数字を言えますか?
AIといえば誰もが思い浮かべるのは、『流浪の地球2』のMOSSのような知的ハードウェア生命体であり、全知全能のようであり、インターネットさえ与えられれば、アベンジャーズ 2 のウルトロンのように、彼はインターネットを使ってあらゆる場所に拡散し、「世界平和」を達成するために人類を排除する計画を常に考えています。
#しかし実際には、現在の AI は、映画やテレビの作品で誰もが感じたり経験したりするものにはまだ程遠いです。例として、AI が実際にどのような形で存在するかを調べてみましょう。この記事には、記事を段階的に理解できるよう、いくつかの重要な質問ごとに索引が付けられています。ついて来い、行きましょう ~
これは数字の絵です。見たらすぐに反応できると思います。これは数字「3」の絵です(かなり曖昧ですが)。
最初の質問: 本当の知性 - なぜこれが数字の「3」であることが明確にわかるのですか?これはどういう意味ですか?
この写真を見ると、目は光信号を生体信号に変換し、網膜上での光の反射を通じて脳が認識できるようにし、情報のこの部分を一時的に保存します(理解を助けるためだけであり、そうではありません)実際のところ?) 網膜上にあります。脳が信号を受信すると、賢い小さな脳は、これが数字の「3」であることをすぐに認識します。この時点で、あなたは絵を完全に理解しており、それは「3」です。もちろん、これらすべての基礎は、この形の数字は、5、6、その他の数字ではなく、3 と「同等」であると子供の頃から教えられてきたことです。
2 番目の質問: 目、網膜 — コンピューターは物理世界を認識するためにどのような形式の入力を使用しますか?
コンピューターと AI の関係は何ですか? AI は、私たち自身が知性と生命を持っているのと同じように、コンピューターの計算能力とアーキテクチャを必要とする疑似知能能力であると簡単に理解できますが、実際には私たちは本質的に炭素ベースの生物です。ご存知のように、コンピューターの世界は 2 進数の世界ですが、2 進数とは? 簡単に言うと、0 か 1 のどちらかです。現時点では疑問に思われていると思いますが、0 か 1 の 2 進数だけでこれほど多くの機能を実現できるのでしょうか? それほど強力な計算能力があるのでしょうか?しかし、心配しないでください。ここで明確にする必要がある概念があります。つまり、2 進数は任意の基数の数値を表現できるということです (最初はそれが正しいと考えることができます。これについては、特に必要な場合に後で説明します)。たとえば、一般的に使用される 10 進数の 13 を 2 進数で表すと、次は 1101 です。注意深く勉強したい人は、下の図の説明を参照してください。
#したがって、数値については、コンピューターはバイナリを通じてそれを「理解」できることが明確に理解できます。写真を数字の列に変換できれば、コンピュータは0と1しか知らないバカから、写真から情報を入力できるコンピュータに変わることができるでしょうか(分からない人は脇に置いておいてください。子供は成長したらまず食べることを学ばなければなりません)。以下の図に示すように、画像の各小さな領域はピクセルとして考えることができ、1 つのピクセルが色を表します。ご存知のとおり、任意の色は赤、緑、青 (青) を通過することができ、その後、左から右、上から下の順に数値のリストを作成し、その内容をコンピューターに送信します。
この時点で、コンピュータが理解できるかどうかに関係なく、画像はコンピュータが受け入れられる信号に変換されています。脳は絵の中の信号を識別しますか?その数字は「3」です
3 番目の質問: いわゆる AI、コンピューターはこの絵の中の数字が「3」であるとどのように判断するのでしょうか
コンピュータにこのような画像を 2 枚与えると、左側の画像が数字の「3」であることがわかります。これには人工知能があると思いますか?素朴すぎると思うかもしれませんが、これは3歳児でも知っています。しかし、右の写真にアオアシカツオドリやその他の珍しい鳥類の 10,000 枚の写真があり、コンピューターがさまざまな珍しい生き物を 99% の精度で正確に識別するのに数秒しかかからないとしたら、そうですよね? AIみたいな感じ?
従来の認識方法 - 具体的には、画像をデジタル マトリックスに変換することができ、画像内の特徴を識別します。抽出には、たとえば、いくつかのハード ルールが特徴として使用されます。 「3」という数字は、私たちの脳でこの形を見たとき、無意識に「3」と反応しますが、コンピュータにとっては数字の羅列です。そのため、初期の頃に同様の画像分類タスクを実行する際、エンジニアは数字の「3」にマッピングされたデジタル シーケンスを処理する必要があり、これは本当に頭の痛い問題でした。したがって、特徴をどのように作成するかは、従来の画像認識と分類において重要ではありますが、非常に面倒なプロセスです。
従来の認識手法の利点は、認識結果が間違っていた場合、特徴量を表示することでエラーの原因を大まかに特定できることですが、欠点は特徴量エンジニアリングが煩雑であることです。特徴量エンジニアリングを弱め (ただし、特徴量エンジニアリングは後続の多くのタスクにとっても非常に重要です)、エンドツーエンドのソリューションを提供する方法はありますか。いわゆるエンドツーエンドとは、デジタル画像とその分類結果を与えるだけで、コンピューターに認識ソリューションを自動的に学習させることを意味します (人間の学習アイデアに似ていますか)。時代の変化とコンピューターの計算能力の大幅な向上により、ニューラルネットワークに基づく深層学習アルゴリズムが徐々に使用されるようになりました。
ディープ ニューラル ネットワークの認識方法 - この言葉は非常に奥が深いです。コンピュータを学習したりアルゴリズムを学習したりしない人は、直接怖がるかもしれません。一文で説明しましょう。ディープ ニューラル ネットワークとは (dog head.jpg): 入力データと指定されたラベルの間には、ある種の非線形相関があり、ニューラル ネットワークは複数の非線形関数を使用して、上記の相関関係を近似します。非線形相関。以下に示すように、これは単純なディープ ニューラル ネットワークであり、一番左の絵(文字「A」)と右側は、絵を数値に変換して「知的」な演算を実行する構造であり、「脳」として理解できます。 」。
以上がコンピュータービジョン画像分類の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









ソーシャルメディアの継続的な発展に伴い、Xiaohongshu はますます多くの若者が自分たちの生活を共有し、美しいものを発見するためのプラットフォームとなっています。多くのユーザーは、画像を投稿する際の自動保存の問題に悩まされています。では、この問題をどうやって解決すればよいでしょうか? 1.小紅書で公開するときに写真が自動的に保存される問題を解決するにはどうすればよいですか? 1. キャッシュをクリアする まず、Xiaohongshu のキャッシュ データをクリアしてみます。手順は次のとおりです: (1) 小紅書を開いて右下隅の「マイ」ボタンをクリックします。 (2) 個人センター ページで「設定」を見つけてクリックします。 (3) 下にスクロールして「」を見つけます。 「キャッシュをクリア」オプションを選択し、「OK」をクリックします。キャッシュをクリアした後、Xiaohongshu を再起動し、写真を投稿して、自動保存の問題が解決されるかどうかを確認します。 2. 小紅書バージョンを更新して、小紅書が正しく動作することを確認します。

2024CSRankings 全国コンピューターサイエンス専攻ランキングが発表されました。今年、米国の最高のCS大学のランキングで、カーネギーメロン大学(CMU)が国内およびCSの分野で最高の大学の一つにランクされ、イリノイ大学アーバナシャンペーン校(UIUC)は6年連続2位となった。 3位はジョージア工科大学。次いでスタンフォード大学、カリフォルニア大学サンディエゴ校、ミシガン大学、ワシントン大学が世界第4位タイとなった。 MIT のランキングが低下し、トップ 5 から外れたことは注目に値します。 CSRankings は、マサチューセッツ大学アマースト校コンピューター情報科学部のエメリー バーガー教授が始めたコンピューター サイエンス分野の世界的な大学ランキング プロジェクトです。ランキングは客観的なものに基づいています

Windows リモート デスクトップ サービスを使用すると、ユーザーはコンピュータにリモート アクセスできるため、リモートで作業する必要がある人にとっては非常に便利です。ただし、ユーザーがリモート コンピュータに接続できない場合、またはリモート デスクトップがコンピュータの ID を認証できない場合、問題が発生する可能性があります。これは、ネットワーク接続の問題または証明書の検証の失敗が原因である可能性があります。この場合、ユーザーはネットワーク接続をチェックし、リモート コンピュータがオンラインであることを確認して、再接続を試行する必要がある場合があります。また、リモート コンピュータの認証オプションが正しく構成されていることを確認することが、問題を解決する鍵となります。 Windows リモート デスクトップ サービスに関するこのような問題は、通常、設定を注意深く確認して調整することで解決できます。時間または日付の違いにより、リモート デスクトップはリモート コンピューターの ID を確認できません。計算を確認してください

Douyin のショートビデオの人気により、コメント エリアでのユーザーのやり取りがより多彩になりました。ユーザーの中には、自分の意見や感情をよりよく表現するために、コメントで画像を共有したいと考えている人もいます。では、TikTokのコメントに写真を投稿するにはどうすればよいでしょうか?この記事では、この質問に詳しく答え、関連するヒントと注意事項をいくつか紹介します。 1.Douyinのコメントに写真を投稿するにはどうすればよいですか? 1. Douyinを開く: まず、Douyin APPを開いてアカウントにログインする必要があります。 2. コメントエリアを見つける:短いビデオを閲覧または投稿するときに、コメントしたい場所を見つけて「コメント」ボタンをクリックします。 3. コメントの内容を入力します: コメント領域にコメントの内容を入力します。 4. 写真の送信を選択します。コメント内容を入力するインターフェースに「写真」ボタンまたは「+」ボタンが表示されます。

Apple の最近の iPhone は、鮮明なディテール、彩度、明るさで思い出を捉えます。ただし、場合によっては、画像が鮮明に見えなくなる問題が発生することがあります。 iPhone カメラのオートフォーカスは大きく進歩し、写真をすばやく撮影できるようになりましたが、状況によってはカメラが誤って間違った被写体に焦点を合わせ、不要な領域で写真がぼやけてしまうことがあります。 iPhone 上の写真の焦点が合っていない場合、または全体的に鮮明さが欠けている場合は、次の投稿を参照して写真を鮮明にすることができます。 iPhone で写真を鮮明にする方法 [6 つの方法] ネイティブの写真アプリを使用して写真をクリーンアップしてみることができます。さらに多くの機能やオプションが必要な場合

PowerPoint では、画像を 1 枚ずつ表示するのが一般的な手法ですが、これはアニメーション効果を設定することで実現できます。このガイドでは、基本的なセットアップ、画像の挿入、アニメーションの追加、アニメーションの順序とタイミングの調整など、この手法を実装する手順について詳しく説明します。さらに、トリガーの使用、アニメーションの速度と順序の調整、アニメーション効果のプレビューなど、高度な設定と調整が提供されます。これらの手順とヒントに従うことで、ユーザーは PowerPoint で次々に表示される画像を簡単に設定できるため、プレゼンテーションの視覚的な効果が高まり、聴衆の注意を引くことができます。

以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

Foxit PDF Reader ソフトウェアも使用していますか? Foxit PDF Reader が PDF ドキュメントを jpg 画像に変換する方法をご存知ですか? 次の記事では、Foxit PDF Reader が PDF ドキュメントを jpg 画像に変換する方法について説明します。 jpg画像は以下からご覧ください。まずFoxit PDF Readerを起動し、上部のツールバーで「機能」を見つけ、「PDF to Others」機能を選択します。次に、「Foxit PDF Online Conversion」というWebページを開きます。ページ右上の「ログイン」ボタンをクリックしてログインし、「PDF to Image」機能をオンにしてください。次にアップロードボタンをクリックし、画像に変換したいPDFファイルを追加し、追加後「変換開始」をクリックします。
