Heim Technologie-Peripheriegeräte KI Computer Vision-Bildklassifizierung

Computer Vision-Bildklassifizierung

Apr 07, 2023 pm 10:01 PM
计算机 图片 视觉

Dieser Artikel wurde vom Autor Beishang aus dem öffentlichen WeChat-Konto „AI Origin“ nachgedruckt. Um diesen Artikel erneut zu drucken, wenden Sie sich bitte an das öffentliche Konto von AI Yuanqi.

Können Sie Zahlen erkennen?

Apropos KI: Das, woran jeder denkt, ist ein intelligentes Hardware-Kreatur wie MOSS in „The Wandering Earth 2“. Es scheint allwissend und allmächtig zu sein, solange es das Internet gibt, wird es so sein wie in Avengers 2 Wie Ultron nutzt er das Internet, um sich überall zu verbreiten, und denkt immer an einen Plan, um Menschen zu eliminieren und „Weltfrieden“ zu erreichen.

Computer Vision-Bildklassifizierung

Allerdings ist KI zu diesem Zeitpunkt noch weit von dem entfernt, was jeder in Film- und Fernsehwerken fühlt und erlebt. Nehmen wir heute das Beispiel der digitalen Bilderkennung und untersuchen, auf welcher Form KI basiert existiert tatsächlich. Der Artikel wird durch einige Schlüsselfragen indiziert, um Ihnen das Verständnis Schritt für Schritt zu erleichtern. Folge mir, lass uns gehen ~

Das ist ein Bild mit Zahlen, nachdem du es gesehen hast, wirst du sofort reagieren können (auch wenn es verschwommen ist).

Computer Vision-Bildklassifizierung

Die erste Frage: Echte Intelligenz – warum kann man klar erkennen, dass es sich hier um die Zahl „3“ handelt? Was bedeutet das?

Wenn Sie dieses Bild betrachten, wandeln Ihre Augen das optische Signal in ein biologisches Signal um, das das Gehirn durch Lichtreflexion auf der Netzhaut erkennen kann, und speichern diesen Teil der Informationen vorübergehend (nur zum Verständnis, nicht tatsächlich?) in auf deiner Netzhaut. Nachdem das Gehirn das Signal empfangen hat, erkennt Ihr kluges kleines Gehirn schnell, dass es sich um die Zahl „3“ handelt. Zu diesem Zeitpunkt haben Sie das Bild vollständig verstanden und es ist eine „3“. Die Grundlage all dessen ist natürlich, dass Ihnen seit Ihrer Kindheit beigebracht wurde, dass Zahlen in dieser Form der Zahl 3 „äquivalent“ sind, nicht 5, 6 und anderen Zahlen.

Computer Vision-Bildklassifizierung

Zweite Frage: Augen, Netzhaut – welche Eingabeform nutzt der Computer, um die physische Welt zu erkennen?

Welche Beziehung besteht zwischen Computern und KI? Wir können einfach verstehen, dass KI eine Art pseudointelligente Fähigkeit ist, die die Rechenleistung und Architektur eines Computers erfordert, genau wie wir selbst über Intelligenz und Leben verfügen, aber tatsächlich sind wir im Wesentlichen kohlenstoffbasierte Organismen. Wie wir alle wissen, ist die Computerwelt eine binäre Welt. Einfach ausgedrückt ist sie entweder 0 oder 1. Ich weiß, dass Sie derzeit Zweifel haben. Können Sie so viele Funktionen erreichen, indem Sie sich nur auf Binärzahlen verlassen, die entweder 0 oder 1 sind? Aber keine Sorge, es gibt hier ein Konzept, das geklärt werden muss, nämlich, dass Binärzahlen Zahlen in jeder Basis darstellen können (Sie können zuerst denken, dass es richtig ist, und wir werden später darüber sprechen, wenn Sie es speziell benötigen). Zum Beispiel ist die Zahl 13 in unserem häufig verwendeten Dezimalsystem binär Das Folgende ist 1101. Freunde, die sorgfältig lernen möchten, können die Erklärung des Bildes unten sehen.

Computer Vision-Bildklassifizierung

Wir können also klar verstehen, dass der Computer eine Zahl binär „verstehen“ kann. Wenn ein Bild in eine Zahlenfolge umgewandelt werden kann, kann sich der Computer dann von einem Idioten, der nur 0 und 1 kennt, in einen Idioten verwandeln, der Informationen aus dem Bild eingeben kann (wenn Sie es nicht verstehen, legen Sie es beiseite, so wie ein Kind erst essen lernen muss, wenn es erwachsen ist. Wie in der folgenden Abbildung gezeigt, kann jeder kleine Bereich des Bildes als Pixel betrachtet werden, und ein Pixel stellt eine Farbe dar. Wie wir alle wissen, kann jede Farbe durch Rot, Grün und Blau (Blau) geleitet werden Wir können eine Liste von Zahlen in der Reihenfolge von links nach rechts und von oben nach unten erstellen und diese Inhalte dann an den Computer senden.

Computer Vision-Bildklassifizierung

An diesem Punkt haben wir das Bild in ein Signal umgewandelt, das der Computer akzeptieren kann, unabhängig davon, ob der Computer es versteht oder nicht. Wie erkennt das Computergehirn, dass die Zahl im Bild „3“ ist?

Die dritte Frage: Sogenannte KI – wie soll der Computer feststellen, dass die Zahl in diesem Bild „3“ ist

Geben Sie dem Computer zwei Bilder wie dieses. Es kann Ihnen sagen, dass das Bild links die Nummer „3“ ist. Glauben Sie, dass es künstliche Intelligenz hat? Du denkst vielleicht, das sei zu naiv, aber selbst ein 3-jähriges Kind weiß das. Aber wenn das Bild rechts 10.000 Bilder seltener Vögel wie Blaufußtölpel zeigt und es nur wenige Sekunden dauert, bis der Computer verschiedene seltene Kreaturen mit einer Genauigkeit von 99 % genau identifiziert, ist das nicht richtig? ein bisschen wie KI?

Computer Vision-Bildklassifizierung

Traditionelle Erkennungsmethode – Insbesondere konnten wir das Bild in eine digitale Matrix umwandeln. Die traditionelle Bilderkennungsmethode extrahiert die Merkmale im Bild, indem sie beispielsweise einige harte Regeln als Merkmale verwendet. Was die Zahl „3“ betrifft, so reagieren wir unbewusst, wenn wir diese Form in unserem Gehirn sehen, dass es sich um „3“ handelt, für den Computer ist es jedoch eine Zahlenfolge. Daher mussten Ingenieure bei der Durchführung ähnlicher Bildklassifizierungsaufgaben früher die der Zahl „3“ zugeordnete digitale Sequenz verarbeiten, was wirklich Kopfschmerzen bereitete. Daher ist die Erstellung von Merkmalen ein entscheidender, aber äußerst umständlicher Prozess bei der herkömmlichen Bilderkennung und -klassifizierung.

Der Vorteil der herkömmlichen Erkennungsmethode besteht darin, dass Sie bei einem falschen Erkennungsergebnis die Fehlerursache durch die Anzeige von Features grob ermitteln können. Der Nachteil besteht darin, dass das Feature-Engineering umständlich ist. Gibt es eine Möglichkeit, das Feature-Engineering zu schwächen (obwohl Feature-Engineering auch für viele nachfolgende Aufgaben äußerst wichtig ist) und eine End-to-End-Lösung bereitzustellen? Das sogenannte End-to-End bedeutet, dass ich nur ein digitales Bild und seine Klassifizierungsergebnisse bereitstellen muss und den Computer die Erkennungslösung selbst lernen lassen muss (ist es ein bisschen wie menschliche Lernideen)? Nach dem Wandel der Zeit und der deutlichen Verbesserung der Rechenleistung von Computern kamen nach und nach Deep-Learning-Algorithmen auf Basis neuronaler Netze zum Einsatz.

Computer Vision-Bildklassifizierung

Erkennungsmethode für tiefe neuronale Netze – Diese Worte sind sehr tiefgreifend. Wer sich nicht mit Computern auskennt oder keine Algorithmen beherrscht, hat möglicherweise direkt Angst davor, in einem Satz zu übersetzen, was ein tiefes neuronales Netz ist (Hundekopf.jpg). : Es besteht eine gewisse nichtlineare Korrelation zwischen den Eingabedaten und der angegebenen Bezeichnung. Das neuronale Netzwerk verwendet mehrere nichtlineare Funktionen, um die oben erwähnte nichtlineare Korrelation näherungsweise anzupassen. Wie unten gezeigt, handelt es sich um ein einfaches tiefes neuronales Netzwerk (Buchstabe „A“), und auf der rechten Seite handelt es sich um die Struktur, die das Bild in Zahlen umwandelt und „intelligente“ Operationen ausführt, die als „Gehirn“ verstanden werden können ".

Computer Vision-Bildklassifizierung

Das obige ist der detaillierte Inhalt vonComputer Vision-Bildklassifizierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Wie kann das Problem des automatischen Speicherns von Bildern beim Veröffentlichen auf Xiaohongshu gelöst werden? Wo ist das beim Posten automatisch gespeicherte Bild? Wie kann das Problem des automatischen Speicherns von Bildern beim Veröffentlichen auf Xiaohongshu gelöst werden? Wo ist das beim Posten automatisch gespeicherte Bild? Mar 22, 2024 am 08:06 AM

Durch die kontinuierliche Entwicklung der sozialen Medien ist Xiaohongshu zu einer Plattform für immer mehr junge Menschen geworden, auf der sie ihr Leben teilen und schöne Dinge entdecken können. Viele Benutzer haben beim Posten von Bildern Probleme mit der automatischen Speicherung. Wie kann man dieses Problem lösen? 1. Wie kann das Problem des automatischen Speicherns von Bildern beim Veröffentlichen auf Xiaohongshu gelöst werden? 1. Cache leeren Zuerst können wir versuchen, die Cache-Daten von Xiaohongshu zu löschen. Die Schritte sind wie folgt: (1) Öffnen Sie Xiaohongshu und klicken Sie auf die Schaltfläche „Mein“ in der unteren rechten Ecke. (2) Suchen Sie auf der persönlichen Center-Seite nach „Einstellungen“ und klicken Sie darauf. (3) Scrollen Sie nach unten und suchen Sie nach „; Option „Cache löschen“. Klicken Sie auf „OK“. Nachdem Sie den Cache geleert haben, geben Sie Xiaohongshu erneut ein und versuchen Sie, Bilder zu posten, um zu sehen, ob das Problem mit dem automatischen Speichern behoben ist. 2. Aktualisieren Sie die Xiaohongshu-Version, um sicherzustellen, dass Ihr Xiaohongshu

Die CSRankings National Computer Science Rankings 2024 sind veröffentlicht! CMU dominiert die Liste, MIT fällt aus den Top 5 Die CSRankings National Computer Science Rankings 2024 sind veröffentlicht! CMU dominiert die Liste, MIT fällt aus den Top 5 Mar 25, 2024 pm 06:01 PM

Die 2024CSRankings National Computer Science Major Rankings wurden gerade veröffentlicht! In diesem Jahr gehört die Carnegie Mellon University (CMU) im Ranking der besten CS-Universitäten in den Vereinigten Staaten zu den Besten des Landes und im Bereich CS, während die University of Illinois at Urbana-Champaign (UIUC) einen der besten Plätze belegt sechs Jahre in Folge den zweiten Platz belegt. Georgia Tech belegte den dritten Platz. Dann teilten sich die Stanford University, die University of California in San Diego, die University of Michigan und die University of Washington den vierten Platz weltweit. Es ist erwähnenswert, dass das Ranking des MIT zurückgegangen ist und aus den Top 5 herausgefallen ist. CSRankings ist ein globales Hochschulrankingprojekt im Bereich Informatik, das von Professor Emery Berger von der School of Computer and Information Sciences der University of Massachusetts Amherst initiiert wurde. Die Rangfolge erfolgt objektiv

Remotedesktop kann die Identität des Remotecomputers nicht authentifizieren Remotedesktop kann die Identität des Remotecomputers nicht authentifizieren Feb 29, 2024 pm 12:30 PM

Mit dem Windows-Remotedesktopdienst können Benutzer aus der Ferne auf Computer zugreifen, was für Personen, die aus der Ferne arbeiten müssen, sehr praktisch ist. Es können jedoch Probleme auftreten, wenn Benutzer keine Verbindung zum Remotecomputer herstellen können oder Remotedesktop die Identität des Computers nicht authentifizieren kann. Dies kann durch Netzwerkverbindungsprobleme oder einen Fehler bei der Zertifikatsüberprüfung verursacht werden. In diesem Fall muss der Benutzer möglicherweise die Netzwerkverbindung überprüfen, sicherstellen, dass der Remote-Computer online ist, und versuchen, die Verbindung wiederherzustellen. Außerdem ist es wichtig, sicherzustellen, dass die Authentifizierungsoptionen des Remotecomputers richtig konfiguriert sind, um das Problem zu lösen. Solche Probleme mit den Windows-Remotedesktopdiensten können normalerweise durch sorgfältiges Überprüfen und Anpassen der Einstellungen behoben werden. Aufgrund eines Zeit- oder Datumsunterschieds kann Remote Desktop die Identität des Remotecomputers nicht überprüfen. Bitte stellen Sie Ihre Berechnungen sicher

Wie poste ich Bilder in TikTok-Kommentaren? Wo ist der Zugang zu den Bildern im Kommentarbereich? Wie poste ich Bilder in TikTok-Kommentaren? Wo ist der Zugang zu den Bildern im Kommentarbereich? Mar 21, 2024 pm 09:12 PM

Mit der Beliebtheit von Douyin-Kurzvideos sind die Benutzerinteraktionen im Kommentarbereich bunter geworden. Einige Benutzer möchten Bilder in Kommentaren teilen, um ihre Meinung oder Gefühle besser auszudrücken. Wie postet man also Bilder in TikTok-Kommentaren? Dieser Artikel beantwortet diese Frage ausführlich und gibt Ihnen einige entsprechende Tipps und Vorsichtsmaßnahmen. 1. Wie poste ich Bilder in Douyin-Kommentaren? 1. Öffnen Sie Douyin: Zuerst müssen Sie die Douyin-App öffnen und sich bei Ihrem Konto anmelden. 2. Suchen Sie den Kommentarbereich: Suchen Sie beim Durchsuchen oder Posten eines kurzen Videos die Stelle, an der Sie einen Kommentar abgeben möchten, und klicken Sie auf die Schaltfläche „Kommentieren“. 3. Geben Sie Ihren Kommentarinhalt ein: Geben Sie Ihren Kommentarinhalt in den Kommentarbereich ein. 4. Wählen Sie, ob Sie ein Bild senden möchten: In der Benutzeroberfläche zur Eingabe von Kommentarinhalten sehen Sie eine Schaltfläche „Bild“ oder eine Schaltfläche „+“. Klicken Sie darauf

6 Möglichkeiten, Bilder auf dem iPhone schärfer zu machen 6 Möglichkeiten, Bilder auf dem iPhone schärfer zu machen Mar 04, 2024 pm 06:25 PM

Die neuesten iPhones von Apple halten Erinnerungen mit gestochen scharfen Details, Sättigung und Helligkeit fest. Manchmal kann es jedoch zu Problemen kommen, die dazu führen können, dass das Bild weniger klar aussieht. Während der Autofokus bei iPhone-Kameras große Fortschritte gemacht hat und es Ihnen ermöglicht, schnell Fotos aufzunehmen, kann die Kamera in bestimmten Situationen versehentlich auf das falsche Motiv fokussieren, wodurch das Foto in unerwünschten Bereichen unscharf wird. Wenn Ihre Fotos auf Ihrem iPhone unscharf wirken oder es ihnen insgesamt an Schärfe mangelt, soll Ihnen der folgende Beitrag dabei helfen, sie schärfer zu machen. So machen Sie Bilder auf dem iPhone klarer [6 Methoden] Sie können versuchen, Ihre Fotos mit der nativen Foto-App zu bereinigen. Wenn Sie mehr Funktionen und Optionen wünschen

So lassen Sie PPT-Bilder einzeln erscheinen So lassen Sie PPT-Bilder einzeln erscheinen Mar 25, 2024 pm 04:00 PM

In PowerPoint ist es eine gängige Technik, Bilder einzeln anzuzeigen, was durch das Festlegen von Animationseffekten erreicht werden kann. In dieser Anleitung werden die Schritte zur Implementierung dieser Technik detailliert beschrieben, einschließlich der grundlegenden Einrichtung, des Einfügens von Bildern, des Hinzufügens von Animationen sowie des Anpassens der Reihenfolge und des Timings der Animationen. Darüber hinaus stehen erweiterte Einstellungen und Anpassungen zur Verfügung, z. B. die Verwendung von Triggern, das Anpassen von Animationsgeschwindigkeit und -reihenfolge sowie die Vorschau von Animationseffekten. Durch Befolgen dieser Schritte und Tipps können Benutzer ganz einfach Bilder so einrichten, dass sie in PowerPoint nacheinander angezeigt werden, wodurch die visuelle Wirkung der Präsentation verbessert und die Aufmerksamkeit des Publikums erregt wird.

So konvertieren Sie PDF-Dokumente mit Foxit PDF Reader in JPG-Bilder. - So konvertieren Sie PDF-Dokumente mit Foxit PDF Reader in JPG-Bilder So konvertieren Sie PDF-Dokumente mit Foxit PDF Reader in JPG-Bilder. - So konvertieren Sie PDF-Dokumente mit Foxit PDF Reader in JPG-Bilder Mar 04, 2024 pm 05:49 PM

Verwenden Sie auch die Foxit PDF Reader-Software? Wissen Sie, wie Foxit PDF Reader PDF-Dokumente in JPG-Bilder konvertiert? Für diejenigen, die sich für die Konvertierungsmethode interessieren jpg-Bilder, kommen Sie bitte vorbei und schauen Sie sich unten um. Starten Sie zunächst Foxit PDF Reader, suchen Sie dann in der oberen Symbolleiste nach „Funktionen“ und wählen Sie dann die Funktion „PDF an andere“ aus. Öffnen Sie als Nächstes eine Webseite namens „Foxit PDF Online Conversion“. Klicken Sie auf die Schaltfläche „Anmelden“ oben rechts auf der Seite, um sich anzumelden, und aktivieren Sie dann die Funktion „PDF zu Bild“. Klicken Sie dann auf die Schaltfläche „Hochladen“ und fügen Sie die PDF-Datei hinzu, die Sie in ein Bild konvertieren möchten. Klicken Sie nach dem Hinzufügen auf „Konvertierung starten“.

Jenseits von ORB-SLAM3! SL-SLAM: Szenen mit wenig Licht, starkem Jitter und schwacher Textur werden verarbeitet Jenseits von ORB-SLAM3! SL-SLAM: Szenen mit wenig Licht, starkem Jitter und schwacher Textur werden verarbeitet May 30, 2024 am 09:35 AM

Heute diskutieren wir darüber, wie Deep-Learning-Technologie die Leistung von visionbasiertem SLAM (Simultaneous Localization and Mapping) in komplexen Umgebungen verbessern kann. Durch die Kombination von Methoden zur Tiefenmerkmalsextraktion und Tiefenanpassung stellen wir hier ein vielseitiges hybrides visuelles SLAM-System vor, das die Anpassung in anspruchsvollen Szenarien wie schlechten Lichtverhältnissen, dynamischer Beleuchtung, schwach strukturierten Bereichen und starkem Jitter verbessern soll. Unser System unterstützt mehrere Modi, einschließlich erweiterter Monokular-, Stereo-, Monokular-Trägheits- und Stereo-Trägheitskonfigurationen. Darüber hinaus wird analysiert, wie visuelles SLAM mit Deep-Learning-Methoden kombiniert werden kann, um andere Forschungen zu inspirieren. Durch umfangreiche Experimente mit öffentlichen Datensätzen und selbst abgetasteten Daten demonstrieren wir die Überlegenheit von SL-SLAM in Bezug auf Positionierungsgenauigkeit und Tracking-Robustheit.

See all articles