Computer Vision-Bildklassifizierung
Dieser Artikel wurde vom Autor Beishang aus dem öffentlichen WeChat-Konto „AI Origin“ nachgedruckt. Um diesen Artikel erneut zu drucken, wenden Sie sich bitte an das öffentliche Konto von AI Yuanqi.
Können Sie Zahlen erkennen?
Apropos KI: Das, woran jeder denkt, ist ein intelligentes Hardware-Kreatur wie MOSS in „The Wandering Earth 2“. Es scheint allwissend und allmächtig zu sein, solange es das Internet gibt, wird es so sein wie in Avengers 2 Wie Ultron nutzt er das Internet, um sich überall zu verbreiten, und denkt immer an einen Plan, um Menschen zu eliminieren und „Weltfrieden“ zu erreichen.
Allerdings ist KI zu diesem Zeitpunkt noch weit von dem entfernt, was jeder in Film- und Fernsehwerken fühlt und erlebt. Nehmen wir heute das Beispiel der digitalen Bilderkennung und untersuchen, auf welcher Form KI basiert existiert tatsächlich. Der Artikel wird durch einige Schlüsselfragen indiziert, um Ihnen das Verständnis Schritt für Schritt zu erleichtern. Folge mir, lass uns gehen ~
Das ist ein Bild mit Zahlen, nachdem du es gesehen hast, wirst du sofort reagieren können (auch wenn es verschwommen ist).
Die erste Frage: Echte Intelligenz – warum kann man klar erkennen, dass es sich hier um die Zahl „3“ handelt? Was bedeutet das?
Wenn Sie dieses Bild betrachten, wandeln Ihre Augen das optische Signal in ein biologisches Signal um, das das Gehirn durch Lichtreflexion auf der Netzhaut erkennen kann, und speichern diesen Teil der Informationen vorübergehend (nur zum Verständnis, nicht tatsächlich?) in auf deiner Netzhaut. Nachdem das Gehirn das Signal empfangen hat, erkennt Ihr kluges kleines Gehirn schnell, dass es sich um die Zahl „3“ handelt. Zu diesem Zeitpunkt haben Sie das Bild vollständig verstanden und es ist eine „3“. Die Grundlage all dessen ist natürlich, dass Ihnen seit Ihrer Kindheit beigebracht wurde, dass Zahlen in dieser Form der Zahl 3 „äquivalent“ sind, nicht 5, 6 und anderen Zahlen.
Zweite Frage: Augen, Netzhaut – welche Eingabeform nutzt der Computer, um die physische Welt zu erkennen?
Welche Beziehung besteht zwischen Computern und KI? Wir können einfach verstehen, dass KI eine Art pseudointelligente Fähigkeit ist, die die Rechenleistung und Architektur eines Computers erfordert, genau wie wir selbst über Intelligenz und Leben verfügen, aber tatsächlich sind wir im Wesentlichen kohlenstoffbasierte Organismen. Wie wir alle wissen, ist die Computerwelt eine binäre Welt. Einfach ausgedrückt ist sie entweder 0 oder 1. Ich weiß, dass Sie derzeit Zweifel haben. Können Sie so viele Funktionen erreichen, indem Sie sich nur auf Binärzahlen verlassen, die entweder 0 oder 1 sind? Aber keine Sorge, es gibt hier ein Konzept, das geklärt werden muss, nämlich, dass Binärzahlen Zahlen in jeder Basis darstellen können (Sie können zuerst denken, dass es richtig ist, und wir werden später darüber sprechen, wenn Sie es speziell benötigen). Zum Beispiel ist die Zahl 13 in unserem häufig verwendeten Dezimalsystem binär Das Folgende ist 1101. Freunde, die sorgfältig lernen möchten, können die Erklärung des Bildes unten sehen.
Wir können also klar verstehen, dass der Computer eine Zahl binär „verstehen“ kann. Wenn ein Bild in eine Zahlenfolge umgewandelt werden kann, kann sich der Computer dann von einem Idioten, der nur 0 und 1 kennt, in einen Idioten verwandeln, der Informationen aus dem Bild eingeben kann (wenn Sie es nicht verstehen, legen Sie es beiseite, so wie ein Kind erst essen lernen muss, wenn es erwachsen ist. Wie in der folgenden Abbildung gezeigt, kann jeder kleine Bereich des Bildes als Pixel betrachtet werden, und ein Pixel stellt eine Farbe dar. Wie wir alle wissen, kann jede Farbe durch Rot, Grün und Blau (Blau) geleitet werden Wir können eine Liste von Zahlen in der Reihenfolge von links nach rechts und von oben nach unten erstellen und diese Inhalte dann an den Computer senden.
An diesem Punkt haben wir das Bild in ein Signal umgewandelt, das der Computer akzeptieren kann, unabhängig davon, ob der Computer es versteht oder nicht. Wie erkennt das Computergehirn, dass die Zahl im Bild „3“ ist?
Die dritte Frage: Sogenannte KI – wie soll der Computer feststellen, dass die Zahl in diesem Bild „3“ ist
Geben Sie dem Computer zwei Bilder wie dieses. Es kann Ihnen sagen, dass das Bild links die Nummer „3“ ist. Glauben Sie, dass es künstliche Intelligenz hat? Du denkst vielleicht, das sei zu naiv, aber selbst ein 3-jähriges Kind weiß das. Aber wenn das Bild rechts 10.000 Bilder seltener Vögel wie Blaufußtölpel zeigt und es nur wenige Sekunden dauert, bis der Computer verschiedene seltene Kreaturen mit einer Genauigkeit von 99 % genau identifiziert, ist das nicht richtig? ein bisschen wie KI?
Traditionelle Erkennungsmethode – Insbesondere konnten wir das Bild in eine digitale Matrix umwandeln. Die traditionelle Bilderkennungsmethode extrahiert die Merkmale im Bild, indem sie beispielsweise einige harte Regeln als Merkmale verwendet. Was die Zahl „3“ betrifft, so reagieren wir unbewusst, wenn wir diese Form in unserem Gehirn sehen, dass es sich um „3“ handelt, für den Computer ist es jedoch eine Zahlenfolge. Daher mussten Ingenieure bei der Durchführung ähnlicher Bildklassifizierungsaufgaben früher die der Zahl „3“ zugeordnete digitale Sequenz verarbeiten, was wirklich Kopfschmerzen bereitete. Daher ist die Erstellung von Merkmalen ein entscheidender, aber äußerst umständlicher Prozess bei der herkömmlichen Bilderkennung und -klassifizierung.
Der Vorteil der herkömmlichen Erkennungsmethode besteht darin, dass Sie bei einem falschen Erkennungsergebnis die Fehlerursache durch die Anzeige von Features grob ermitteln können. Der Nachteil besteht darin, dass das Feature-Engineering umständlich ist. Gibt es eine Möglichkeit, das Feature-Engineering zu schwächen (obwohl Feature-Engineering auch für viele nachfolgende Aufgaben äußerst wichtig ist) und eine End-to-End-Lösung bereitzustellen? Das sogenannte End-to-End bedeutet, dass ich nur ein digitales Bild und seine Klassifizierungsergebnisse bereitstellen muss und den Computer die Erkennungslösung selbst lernen lassen muss (ist es ein bisschen wie menschliche Lernideen)? Nach dem Wandel der Zeit und der deutlichen Verbesserung der Rechenleistung von Computern kamen nach und nach Deep-Learning-Algorithmen auf Basis neuronaler Netze zum Einsatz.
Erkennungsmethode für tiefe neuronale Netze – Diese Worte sind sehr tiefgreifend. Wer sich nicht mit Computern auskennt oder keine Algorithmen beherrscht, hat möglicherweise direkt Angst davor, in einem Satz zu übersetzen, was ein tiefes neuronales Netz ist (Hundekopf.jpg). : Es besteht eine gewisse nichtlineare Korrelation zwischen den Eingabedaten und der angegebenen Bezeichnung. Das neuronale Netzwerk verwendet mehrere nichtlineare Funktionen, um die oben erwähnte nichtlineare Korrelation näherungsweise anzupassen. Wie unten gezeigt, handelt es sich um ein einfaches tiefes neuronales Netzwerk (Buchstabe „A“), und auf der rechten Seite handelt es sich um die Struktur, die das Bild in Zahlen umwandelt und „intelligente“ Operationen ausführt, die als „Gehirn“ verstanden werden können ".
Das obige ist der detaillierte Inhalt vonComputer Vision-Bildklassifizierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Durch die kontinuierliche Entwicklung der sozialen Medien ist Xiaohongshu zu einer Plattform für immer mehr junge Menschen geworden, auf der sie ihr Leben teilen und schöne Dinge entdecken können. Viele Benutzer haben beim Posten von Bildern Probleme mit der automatischen Speicherung. Wie kann man dieses Problem lösen? 1. Wie kann das Problem des automatischen Speicherns von Bildern beim Veröffentlichen auf Xiaohongshu gelöst werden? 1. Cache leeren Zuerst können wir versuchen, die Cache-Daten von Xiaohongshu zu löschen. Die Schritte sind wie folgt: (1) Öffnen Sie Xiaohongshu und klicken Sie auf die Schaltfläche „Mein“ in der unteren rechten Ecke. (2) Suchen Sie auf der persönlichen Center-Seite nach „Einstellungen“ und klicken Sie darauf. (3) Scrollen Sie nach unten und suchen Sie nach „; Option „Cache löschen“. Klicken Sie auf „OK“. Nachdem Sie den Cache geleert haben, geben Sie Xiaohongshu erneut ein und versuchen Sie, Bilder zu posten, um zu sehen, ob das Problem mit dem automatischen Speichern behoben ist. 2. Aktualisieren Sie die Xiaohongshu-Version, um sicherzustellen, dass Ihr Xiaohongshu

Die 2024CSRankings National Computer Science Major Rankings wurden gerade veröffentlicht! In diesem Jahr gehört die Carnegie Mellon University (CMU) im Ranking der besten CS-Universitäten in den Vereinigten Staaten zu den Besten des Landes und im Bereich CS, während die University of Illinois at Urbana-Champaign (UIUC) einen der besten Plätze belegt sechs Jahre in Folge den zweiten Platz belegt. Georgia Tech belegte den dritten Platz. Dann teilten sich die Stanford University, die University of California in San Diego, die University of Michigan und die University of Washington den vierten Platz weltweit. Es ist erwähnenswert, dass das Ranking des MIT zurückgegangen ist und aus den Top 5 herausgefallen ist. CSRankings ist ein globales Hochschulrankingprojekt im Bereich Informatik, das von Professor Emery Berger von der School of Computer and Information Sciences der University of Massachusetts Amherst initiiert wurde. Die Rangfolge erfolgt objektiv

Mit dem Windows-Remotedesktopdienst können Benutzer aus der Ferne auf Computer zugreifen, was für Personen, die aus der Ferne arbeiten müssen, sehr praktisch ist. Es können jedoch Probleme auftreten, wenn Benutzer keine Verbindung zum Remotecomputer herstellen können oder Remotedesktop die Identität des Computers nicht authentifizieren kann. Dies kann durch Netzwerkverbindungsprobleme oder einen Fehler bei der Zertifikatsüberprüfung verursacht werden. In diesem Fall muss der Benutzer möglicherweise die Netzwerkverbindung überprüfen, sicherstellen, dass der Remote-Computer online ist, und versuchen, die Verbindung wiederherzustellen. Außerdem ist es wichtig, sicherzustellen, dass die Authentifizierungsoptionen des Remotecomputers richtig konfiguriert sind, um das Problem zu lösen. Solche Probleme mit den Windows-Remotedesktopdiensten können normalerweise durch sorgfältiges Überprüfen und Anpassen der Einstellungen behoben werden. Aufgrund eines Zeit- oder Datumsunterschieds kann Remote Desktop die Identität des Remotecomputers nicht überprüfen. Bitte stellen Sie Ihre Berechnungen sicher

Mit der Beliebtheit von Douyin-Kurzvideos sind die Benutzerinteraktionen im Kommentarbereich bunter geworden. Einige Benutzer möchten Bilder in Kommentaren teilen, um ihre Meinung oder Gefühle besser auszudrücken. Wie postet man also Bilder in TikTok-Kommentaren? Dieser Artikel beantwortet diese Frage ausführlich und gibt Ihnen einige entsprechende Tipps und Vorsichtsmaßnahmen. 1. Wie poste ich Bilder in Douyin-Kommentaren? 1. Öffnen Sie Douyin: Zuerst müssen Sie die Douyin-App öffnen und sich bei Ihrem Konto anmelden. 2. Suchen Sie den Kommentarbereich: Suchen Sie beim Durchsuchen oder Posten eines kurzen Videos die Stelle, an der Sie einen Kommentar abgeben möchten, und klicken Sie auf die Schaltfläche „Kommentieren“. 3. Geben Sie Ihren Kommentarinhalt ein: Geben Sie Ihren Kommentarinhalt in den Kommentarbereich ein. 4. Wählen Sie, ob Sie ein Bild senden möchten: In der Benutzeroberfläche zur Eingabe von Kommentarinhalten sehen Sie eine Schaltfläche „Bild“ oder eine Schaltfläche „+“. Klicken Sie darauf

Die neuesten iPhones von Apple halten Erinnerungen mit gestochen scharfen Details, Sättigung und Helligkeit fest. Manchmal kann es jedoch zu Problemen kommen, die dazu führen können, dass das Bild weniger klar aussieht. Während der Autofokus bei iPhone-Kameras große Fortschritte gemacht hat und es Ihnen ermöglicht, schnell Fotos aufzunehmen, kann die Kamera in bestimmten Situationen versehentlich auf das falsche Motiv fokussieren, wodurch das Foto in unerwünschten Bereichen unscharf wird. Wenn Ihre Fotos auf Ihrem iPhone unscharf wirken oder es ihnen insgesamt an Schärfe mangelt, soll Ihnen der folgende Beitrag dabei helfen, sie schärfer zu machen. So machen Sie Bilder auf dem iPhone klarer [6 Methoden] Sie können versuchen, Ihre Fotos mit der nativen Foto-App zu bereinigen. Wenn Sie mehr Funktionen und Optionen wünschen

In PowerPoint ist es eine gängige Technik, Bilder einzeln anzuzeigen, was durch das Festlegen von Animationseffekten erreicht werden kann. In dieser Anleitung werden die Schritte zur Implementierung dieser Technik detailliert beschrieben, einschließlich der grundlegenden Einrichtung, des Einfügens von Bildern, des Hinzufügens von Animationen sowie des Anpassens der Reihenfolge und des Timings der Animationen. Darüber hinaus stehen erweiterte Einstellungen und Anpassungen zur Verfügung, z. B. die Verwendung von Triggern, das Anpassen von Animationsgeschwindigkeit und -reihenfolge sowie die Vorschau von Animationseffekten. Durch Befolgen dieser Schritte und Tipps können Benutzer ganz einfach Bilder so einrichten, dass sie in PowerPoint nacheinander angezeigt werden, wodurch die visuelle Wirkung der Präsentation verbessert und die Aufmerksamkeit des Publikums erregt wird.

Verwenden Sie auch die Foxit PDF Reader-Software? Wissen Sie, wie Foxit PDF Reader PDF-Dokumente in JPG-Bilder konvertiert? Für diejenigen, die sich für die Konvertierungsmethode interessieren jpg-Bilder, kommen Sie bitte vorbei und schauen Sie sich unten um. Starten Sie zunächst Foxit PDF Reader, suchen Sie dann in der oberen Symbolleiste nach „Funktionen“ und wählen Sie dann die Funktion „PDF an andere“ aus. Öffnen Sie als Nächstes eine Webseite namens „Foxit PDF Online Conversion“. Klicken Sie auf die Schaltfläche „Anmelden“ oben rechts auf der Seite, um sich anzumelden, und aktivieren Sie dann die Funktion „PDF zu Bild“. Klicken Sie dann auf die Schaltfläche „Hochladen“ und fügen Sie die PDF-Datei hinzu, die Sie in ein Bild konvertieren möchten. Klicken Sie nach dem Hinzufügen auf „Konvertierung starten“.

Heute diskutieren wir darüber, wie Deep-Learning-Technologie die Leistung von visionbasiertem SLAM (Simultaneous Localization and Mapping) in komplexen Umgebungen verbessern kann. Durch die Kombination von Methoden zur Tiefenmerkmalsextraktion und Tiefenanpassung stellen wir hier ein vielseitiges hybrides visuelles SLAM-System vor, das die Anpassung in anspruchsvollen Szenarien wie schlechten Lichtverhältnissen, dynamischer Beleuchtung, schwach strukturierten Bereichen und starkem Jitter verbessern soll. Unser System unterstützt mehrere Modi, einschließlich erweiterter Monokular-, Stereo-, Monokular-Trägheits- und Stereo-Trägheitskonfigurationen. Darüber hinaus wird analysiert, wie visuelles SLAM mit Deep-Learning-Methoden kombiniert werden kann, um andere Forschungen zu inspirieren. Durch umfangreiche Experimente mit öffentlichen Datensätzen und selbst abgetasteten Daten demonstrieren wir die Überlegenheit von SL-SLAM in Bezug auf Positionierungsgenauigkeit und Tracking-Robustheit.
