《Eingebettete künstliche Intelligenz》
Zusammengestellt von Li Bin
ISBN: 978-7-302-62796-8
Preis: 69,00 Yuan
Scannen Sie den QR-Code, um Bücher mit Rabatt zu kaufen
Das Aufkommen von ChatGPT hat der Menschheit den Prototyp der allgemeinen künstlichen Intelligenz (AGI) offenbart. Die Menschen haben herausgefunden, dass, wenn künstliche neuronale Netze eine bestimmte Größe erreichen und mit anthropomorphen Lernmethoden (wie RLHF) gekoppelt werden, plötzlich ein Wunder geschieht und die Intelligenz beginnt, sich von den Fesseln des menschlichen Gehirns zu befreien und auf Computern realisiert zu werden!
Allerdings gibt es noch eine Herausforderung, die gelöst werden muss: Können wir die oben genannten Wunder auf Maschinen erreichen, die in Größe und Stromverbrauch mit Menschen vergleichbar sind, wie zum Beispiel humanoiden Robotern?
Derzeit erfordert ChatGPT den Einsatz von mehr als 30.000 GPUs für Training und Inferenz mit einer Gesamtleistung von mehr als 10 Millionen Watt und einer täglichen Stromrechnung von etwa 50.000 US-Dollar. Das Volumen des menschlichen Gehirns beträgt nur etwa 1,5 Liter und die Leistung beträgt weniger als 20 Watt. Wenn wir allgemeine künstliche Intelligenz in Roboter oder sogar kleinere Drohnen, Mobiltelefone, Smart-Home-Geräte oder IoT-Geräte einbetten wollen, müssen wir die oben genannten Herausforderungen meistern. Diesem Thema möchte das Buch „Embedded Artificial Intelligence“ nachgehen.
Im Bereich der eingebetteten künstlichen Intelligenz werden wir eine höhere Energieeffizienz nutzen, um schlankere Algorithmen auszuführen und sie in einer Maschine mit geringerer Größe und geringerem Gewicht unterzubringen, um Echtzeit-Denkungsaufgaben in der realen Welt zu erledigen. Mit einem Wort: Wir müssen künstliche Intelligenz auf möglichst effiziente Weise implementieren!
Um diese Herausforderung zu meistern, muss das Problem auf allen Ebenen angegangen werden. Zusammenfassend lässt sich sagen, dass zur Realisierung eingebetteter künstlicher Intelligenz fünf Komponenten erforderlich sind.
Eingebetteter KI-Chip. Es handelt sich um einen KI-Beschleuniger mit höherer Energieeffizienz.
Leichtgewichtiger KI-Algorithmus. Es hat eine geringere Rechenkomplexität und weniger Parameter, aber seine Genauigkeit ist mit großen KI-Algorithmen vergleichbar.
Modellkomprimierung. Es reduziert redundante Parameter in leichtgewichtigen KI-Algorithmen weiter und drückt sie effizienter aus.
Kompilierungsoptimierung. Es übersetzt das Modell in eine Kodierung, die besser zu den Anweisungen des KI-Beschleunigers passt.
Mehrschichtiges kaskadierendes Anwendungsframework. Es verwendet geeignetere Algorithmen zu geeigneteren Zeiten und reduziert so die Gesamtsystemkosten und den Energieverbrauch.
Durch die Kombination dieser 5 Komponenten soll die allgemeine künstliche Intelligenz wirklich in die Maschine eingebettet werden, sodass sie sehen, hören, sprechen und denken kann, wirklich „lebendig“ ist und zu einer anderen Lebensform wird – künstliches Leben.
Natürlich ist es noch ein weiter Weg, um die oben genannten Träume zu verwirklichen. Dieses Buch ist ein einführender Leitfaden, der die Probleme untersucht und aktuelle Methoden und Werkzeuge zu ihrer Lösung beschreibt. Es ist nicht die endgültige Antwort, aber sie liefert den Schlüssel, um dorthin zu gelangen.
Wenn Sie daran interessiert sind, allgemeine künstliche Intelligenz in Robotern, Drohnen, Mobiltelefonen, Smart-Home-Geräten und Geräten für das Internet der Dinge zu realisieren, ist es zweifellos ein nützliches Einführungsbuch.
Eigenschaften dieses Buches
1. Domestic Das erste Buchdas die eingebettete künstliche Intelligenz umfassend vorstellt.
2. Der Inhalt ist umfangreich und detailliert und deckt die Prinzipien, Plattformen und Praktiken der eingebetteten künstlichen Intelligenz ab.
3. Machen Sie eine systematische Zusammenfassung der Prinzipien der eingebetteten künstlichen Intelligenz.Das Konzept ist neu und die Organisation ist klar.
4. Umfassende Einführung in die Implementierung dereingebetteten Plattform für künstliche Intelligenz, einschließlich gängiger eingebetteter neuronaler Netzwerkchips und Software-Frameworks.
5. Fassen Sie denEntwicklungsprozess der eingebetteten künstlichen Intelligenz zusammen.
6. Prinzipien mit Praxis verbinden,Code verwenden, um praktische Anwendungsfälle eingebetteter künstlicher Intelligenz zu demonstrieren.
Anwendungsbeispiele
Im letzten Kapitel des Buches versuchen wir, einen fliegenden Sonnenschirm auf Basis einer Drohne zu realisieren. Diese Art von Regenschirm kann die Bewegungen von Menschen in Echtzeit verfolgen und Menschen jederzeit von der Sonne abhalten, wodurch die Hände der Menschen frei werden Fliegen im heißen Sommer. Viel Spaß beim Einkaufen, Spielen und im Mittelpunkt stehen.Um die Verfolgung des menschlichen Körpers für unbemannte Fallschirme zu erreichen, werden wir Methoden der maschinellen Bildverarbeitung einsetzen. Der menschliche Körper wird von der Kamera an der Vorderseite des Fallschirms fotografiert und die Umrisse des menschlichen Körpers mithilfe eines leichten Algorithmus zur Schätzung der menschlichen Körperhaltung berechnet, um die Positionen des Kopfes, der Gesichtszüge und der Gliedmaßengelenke der Person zu ermitteln und diese anschließend zu analysieren die Bewegungen des menschlichen Körpers, um vorherzusagen, in welche Richtung sich die Person vorwärts bewegen, sich zurückziehen, wenden oder bergauf oder bergab gehen wird, sodass der unbemannte fliegende Fallschirm diese Bewegung verfolgen und die räumliche Position des unbemannten fliegenden Fallschirms jederzeit anpassen kann. und erzielen Sie die folgende und Sonnenschutzwirkung auf den menschlichen Körper.
Unter Berücksichtigung von Gewicht, Stromverbrauch und anderen Gründen muss ein dedizierter eingebetteter KI-Chip verwendet werden. Im Buch wird NVIDIA Jetson als Beispiel für die Entwicklung verwendet. Mittlerweile werden Chips mit höherer Rechenleistung pro Watt, wie etwa ARM-basierte SoCs, häufig eingesetzt, um den Herausforderungen zu begegnen, die die rasante technologische Entwicklung mit sich bringt. Die im Buch vorgestellten Prozesse und Methoden sind jedoch weiterhin anwendbar.
Damit der oben genannte leichtgewichtige Algorithmus die Anforderungen des Echtzeit-Denkens auf dem eingebetteten KI-Chip erfüllt, ist es notwendig, Modellkomprimierungs- und Optimierungstechnologie zu verwenden, um das Modell zu bereinigen und zu quantifizieren, die Parameter des Modells zu reduzieren und es zu verbessern Die Argumentationsleistung wird verdoppelt, der Stromverbrauch reduziert und für dedizierte eingebettete AI-Chip-Inferenz optimiert. Das Buch veranschaulicht am Beispiel von TensorRT, dass bei Verwendung eines ARM-basierten SoC Komprimierungs- und Optimierungstechnologien wie Tensorflow Lite eingesetzt werden können.
Mit Hilfe des Wissens in diesem Buch können wir endlich den unbemannten Sonnenschirm zum Fliegen bringen!
Inhaltsverzeichnis
Zum Lesen nach oben wischen
Teil 1 Prinzipien
Kapitel 1 Künstliche Intelligenz und künstliche neuronale Netze
1.1 Was ist künstliche Intelligenz?
1.2 Was ist ein künstliches neuronales Netzwerk?1.3 Menschliches Gehirn
1.4 Grundlegende Zusammensetzung des künstlichen neuronalen Netzwerks
1.4.1 Künstliches Neuron
1.4.2 Struktur des künstlichen neuronalen Netzwerks
1.5 Lernmechanismus eines künstlichen neuronalen Netzwerks
1.6 Arten künstlicher neuronaler Netze
1.7 Vorteile künstlicher neuronaler Netze
1.8 Deep Neural Network
1.8.1 Was ist ein tiefes neuronales Netzwerk?
18.2 Gemeinsame tiefe neuronale Netze1.8.3 Faltungs-Neuronales Netzwerk
1.9 Suche nach neuronaler Netzwerkarchitektur (NAS)
1.9.1 Suchbereich
1.9.2 Reinforcement Learning Search
1.9.3 Progressive Suche
1.9.4 Diskrete Suche
1.10 Transferlernen
1.10.1 Was ist Transferlernen?
1.10.2 Arten des Transferlernens
1.10.3 Vorteile des Transferlernens
1.10.4 Lernmethode übertragen
1.10.5 Transferlernen und eingebettete künstliche Intelligenz
Kapitel 2 Eingebettete künstliche Intelligenz
2.1 Was ist eingebettete künstliche Intelligenz?
2.2 Warum eingebettete künstliche Intelligenz benötigt wird2.3 Erster Versuch: Cloud-Computing-Modell
2.4 Von der Cloud zum Gerät: lokaler Modus
2.5 Technische Herausforderungen eingebetteter künstlicher Intelligenz
2.5.1 Modellmaßstab
2.5.2 Energieeffizienz
2.5.3 Speicherzugriff
2.5.4 Inferenzgeschwindigkeit
2.5.5 Abmessungen und Gewicht
2.6 Implementierungsansätze eingebetteter künstlicher Intelligenz
2.7 Implementierungskomponenten eingebetteter künstlicher Intelligenz
Kapitel 3 Prinzip des eingebetteten KI-Chips
3.1 Paralleles Rechnen
3.2 Pulsierendes Array
3.3 Mehrstufiger Cache
3.4 Datenfluss
Kapitel 4 Leichtes neuronales Netzwerk
4.1 Reduzieren Sie die Rechenkomplexität
4.1.1 Gruppierte Faltung
4.1.2 Tiefenrichtungsfaltung
4.1.3 Punktweise Faltung
4.1.4 In der Tiefe trennbare Faltung
4.1.5 Kanal-Out-of-Order-Mischung
4.2 SqueezeNet
4.2.1 Kernidee
4.2.2 Netzwerkstruktur
4.2.3 Leistung
4.3 Xception
4.3.1 Kernidee
4.3.2 Netzwerkstruktur
4.3.3 Leistung
4.4 MobileNet v1
4.4.1 Kernidee
4.4.2 Netzwerkstruktur
4.4.3 Leistung
4.5 MobileNet v2
4.5.1 Kernidee
4.5.2 Netzwerkstruktur
4.5.3 Leistung
4.6 MnasNet
4.6.1 Kernidee
4.6.2 Netzwerkstruktur
4.6.3 Leistung
4.7 MobileNet v3
4.7.1 Kernidee
4.7.2 Netzwerkstruktur
4.7.3 Leistung
4.6 Anwendung eines leichten neuronalen Netzwerks
Kapitel 5 Tiefe neuronale Netzwerkkomprimierung
5.1 Allgemeine Methode zur Komprimierung neuronaler Netzwerke
5.1.1 Beschneiden
5.1.2 Gewichtsverteilung
5.1.3 Quantifizierung
5.1.4 Binär-/Ternärkonvertierung
5.1.5 Winograd-Faltung
5.2 Komprimierungs-Kompilierungs-Co-Design
5.2.1 Das Konzept der gemeinsamen Gestaltung von Komprimierung und Kompilierung
5.2.2 Kompressor
5.2.5-Compiler
5.2.6 Vorteile des Komprimierungs- und Kompilierungs-Co-Designs
Kapitel 6 Embedded Neural Network Application Framework
6.1 Struktur des hierarchischen Kaskadensystems
6.2 Effizienz des hierarchischen Kaskadensystems
6.4 Lokal-Cloud-Kollaborationsmodus
Kapitel 7 Lebenslanges tiefes Lernen
7.1 Mängel und Gründe des traditionellen Deep Learning
7.2 Das Ziel des lebenslangen tiefen Lernens
7.3 Merkmale des lebenslangen Deep Learning
7.4 Neurobiologische Implikationen
7.5 Implementierung eines lebenslangen tiefen neuronalen Netzwerks
7.5.1 Duales Lernsystem
7.5.2 Echtzeit-Update
7.5.3 Speicherzusammenführung
7.5.4 An reale Szenarien anpassen
7.6 Lebenslanges Deep Learning und eingebettete künstliche Intelligenz
Teil 2 Plattform
Kapitel 8 Hardwarebeschleuniger für eingebettete neuronale Netzwerke
8.1 Übersicht
8.2 NVIDIA Jetson
8.2.1 Einführung in das Jetson-Modul
8.2.1 Interne Struktur des Jetson-Moduls
8.2.3 Jetson-Leistung
8.3 Intel Movidius
8.3.1 Movidius Myriad X VPU-Chip
8.3.2 Intel Neural Compute Stick
8.4 Google Edge TPU
8.4.1 Einführung in Google Edge TPU
8.4.2 So funktioniert Google Edge TPU
8,5 XILINX DPU
8.6 ARM Ethos NPU
8.6.1 ARM-Prozessor für maschinelles Lernen
8.6.2 Ethos-N-Serie
8.6.3 Ethos-U-Serie
Zusammenfassung
Kapitel 9 Software-Framework für eingebettete neuronale Netzwerke
9.1 Tensorflow Lite
9.1.1 Einführung in TensorFlow Lite
9.1.2 Funktionsweise von TensorFlow Lite
9.2 TensorRT
9.3 OpenVINO
9.3.1 Einführung in OpenVINO
9.3.2 Struktur von Open VINO
9.3.3 Offene VINO-Anwendungsentwicklung
9.4 XILINX Vitis
9,5 uTensor
9.6 Apache TVM
Zusammenfassung
Teil 3 Erkenntnis
Kapitel 10 Aufbau einer eingebetteten Entwicklungsumgebung für neuronale Netze
10.1 Entwicklungsprozess eingebetteter KI
10.2 NVIDIA Jetson-Entwicklungsprozess
Kapitel 11 Optimierung des eingebetteten neuronalen Netzwerkmodells
11.1 TensorFlow-Modelloptimierung
11.1.1 Optimierung nach dem Training
11.1.2 Optimierung während des Trainings
11.2 TensorRT-Modelloptimierung
11.2.1 Integration mit gängigen Deep-Learning-Frameworks
11.2.2 Bereitstellung auf eingebetteten Systemen
11.2.3 TensorRT-API
11.2.4 TensorRT-Anwendungsbeispiel
11.2.5 Modellkonverter
11.3 Vergleich zweier Modelloptimierungstechniken
Kapitel 12 Durchführen von Inferenzen auf eingebetteten Geräten
12.1 Projekt aus der Quelle erstellen
12.2 Verwenden Sie ImageNet, um die Bildklassifizierung zu implementieren
12.2.1 Statische Bildklassifizierung
12.2.2 Echtzeit-Videoklassifizierung der Kamera
12.3 Verwenden Sie DetectNet, um eine Zielerkennung zu erreichen
13.3.1 Statische Bildzielerkennung
13.3.2 Echtzeit-Videozielerkennung der Kamera
12.4 Verwendung von SegNet zur Implementierung der semantischen Segmentierung
12.4.1 Statische Bildsemantiksegmentierung
12.4.2 Semantische Videosegmentierung
12.5 Verwendung von PyTorch zur Implementierung von Transferlernen
12.6 Verwendung transformierter Modelle
Kapitel 13 Anwendungsbeispiel für eingebettete neuronale Netze
13.1 Anwendungsszenarien
13.2 Hardware-Auswahl
13.3 Modellentwicklung
Fazit: Intelligenz in allen Dingen
Das obige ist der detaillierte Inhalt vonNeue Buchempfehlungen |. Eingebettete künstliche Intelligenz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!