Inhaltsverzeichnis
Übersicht
1. Traditionelle unbeaufsichtigte Methode
1.1 Beliebtheit
1.2 Kohäsion
1.3 Wortreichtum des linken und rechten Nachbarn
2. Einschränkungen der klassischen Methode
3. Entdeckung neuer Wörter basierend auf Deep Learning
3.1 Diagramm zur Wahrscheinlichkeitsverteilung der Worthäufigkeit
3.2 Klassischer Bildsegmentierungsalgorithmus
3.3 Neuer Worterkennungsalgorithmus basierend auf einem Faltungsnetzwerk
4. Modellinterne Analyse
5. Optimierungsraum
Heim Technologie-Peripheriegeräte KI Neuer Worterkennungsalgorithmus basierend auf CNN

Neuer Worterkennungsalgorithmus basierend auf CNN

Apr 11, 2023 pm 11:01 PM
算法 新词发现 全卷积网络模型

​Autor |. mczhao, leitender Forschungs- und Entwicklungsleiter von Ctrip, konzentriert sich auf den Bereich der Technologie zur Verarbeitung natürlicher Sprache.

Übersicht

Mit dem kontinuierlichen Aufkommen von Verbraucher-Hotspots und neuen Internet-Promi-Memes tauchen in NLP-Aufgaben auf E-Commerce-Plattformen häufig Wörter auf, die noch nie zuvor gesehen wurden. Diese Wörter sind nicht im vorhandenen Wortschatz des Systems enthalten und werden als „nicht registrierte Wörter“ bezeichnet.

Einerseits wirkt sich der Mangel an Wörtern im Lexikon auf die Wortsegmentierungsqualität einiger lexikonbasierter Wortsegmentierer aus, was sich indirekt auf die Qualität des Textabrufs und der Hervorhebungsaufforderungen auswirkt, dh auf die Genauigkeit der Benutzertextsuche und die Qualität der Suchergebnisse.

Andererseits werden im Mainstream-NLP-Deep-Learning-Algorithmus BERT/Transformer usw. bei der Verarbeitung von Chinesisch häufig Wortvektoren anstelle von Wortvektoren verwendet. Theoretisch sollte die Wirkung der Verwendung von Wortvektoren besser sein, aber aufgrund der nicht registrierten Wörter ist die Wirkung der Verwendung von Wortvektoren in der Praxis besser. Wenn das Vokabular vollständiger ist, ist die Wirkung der Verwendung von Wortvektoren besser als die der Verwendung von Wortvektoren.

Zusammenfassend lässt sich sagen, dass die Entdeckung neuer Wörter ein Problem ist, das wir derzeit lösen müssen.

1. Traditionelle unbeaufsichtigte Methode

Für dieses Problem der Entdeckung neuer chinesischer Wörter gibt es in der Branche bereits relativ ausgereifte Lösungen. Die Eingabe besteht aus einem Korpus, und nach der Segmentierung dieser Texte in NGram werden Kandidatensegmente generiert. Berechnen Sie einige statistische Merkmale dieser Fragmente und bestimmen Sie dann anhand dieser Merkmale, ob es sich bei diesem Fragment um ein Wort handelt.

Der gängige Ansatz in der Branche besteht darin, diese drei Indikatoren zu zählen und zu beobachten: Beliebtheit, Zusammenhalt und Reichtum links und rechts benachbarter Charaktere. Es gibt viele Artikel im Internet, die diese drei Indikatoren beschreiben. Eine kurze Einführung finden Sie in den beiden neuen Artikeln zur Worterkennung von Hello NLP.

1.1 Beliebtheit

Verwenden Sie die Worthäufigkeit, um Beliebtheit auszudrücken. Zählen Sie die Auftrittszeiten aller Fragmente im gesamten Korpus, und diese hochfrequenten Fragmente sind oft ein Wort.

1.2 Kohäsion

Verwenden Sie punktuelle gegenseitige Informationen, um den Zusammenhalt zu messen:

Neuer Worterkennungsalgorithmus basierend auf CNN

Zum Beispiel bestimmen wir, ob Hanting ein Wort ist, log(P("Hanting") /P("汉")P("Gericht")). Die Wahrscheinlichkeit, dass Hanting zu einem Wort wird, ist direkt proportional zur Popularität von „Hanting“ und umgekehrt proportional zur Popularität der einzelnen Wörter „Han“ und „ting“. Das ist leicht zu verstehen. Das häufigste Wort in chinesischen Schriftzeichen ist „的“. Die Wahrscheinlichkeit, dass ein beliebiges chinesisches Schriftzeichen mit „的“ übereinstimmt, bedeutet jedoch nicht, dass „x von“ oder „的x“. " ist das gleiche Wort. Hier spielt die Popularität des Wortes „的“ eine hemmende Rolle.

1.3 Wortreichtum des linken und rechten Nachbarn

Die Entropie des linken und rechten Nachbarn repräsentiert den Reichtum der linken und rechten Wörter. Die linke und rechte Adjazenzentropie ist die Zufälligkeit der Verteilung der Wörter, die links oder rechts vom Kandidatenwortfragment erscheinen. Sie können die Entropie links und die Entropie rechts trennen oder die beiden Entropien in einem Indikator kombinieren.

Neuer Worterkennungsalgorithmus basierend auf CNN

Zum Beispiel sind die Popularität und der Zusammenhalt des Segments „Shangri-La“ sehr hoch, und die Popularität und der Zusammenhalt des entsprechenden Untersegments „Shangri-La“ sind ebenfalls sehr hoch, aber weil „Shangri-La“ In den meisten Fällen erscheint das Wort „拉“ nach „里“. Die Entropie seines rechten Nachbarn ist sehr gering, was die Wortbildung verhindert. Man kann davon ausgehen, dass die drei Zeichen „shangri“ kein Wort bilden können allein.

2. Einschränkungen der klassischen Methode

Das Problem der klassischen Methode besteht darin, dass sie eine manuelle Einstellung der Schwellenwertparameter erfordert. Nachdem ein NLP-Experte die Wahrscheinlichkeitsverteilung der Fragmente im aktuellen Korpus verstanden hat, kombiniert er diese Indikatoren durch Formeln oder verwendet sie unabhängig voneinander und legt dann einen Schwellenwert als Beurteilungsstandard fest. Die Beurteilungsergebnisse können unter Verwendung dieses Standards ebenfalls eine hohe Genauigkeit erzielen.

Aber die Wahrscheinlichkeitsverteilung oder Worthäufigkeit ist nicht statisch. Da der Korpus immer häufiger wird oder die gewichtete Popularität des Korpus (normalerweise die entsprechende Produktpopularität) schwankt, werden die Parameter und Schwellenwerte in der Formel von Experten festgelegt Auch hier sind kontinuierliche Anpassungen erforderlich. Dadurch wird viel Arbeitskraft verschwendet und die Ingenieure der künstlichen Intelligenz werden zu bloßen Optimierern.

3. Entdeckung neuer Wörter basierend auf Deep Learning

3.1 Diagramm zur Wahrscheinlichkeitsverteilung der Worthäufigkeit

Die drei Indikatoren der oben genannten bestehenden Algorithmen in der Branche haben nur ein grundlegendes Quellmerkmal, nämlich das Wort Frequenz. Bei statistischen Methoden werden einige einfache und wichtige Statistiken normalerweise in Form von Bildern angezeigt, z. B. Histogramme, Boxplots usw. Auch ohne Modelleingriff können Menschen auf einen Blick richtige Entscheidungen treffen. Sie können den Korpus in alle längenbegrenzten Fragmente zerlegen, die Worthäufigkeit der Fragmente auf 0-255 normalisieren und sie einer zweidimensionalen Matrix zuordnen. Die Zeilen stellen die Anfangszeichen und die Spalten die Endzeichen dar. Ein Pixel ist ein Fragment, und die Pixelhelligkeit des Punktes ist die Beliebtheit des Kandidatenwortfragments.

Neuer Worterkennungsalgorithmus basierend auf CNN

Das obige Bild ist das Worthäufigkeits-Wahrscheinlichkeitsverteilungsdiagramm des kurzen Satzes „Pudong Airport Ramada Hotel“. Wir waren angenehm überrascht, dass wir mit bloßem Auge einige hellere gleichschenklige rechtwinklige Dreiecksblöcke grob unterscheiden können. wie zum Beispiel: „Pudong“, „Pudong Airport“, „Airport“, „Ramada Hotel“ usw. Diese Blöcke können feststellen, dass das entsprechende Fragment das Wort ist, das wir benötigen.

3.2 Klassischer Bildsegmentierungsalgorithmus

Durch Beobachtung der Worthäufigkeitswahrscheinlichkeitsverteilungskarte können wir ein Segmentierungsproblem für kurze Sätze in ein Bildsegmentierungsproblem umwandeln. Frühe Bildsegmentierungsalgorithmen ähneln den oben genannten neuen Worterkennungsalgorithmen. Sie sind auch schwellenwertbasierte Algorithmen zur Erkennung von Kantengraustufenänderungen. Mit der Entwicklung der Technologie werden heute im Allgemeinen Deep-Learning-Algorithmen verwendet U-Net-Bildsegmentierungsalgorithmus.

Neuer Worterkennungsalgorithmus basierend auf CNN

Die erste Hälfte von U-Net verwendet Faltungs-Downsampling, um Merkmale mehrerer Schichten unterschiedlicher Granularität zu extrahieren, und die zweite Hälfte wird hochgesampelt, um diese Merkmale mit derselben Auflösung und schließlich durch eine vollständige Verbindungsschicht zusammenzuführen +Softmax erhält Klassifizierungsergebnisse auf Pixelebene.

3.3 Neuer Worterkennungsalgorithmus basierend auf einem Faltungsnetzwerk

Die Segmentierung der Worthäufigkeitswahrscheinlichkeitsverteilungskarte ähnelt der Segmentierung des Diagramms, wobei benachbarte Positionen und ähnliche Graustufen vorhanden sind. Um kurze Sätze zu segmentieren, können Sie daher auch auf den Bildsegmentierungsalgorithmus zurückgreifen und ein vollständig Faltungsnetzwerk verwenden. Der Grund für die Verwendung der Faltung besteht darin, dass wir unabhängig davon, ob wir kurze Sätze oder Bilder schneiden, mehr auf lokale Informationen achten, also auf die Pixel nahe der Schnittkante. Der Grund für die Verwendung mehrschichtiger Netzwerke besteht darin, dass mehrschichtiges Pooling die Schwellenwertbeurteilung verschiedener Schichtmerkmale anzeigen kann. Wenn wir beispielsweise das Kartengelände schneiden, müssen wir nicht nur die Steigung (erste Ableitung/Differenz) berücksichtigen Änderung der Steigung (Ableitung/Differenz), die beiden werden jeweils mit einem Schwellenwert versehen und die Kombinationsmethode ist nicht nur eine einfache lineare Gewichtung, sondern ein serielles Netzwerk.

Für das neue Worterkennungsszenario entwerfen wir den folgenden Algorithmus:

  • Füllen Sie zunächst die Worthäufigkeitsverteilungskarte des kurzen Satzes mit 0 bis 24x24;
  • Zuerst gibt es zwei 3x3-Faltungsschichten und geben 4 aus Kanäle ;
  • Verknüpfen Sie die beiden Faltungsschichten, führen Sie eine weitere 3x3-Faltung durch und geben Sie einen einzelnen Kanal aus;
  • Die Verlustfunktion verwendet logistic=T, sodass die letzte Schicht für die Klassifizierung ohne Softmax-Ausgabe verwendet werden kann;

Neuer Worterkennungsalgorithmus basierend auf CNN

Im Vergleich zu U-Net gibt es folgende Unterschiede:

1) Down- und Up-Sampling werden aufgegeben, Der Grund dafür ist, dass die kurzen Sätze, die im Allgemeinen für die Segmentierung verwendet werden, relativ kurz sind und die Worthäufigkeitsverteilung Die Auflösung des Bildes ist nicht hoch, daher wird das Modell vereinfacht.

2) U-Net hat drei Kategorien (Block 1, Block 2, am Rand), Dieser Algorithmus erfordert nur zwei Kategorien (ob das Pixel ein Wort ist). Daher sind auch die endgültigen Ausgabeergebnisse unterschiedlich. U-Net gibt einige kontinuierliche Blöcke und Trennlinien aus, und wir benötigen nur, ob ein bestimmter Punkt positiv ist.

Das Bild unten zeigt das vom Modell vorhergesagte Ergebnis nach dem Training des Modells. Wir können sehen, dass in den Ausgabeergebnissen die Pixel identifiziert wurden, die den drei Wörtern „Shanghai“ (obere Zeile, Meeresspalte), „Hongqiao“ und „Geschäftsviertel“ entsprechen.

Neuer Worterkennungsalgorithmus basierend auf CNN

Verwenden Sie das trainierte Modell und geben Sie die Wahrzeichennamen in die Wahrzeichendatenbank von Ctrip ein. Einige neue Wörter können automatisch segmentiert und entdeckt werden, obwohl es einige schlechte Fälle gibt ist gut.

Neuer Worterkennungsalgorithmus basierend auf CNN

Nach dem Import dieser Wörter in den Thesaurus erhöht sich die Genauigkeit der Suchwortsegmentierung und die Thesaurusabdeckung der Wortsegmentierungsergebnisse erhöht sich. Da die Segmentierung von Suchwörtern im Allgemeinen dazu neigt, sich zu oft zu erinnern und verpasste Rückrufe zu eliminieren, verfolgt die Branche einen radikaleren Ansatz für den Rückruf durch Wortsegmentierung, und die Genauigkeit wird im Allgemeinen durch anschließende Sortierung gelöst. Daher hat sich die Genauigkeit der Wortsegmentierung verbessert, in den Augen der Benutzer hat sich die Genauigkeit der Suchergebnisse jedoch nicht wesentlich verbessert. Es kann jedoch einige der Probleme einer falschen Hervorhebung lösen, die durch Fehler bei der Wortsegmentierung verursacht werden.

4. Modellinterne Analyse

Wenn Sie erkunden möchten, wie das Modell funktioniert, können Sie den Faltungskern in der mittleren Ebene anzeigen. Wir vereinfachen zunächst die Anzahl der Faltungskerne in der Faltungsschicht des Modells von 4 auf 1. Zeigen Sie nach dem Training die mittlere Schicht über die API von TensorFlow an: model.get_layer('Conv2').__dict__. Wir haben festgestellt, dass der Faltungskern der Conv2-Schicht wie folgt lautet:

Neuer Worterkennungsalgorithmus basierend auf CNN

Sie können sehen, dass die erste und zweite Zeile entgegengesetzte Auswirkungen auf das Modell haben, entsprechend der vorherigen Pixelzeile abzüglich der aktuellen Zeile. Unterschied (mit Gewicht): Wenn der Graustufenunterschied größer ist, ist es wahrscheinlicher, dass die durch dieses Pixel dargestellte Zeichenfolge ein Wort ist.

Sie können auch sehen, dass der absolute Wert von 0,04505884 in der ersten Zeile und der zweiten Spalte relativ klein ist, wahrscheinlich weil die positiven Parameter der ersten Zeile minus der zweiten Zeile und die negativen Parameter der dritten Spalte minus der zweiten Zeile sind Spalte heben sich gegenseitig auf.

5. Optimierungsraum

Dieser Artikel beschreibt ein vollständig Faltungsnetzwerkmodell mit einer sehr einfachen Struktur, und es gibt noch viel Raum für Verbesserungen.

Erweitern Sie zunächst den Funktionsauswahlbereich. Die Eingabefunktion in diesem Artikel ist beispielsweise nur die Worthäufigkeit. Wenn die linke und rechte Adjazenzentropie auch in die Eingabefunktion einbezogen wird, ist der Segmentierungseffekt genauer.

Die zweite besteht darin, die Tiefe des Netzwerks zu erhöhen. Durch die Modellanalyse haben wir herausgefunden, dass sich die erste Faltungsschicht hauptsächlich mit den Fällen befasst, die durch mit 0 gefüllte Pixel verursacht werden. Es gibt nur eine Faltungsschicht, die sich tatsächlich auf die tatsächliche Wärme konzentriert. Wenn es sich um einen 3x3-Faltungskern handelt. Für das Differenzergebnis ist nur die erste Ordnung sichtbar, die zweite Zeile und Spalte vor und nach dem aktuellen Pixel werden nicht berücksichtigt. Sie können die Größe des Faltungskerns entsprechend erweitern oder das Netzwerk vertiefen, um das Sichtfeld des Modells zu vergrößern. Die Vertiefung des Netzwerks wird jedoch auch das Problem der Überanpassung mit sich bringen.

Schließlich kann dieses Modell nicht nur zur Ergänzung des Wortschatzes zur Verbesserung des Wortsegmentierungseffekts verwendet werden, sondern kann auch direkt als Referenz für die Wortsegmentierung verwendet werden. Dieses Modell kann sowohl beim Erinnern an Kandidatenwörter als auch bei Wörtern angewendet werden Segmentierungspfad-Bewertungsschritte des Wortsegmentierungsprozesses. Die Vorhersageergebnisse des Modells.

Das obige ist der detaillierte Inhalt vonNeuer Worterkennungsalgorithmus basierend auf CNN. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

CLIP-BEVFormer: Überwacht explizit die BEVFormer-Struktur, um die Leistung der Long-Tail-Erkennung zu verbessern CLIP-BEVFormer: Überwacht explizit die BEVFormer-Struktur, um die Leistung der Long-Tail-Erkennung zu verbessern Mar 26, 2024 pm 12:41 PM

Oben geschrieben und das persönliche Verständnis des Autors: Derzeit spielt das Wahrnehmungsmodul im gesamten autonomen Fahrsystem eine entscheidende Rolle Das Steuermodul im autonomen Fahrsystem trifft zeitnahe und korrekte Urteile und Verhaltensentscheidungen. Derzeit sind Autos mit autonomen Fahrfunktionen in der Regel mit einer Vielzahl von Dateninformationssensoren ausgestattet, darunter Rundumsichtkamerasensoren, Lidar-Sensoren und Millimeterwellenradarsensoren, um Informationen in verschiedenen Modalitäten zu sammeln und so genaue Wahrnehmungsaufgaben zu erfüllen. Der auf reinem Sehen basierende BEV-Wahrnehmungsalgorithmus wird von der Industrie aufgrund seiner geringen Hardwarekosten und einfachen Bereitstellung bevorzugt, und seine Ausgabeergebnisse können problemlos auf verschiedene nachgelagerte Aufgaben angewendet werden.

Implementierung von Algorithmen für maschinelles Lernen in C++: Häufige Herausforderungen und Lösungen Implementierung von Algorithmen für maschinelles Lernen in C++: Häufige Herausforderungen und Lösungen Jun 03, 2024 pm 01:25 PM

Zu den häufigsten Herausforderungen, mit denen Algorithmen für maschinelles Lernen in C++ konfrontiert sind, gehören Speicherverwaltung, Multithreading, Leistungsoptimierung und Wartbarkeit. Zu den Lösungen gehören die Verwendung intelligenter Zeiger, moderner Threading-Bibliotheken, SIMD-Anweisungen und Bibliotheken von Drittanbietern sowie die Einhaltung von Codierungsstilrichtlinien und die Verwendung von Automatisierungstools. Praktische Fälle zeigen, wie man die Eigen-Bibliothek nutzt, um lineare Regressionsalgorithmen zu implementieren, den Speicher effektiv zu verwalten und leistungsstarke Matrixoperationen zu nutzen.

Entdecken Sie die zugrunde liegenden Prinzipien und die Algorithmusauswahl der C++-Sortierfunktion Entdecken Sie die zugrunde liegenden Prinzipien und die Algorithmusauswahl der C++-Sortierfunktion Apr 02, 2024 pm 05:36 PM

Die unterste Ebene der C++-Sortierfunktion verwendet die Zusammenführungssortierung, ihre Komplexität beträgt O(nlogn) und bietet verschiedene Auswahlmöglichkeiten für Sortieralgorithmen, einschließlich schneller Sortierung, Heap-Sortierung und stabiler Sortierung.

Kann künstliche Intelligenz Kriminalität vorhersagen? Entdecken Sie die Möglichkeiten von CrimeGPT Kann künstliche Intelligenz Kriminalität vorhersagen? Entdecken Sie die Möglichkeiten von CrimeGPT Mar 22, 2024 pm 10:10 PM

Die Konvergenz von künstlicher Intelligenz (KI) und Strafverfolgung eröffnet neue Möglichkeiten zur Kriminalprävention und -aufdeckung. Die Vorhersagefähigkeiten künstlicher Intelligenz werden häufig in Systemen wie CrimeGPT (Crime Prediction Technology) genutzt, um kriminelle Aktivitäten vorherzusagen. Dieser Artikel untersucht das Potenzial künstlicher Intelligenz bei der Kriminalitätsvorhersage, ihre aktuellen Anwendungen, die Herausforderungen, denen sie gegenübersteht, und die möglichen ethischen Auswirkungen der Technologie. Künstliche Intelligenz und Kriminalitätsvorhersage: Die Grundlagen CrimeGPT verwendet Algorithmen des maschinellen Lernens, um große Datensätze zu analysieren und Muster zu identifizieren, die vorhersagen können, wo und wann Straftaten wahrscheinlich passieren. Zu diesen Datensätzen gehören historische Kriminalstatistiken, demografische Informationen, Wirtschaftsindikatoren, Wettermuster und mehr. Durch die Identifizierung von Trends, die menschliche Analysten möglicherweise übersehen, kann künstliche Intelligenz Strafverfolgungsbehörden stärken

Verbesserter Erkennungsalgorithmus: zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern Verbesserter Erkennungsalgorithmus: zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern Jun 06, 2024 pm 12:33 PM

01Ausblicksübersicht Derzeit ist es schwierig, ein angemessenes Gleichgewicht zwischen Detektionseffizienz und Detektionsergebnissen zu erreichen. Wir haben einen verbesserten YOLOv5-Algorithmus zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern entwickelt, der mehrschichtige Merkmalspyramiden, Multierkennungskopfstrategien und hybride Aufmerksamkeitsmodule verwendet, um die Wirkung des Zielerkennungsnetzwerks in optischen Fernerkundungsbildern zu verbessern. Laut SIMD-Datensatz ist der mAP des neuen Algorithmus 2,2 % besser als YOLOv5 und 8,48 % besser als YOLOX, wodurch ein besseres Gleichgewicht zwischen Erkennungsergebnissen und Geschwindigkeit erreicht wird. 02 Hintergrund und Motivation Mit der rasanten Entwicklung der Fernerkundungstechnologie wurden hochauflösende optische Fernerkundungsbilder verwendet, um viele Objekte auf der Erdoberfläche zu beschreiben, darunter Flugzeuge, Autos, Gebäude usw. Objekterkennung bei der Interpretation von Fernerkundungsbildern

Üben und denken Sie an die multimodale große Modellplattform DataCanvas von Jiuzhang Yunji Üben und denken Sie an die multimodale große Modellplattform DataCanvas von Jiuzhang Yunji Oct 20, 2023 am 08:45 AM

1. Die historische Entwicklung multimodaler Großmodelle zeigt den ersten Workshop zur künstlichen Intelligenz, der 1956 am Dartmouth College in den Vereinigten Staaten stattfand Pioniere der symbolischen Logik (außer dem Neurobiologen Peter Milner in der Mitte der ersten Reihe). Diese symbolische Logiktheorie konnte jedoch lange Zeit nicht verwirklicht werden und leitete in den 1980er und 1990er Jahren sogar den ersten KI-Winter ein. Erst mit der kürzlich erfolgten Implementierung großer Sprachmodelle haben wir entdeckt, dass neuronale Netze dieses logische Denken tatsächlich tragen. Die Arbeit des Neurobiologen Peter Milner inspirierte die spätere Entwicklung künstlicher neuronaler Netze, und aus diesem Grund wurde er zur Teilnahme eingeladen in diesem Projekt.

Anwendung von Algorithmen beim Aufbau einer 58-Porträt-Plattform Anwendung von Algorithmen beim Aufbau einer 58-Porträt-Plattform May 09, 2024 am 09:01 AM

1. Hintergrund des Baus der 58-Portrait-Plattform Zunächst möchte ich Ihnen den Hintergrund des Baus der 58-Portrait-Plattform mitteilen. 1. Das traditionelle Denken der traditionellen Profiling-Plattform reicht nicht mehr aus. Der Aufbau einer Benutzer-Profiling-Plattform basiert auf Data-Warehouse-Modellierungsfunktionen, um Daten aus mehreren Geschäftsbereichen zu integrieren, um genaue Benutzerporträts zu erstellen Und schließlich muss es über Datenplattformfunktionen verfügen, um Benutzerprofildaten effizient zu speichern, abzufragen und zu teilen sowie Profildienste bereitzustellen. Der Hauptunterschied zwischen einer selbst erstellten Business-Profiling-Plattform und einer Middle-Office-Profiling-Plattform besteht darin, dass die selbst erstellte Profiling-Plattform einen einzelnen Geschäftsbereich bedient und bei Bedarf angepasst werden kann. Die Mid-Office-Plattform bedient mehrere Geschäftsbereiche und ist komplex Modellierung und bietet allgemeinere Funktionen. 2.58 Benutzerporträts vom Hintergrund der Porträtkonstruktion im Mittelbahnsteig 58

Fügen Sie SOTA in Echtzeit hinzu und explodieren Sie! FastOcc: Schnellere Inferenz und ein einsatzfreundlicher Occ-Algorithmus sind da! Fügen Sie SOTA in Echtzeit hinzu und explodieren Sie! FastOcc: Schnellere Inferenz und ein einsatzfreundlicher Occ-Algorithmus sind da! Mar 14, 2024 pm 11:50 PM

Oben geschrieben & Das persönliche Verständnis des Autors ist, dass im autonomen Fahrsystem die Wahrnehmungsaufgabe eine entscheidende Komponente des gesamten autonomen Fahrsystems ist. Das Hauptziel der Wahrnehmungsaufgabe besteht darin, autonome Fahrzeuge in die Lage zu versetzen, Umgebungselemente wie auf der Straße fahrende Fahrzeuge, Fußgänger am Straßenrand, während der Fahrt angetroffene Hindernisse, Verkehrszeichen auf der Straße usw. zu verstehen und wahrzunehmen und so flussabwärts zu helfen Module Treffen Sie richtige und vernünftige Entscheidungen und Handlungen. Ein Fahrzeug mit autonomen Fahrfähigkeiten ist in der Regel mit verschiedenen Arten von Informationserfassungssensoren ausgestattet, wie z. B. Rundumsichtkamerasensoren, Lidar-Sensoren, Millimeterwellenradarsensoren usw., um sicherzustellen, dass das autonome Fahrzeug die Umgebung genau wahrnehmen und verstehen kann Elemente, die es autonomen Fahrzeugen ermöglichen, beim autonomen Fahren die richtigen Entscheidungen zu treffen. Kopf

See all articles