Vor kurzem hat Xiaomi die neuesten Fortschritte bei Spracherkennungsalgorithmen erzielt, was die Leistung anderer Institutionen angeht und in internationalen Rankings einen Spitzenplatz einnimmt. Dieser Durchbruch gelang Xiaomi in der von Google veröffentlichten Audio-Labeling-Aufgabe AudioSet
Google hat den AudioSet-Datensatz in drei Teilmengen unterteilt, die für das Training verwendet wurden und zusammengeführt und „AudioSet-2M“ genannt wurden. In diesem zusammengeführten Trainingssatz durchbrach Xiaomis Spracherkennungsalgorithmusmodell 50 mAP in der Branche und aktualisierte die technischen Indikatoren für die Audiomarkierung. Darüber hinaus hat Xiaomi auch eine Mini-Version des Modells herausgebracht, die für ressourcenbeschränkte Szenarien geeignet ist.
Der Durchbruch dieser Technologie bedeutet einen weiteren Durchbruch in den Fähigkeiten des Xiaomi-Geräuscherkennungsalgorithmus. Nachdem diese Technologie auf viele der intelligenten Hardwaregeräte von Xiaomi angewendet wurde, kann sie Umgebungsgeräusche genauer erfassen und identifizieren, wodurch die Intelligenz der Hardware erheblich verbessert wird und Benutzern dadurch neue Möglichkeiten geboten werden ein komfortableres Smart-Life-Erlebnis.
Gleichzeitig haben die Fähigkeiten der Audio-Tagging-Technologie unter Xiaomis Spracherkennungsalgorithmus den Forschungs- und Entwicklungsprozess der Spitzenforschung in der Branche effektiv vorangetrieben.
Der verbesserte Spracherkennungsalgorithmus von Xiaomi kann in Xiaomis Smart-Geräten umfassend eingesetzt werden. Der Audio-Tagging-Algorithmus kann ein breites Spektrum an Umgebungsgeräuschen identifizieren, wie z. B. schreiende Babys, Tiergeräusche, Automotoren, Explosionen, Rauchmelder, Türklingeln, Wasserströme usw., und ermöglicht die Darstellung der Geräusche in der Umgebung in Modalitäten wie z als Text, Lass den Ton „sehen“. Dies kann Hardwaregeräte intelligenter machen und den Benutzern ein effizienteres und genaueres Spracherkennungserlebnis bieten.
Die „Xiaomi Hearing Sound“-Funktion in Xiaomi-Mobiltelefonen kann 14 wichtige Umgebungsgeräusche überwachen, darunter Feueralarm, weinende Babys, Wasserkocher usw., und Textnachrichten über die Benachrichtigungsleiste des Mobiltelefons senden. Diese Funktion erleichtert das Leben hörgeschädigter Menschen effektiv, und das Xiaomi-Armband kann diese Toninformationen auch gleichzeitig anzeigen und empfangen
Dieser Algorithmus wird in Smart-Home-Geräten noch häufiger verwendet. Derzeit wird der Spracherkennungsalgorithmus von Xiaomi in vielen Smart-Home-Geräten verwendet, beispielsweise in der Babyschrei-Überwachungsfunktion von Mijia-Kameras, die in Echtzeit Benachrichtigungen an die Mobiltelefone der Benutzer senden kann, wenn sie ein weinendes Baby erkennt. Der Xiaomi Sound-Lautsprecher ist außerdem mit einer Geräuscherkennungsfunktion ausgestattet, die sechs Arten von Geräuschen in der häuslichen Umgebung identifizieren kann, die den Benutzern wichtig sind, darunter Hausalarme, schreiende Babys, Feuermelder, fließendes Wasser, miauende Katzen und bellende Hunde. Die Schlaf-Schnarch-Überwachung der Xiaomi Health APP kann dabei helfen, das Schnarchen und Sprechen von Benutzern während des Schlafs zu verfolgen.
Um das Potenzial dieses Algorithmus besser auszuschöpfen, bietet Xiaomi durch sein AIoT-Plattform-Ökosystem einen breiten Raum für die Anwendung dieser Algorithmustechnologie. Derzeit hat das Akustik-Voice-Team von Xiaomi seine selbst entwickelte Akustik-Voice-Technologie vollständig auf mehr als 5.000 intelligente Produkte in 79 Kategorien angewendet, darunter Mobiltelefone, Lautsprecher, Fernseher, Kopfhörer, Uhren und Roboter von Xiaomi.
Im Bereich der künstlichen Intelligenz, die zum Spracherkennungsalgorithmus gehört, ist Xiaomi aktiv daran beteiligt, als einer der unteren Bereiche, in den Xiaomi seit langem weiter investiert. Berichten zufolge ist das KI-Team seit der Gründung seines KI-Teams durch Xiaomi im Jahr 2016 in sieben Jahren sechsmal gewachsen und hat mehr als 3.000 Menschen erreicht. Gleichzeitig haben die technischen KI-Fähigkeiten von Xiaomi auch viele Bereiche wie Vision, Akustik, Sprache, NLP, Wissensgraphen, maschinelles Lernen, große Modelle und Multimodalität abgedeckt und viele Geschäftsbereiche wie Mobiltelefone, Automobile, AIoT und Roboter. Im April dieses Jahres gründete Xiaomi offiziell ein KI-Team für große Modelle, um große Modelle vollständig zu berücksichtigen. Derzeit gibt es einige Anwendungsversuche. Das erste Anwendungsmodell besteht darin, den intelligenten Sprachassistenten Xiao Ai auf eine große Modellversion zu aktualisieren und offene Einladungstests durchzuführen.
Das obige ist der detaillierte Inhalt vonDie KI-Stärke von Xiaomi wurde erneut bestätigt und die Fähigkeit des Spracherkennungsalgorithmus zählt zu den besten der Welt.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!