Neuigkeiten vom 4. März: Der auf ChatGPT basierende Bing-Chat hat vielen Benutzern die Macht der KI spüren lassen, und Microsoft hat kürzlich eine leistungsstärkere Allround-KI auf den Markt gebracht – Kosmos-1. ChatGPT ist ein Nur-Text-LLM, während es sich um ein leistungsfähigeres multimodales großes Sprachmodell (MLLM) handelt. Kosmos-1 kann Bildinhalte analysieren, visuelle Rätsel lösen, visuelle Texterkennung durchführen, visuelle IQ-Tests bestehen, Anweisungen in natürlicher Sprache verstehen und vieles mehr.
IT House erfuhr aus Berichten, dass Kosmos-1 Text, Audio, Bilder, Videos und andere Inhalte verarbeiten kann und so eine umfassende künstliche Intelligenz aufbaut, die Aufgaben wie menschliches Denken bewältigen kann. „Als grundlegender Bestandteil der Intelligenz ist die multimodale Wahrnehmung eine notwendige Voraussetzung für die Erreichung künstlicher Intelligenz“, schreiben die Forscher in ihrer wissenschaftlichen Arbeit. Visuelle Beispiele im Kosmos-1-Artikel zeigen, wie das Modell Bilder analysiert und Fragen dazu beantwortet, Text aus Bildern liest, Bildunterschriften schreibt und einen visuellen IQ-Test mit einer Genauigkeit von 22–26 % durchführt.
Microsoft sagt, dass es plant, Kosmos-1 den Entwicklern zur Verfügung zu stellen, obwohl die GitHub-Seite, auf die das Papier verweist, zum Zeitpunkt der Veröffentlichung keinen offensichtlichen Kosmos-spezifischen Code enthielt.Das obige ist der detaillierte Inhalt vonMicrosoft ist leistungsstärker als ChatGPT und bringt das Allround-Modell Kosmos-1 für künstliche Intelligenz auf den Markt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!