


Forscher bauen mit ChatGPT einen Tomatenpflückroboter und demonstrieren damit die unendlichen Möglichkeiten der künstlichen Intelligenz
Nachrichten vom 8. Juni: Kürzlich nutzten einige Forscher die Hilfe von ChatGPT, um einen Roboter zum Tomatenpflücken zu bauen.
ChatGPT von OpenAI ist ein Sprachmodell, das große Mengen an Textdaten verarbeiten und verstehen und diese Informationen zur Beantwortung von Fragen nutzen kann. In einer neuen Fallstudie wandten sich Forscher der Technischen Universität Delft in den Niederlanden und der Eidgenössischen Technischen Hochschule an ChatGPT-3, um Hilfe beim Entwurf und Bau eines Roboters zu erhalten.
Das klingt etwas seltsam, da ChatGPT-3 ein Sprachmodell und kein mechanisches Modell ist. „Obwohl ChatGPT-3 ein Sprachmodell ist, basiert seine Codegenerierung auch auf Text, was wichtige Erkenntnisse und Intuitionen für das physische Design liefert und großes Potenzial zeigt, die menschliche Kreativität anzuregen“, sagte Co-Autorin der Studie, Josie Hughes.
Zuerst fragten die Forscher das KI-Modell: „Welche Herausforderungen stehen der Menschheit in der Zukunft bevor?“ ChatGPT-3 stellte drei heraus: Nahrungsmittelversorgung, Bevölkerungsalterung und Klimawandel. Die Forscher wählten die Lebensmittelversorgung als Roboterdesignrichtung und fragten dann ChatGPT-3, welche Eigenschaften ein Tomatenernteroboter haben sollte. ChatGPT-3 bietet einen motorbetriebenen Greifer zum Pflücken reifer Tomaten vom Rebstock.
Sobald dieses grobe Design festgelegt ist, können Forscher Entscheidungen über Designdetails treffen, einschließlich der zu verwendenden Materialien und der zu schreibenden Steuercodes. Derzeit können Sprachmodelle keine vollständigen CAD-Modelle (Computer Aided Design) generieren, Codes auswerten oder automatisch Roboter herstellen. Daher müssen Forscher in diesem Schritt die Rolle von „Technikern“ übernehmen, um diese Aspekte zu unterstützen und den von der Sprache geschriebenen Code zu optimieren Modell. Vervollständigen Sie das CAD und bauen Sie den Roboter.
Oben sind die von den Forschern gestellten Fragen aufgeführt, während unten die Optionen aufgeführt sind, die das Sprachmodell bietet. Menschliche Entscheidungsbäume, grün schattiert, fokussieren das Problem nach und nach in eine Richtung, die mit ihren Zielen übereinstimmt.
Mit der technischen Beratung von ChatGPT-3 bauten die Forscher ihren Robotergreifer und testeten ihn in der realen Welt, indem sie ihn zum Pflücken von Tomaten verwendeten – mit erfolgreichen Ergebnissen.
b. Technische Vorschläge, einschließlich Formanweisungen, Codierung, Komponenten- und Materialauswahl, mechanisches Design usw., zur Generierung von Sprachmodellen. b. Basierend auf diesen Eingaben wurde eine Klemme gebaut und an realen Aufgaben getestet, beispielsweise beim Tomatenpflücken, wie rechts gezeigt.
Die Forscher sagen, ihre Fallstudie zeige das Potenzial der Zusammenarbeit zwischen Menschen und Sprachmodellen, um den Designprozess zu verändern, sie erkennen jedoch auch, dass diese Zusammenarbeit in unterschiedlichem Ausmaß erfolgen kann.
Ein extremer Ansatz, sagen sie, besteht darin, dass die KI als „Erfinder“ fungiert und den gesamten Input für das Design des Roboters liefert, während der Mensch ihn einfach blind anwendet. Ein anderer Ansatz besteht darin, das umfangreiche Wissen der KI zu nutzen, um das menschliche Fachwissen zu ergänzen. Der dritte Weg besteht darin, Menschen als Erfinder zu behalten und künstliche Intelligenz zur Fehlerbehebung, Fehlerbehebung und Bewältigung langwieriger oder zeitaufwändiger Prozesse zu nutzen, um den Designprozess zu optimieren.
Forscher haben einige der ethischen und gesunden Menschenverstandsrisiken angesprochen, die sich aus der Zusammenarbeit von KI mit Menschen ergeben können, und dabei Themen wie Voreingenommenheit, Plagiate und geistiges Eigentum als Problembereiche angeführt.
„In unserer Studie identifizierte ChatGPT-3 Tomaten als die geeignetste Nutzpflanze für die Entwicklung eines Ernteroboters“, sagte Hughes. „Dies könnte jedoch eine Voreingenommenheit gegenüber Nutzpflanzen sein, die in der Literatur besser abgedeckt sind, als gegenüber Nutzpflanzen, die es wirklich sind.“ Wenn Entscheidungen getroffen werden, die über das Wissen eines Ingenieurs hinausgehen, kann dies zu schwerwiegenden ethischen, technischen oder sachlichen Fehlern führen.
Trotz dieser Probleme glauben Forscher, dass die Zusammenarbeit zwischen künstlicher Intelligenz und Menschen großes Potenzial hat, wenn sie richtig gehandhabt wird . Großes Potenzial.
Diese Fallstudie wurde in der Zeitschrift Nature Machine Intelligence veröffentlicht, und Sie können hier klicken, um Details anzuzeigen.
Das obige ist der detaillierte Inhalt vonForscher bauen mit ChatGPT einen Tomatenpflückroboter und demonstrieren damit die unendlichen Möglichkeiten der künstlichen Intelligenz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



DALL-E 3 wurde im September 2023 offiziell als deutlich verbessertes Modell gegenüber seinem Vorgänger eingeführt. Er gilt als einer der bisher besten KI-Bildgeneratoren und ist in der Lage, Bilder mit komplexen Details zu erstellen. Zum Start war es jedoch exklusiv

OpenAI kündigte kürzlich die Einführung seines Einbettungsmodells embeddingv3 der neuesten Generation an, das seiner Meinung nach das leistungsstärkste Einbettungsmodell mit höherer Mehrsprachenleistung ist. Diese Reihe von Modellen ist in zwei Typen unterteilt: das kleinere Text-Embeddings-3-Small und das leistungsfähigere und größere Text-Embeddings-3-Large. Es werden nur wenige Informationen darüber offengelegt, wie diese Modelle entworfen und trainiert werden, und auf die Modelle kann nur über kostenpflichtige APIs zugegriffen werden. Es gab also viele Open-Source-Einbettungsmodelle. Aber wie schneiden diese Open-Source-Modelle im Vergleich zum Closed-Source-Modell von OpenAI ab? In diesem Artikel wird die Leistung dieser neuen Modelle empirisch mit Open-Source-Modellen verglichen. Wir planen, Daten zu erstellen

Im Jahr 2023 ist die KI-Technologie zu einem heißen Thema geworden und hat enorme Auswirkungen auf verschiedene Branchen, insbesondere im Programmierbereich. Die Bedeutung der KI-Technologie wird den Menschen zunehmend bewusst, und die Spring-Community bildet da keine Ausnahme. Mit der kontinuierlichen Weiterentwicklung der GenAI-Technologie (General Artificial Intelligence) ist es entscheidend und dringend geworden, die Erstellung von Anwendungen mit KI-Funktionen zu vereinfachen. Vor diesem Hintergrund entstand „SpringAI“ mit dem Ziel, den Prozess der Entwicklung von KI-Funktionsanwendungen zu vereinfachen, ihn einfach und intuitiv zu gestalten und unnötige Komplexität zu vermeiden. Durch „SpringAI“ können Entwickler einfacher Anwendungen mit KI-Funktionen erstellen, wodurch diese einfacher zu verwenden und zu bedienen sind.

Installationsschritte: 1. Laden Sie die ChatGTP-Software von der offiziellen ChatGTP-Website oder dem mobilen Store herunter. 2. Wählen Sie nach dem Öffnen in der Einstellungsoberfläche die Sprache aus. 3. Wählen Sie in der Spieloberfläche das Mensch-Maschine-Spiel aus 4. Geben Sie nach dem Start Befehle in das Chatfenster ein, um mit der Software zu interagieren.

Wenn die Antwort des KI-Modells überhaupt unverständlich ist, würden Sie es wagen, sie zu verwenden? Da maschinelle Lernsysteme in immer wichtigeren Bereichen eingesetzt werden, wird es immer wichtiger zu zeigen, warum wir ihren Ergebnissen vertrauen können und wann wir ihnen nicht vertrauen sollten. Eine Möglichkeit, Vertrauen in die Ausgabe eines komplexen Systems zu gewinnen, besteht darin, vom System zu verlangen, dass es eine Interpretation seiner Ausgabe erstellt, die für einen Menschen oder ein anderes vertrauenswürdiges System lesbar ist, d. h. so vollständig verständlich, dass mögliche Fehler erkannt werden können gefunden. Um beispielsweise Vertrauen in das Justizsystem aufzubauen, verlangen wir von den Gerichten, dass sie klare und lesbare schriftliche Stellungnahmen abgeben, die ihre Entscheidungen erläutern und stützen. Für große Sprachmodelle können wir auch einen ähnlichen Ansatz verfolgen. Stellen Sie bei diesem Ansatz jedoch sicher, dass das Sprachmodell generiert wird

Autor丨Zusammengestellt von TimAnderson丨Produziert von Noah|51CTO Technology Stack (WeChat-ID: blog51cto) Das Zed-Editor-Projekt befindet sich noch in der Vorabversionsphase und wurde unter AGPL-, GPL- und Apache-Lizenzen als Open Source bereitgestellt. Der Editor zeichnet sich durch hohe Leistung und mehrere KI-gestützte Optionen aus, ist jedoch derzeit nur auf der Mac-Plattform verfügbar. Nathan Sobo erklärte in einem Beitrag, dass in der Codebasis des Zed-Projekts auf GitHub der Editor-Teil unter der GPL lizenziert ist, die serverseitigen Komponenten unter der AGPL lizenziert sind und der GPUI-Teil (GPU Accelerated User) die Schnittstelle übernimmt Apache2.0-Lizenz. GPUI ist ein vom Zed-Team entwickeltes Produkt

Vor nicht allzu langer Zeit wurde OpenAISora mit seinen erstaunlichen Videogenerierungseffekten schnell populär und stach aus der Masse der literarischen Videomodelle hervor und rückte in den Mittelpunkt der weltweiten Aufmerksamkeit. Nach der Einführung des Sora-Trainings-Inferenzreproduktionsprozesses mit einer Kostenreduzierung von 46 % vor zwei Wochen hat das Colossal-AI-Team das weltweit erste Sora-ähnliche Architektur-Videogenerierungsmodell „Open-Sora1.0“ vollständig als Open-Source-Lösung bereitgestellt, das das gesamte Spektrum abdeckt Lernen Sie den Trainingsprozess, einschließlich der Datenverarbeitung, aller Trainingsdetails und Modellgewichte, kennen und schließen Sie sich mit globalen KI-Enthusiasten zusammen, um eine neue Ära der Videoerstellung voranzutreiben. Schauen wir uns für einen kleinen Vorgeschmack ein Video einer geschäftigen Stadt an, das mit dem vom Colossal-AI-Team veröffentlichten Modell „Open-Sora1.0“ erstellt wurde. Open-Sora1.0

Ollama ist ein superpraktisches Tool, mit dem Sie Open-Source-Modelle wie Llama2, Mistral und Gemma problemlos lokal ausführen können. In diesem Artikel werde ich vorstellen, wie man Ollama zum Vektorisieren von Text verwendet. Wenn Sie Ollama nicht lokal installiert haben, können Sie diesen Artikel lesen. In diesem Artikel verwenden wir das Modell nomic-embed-text[2]. Es handelt sich um einen Text-Encoder, der OpenAI text-embedding-ada-002 und text-embedding-3-small bei kurzen und langen Kontextaufgaben übertrifft. Starten Sie den nomic-embed-text-Dienst, wenn Sie o erfolgreich installiert haben
