aktueller Standort:Heim > Technische Artikel > Technologie-Peripheriegeräte > KI
- Richtung:
- alle web3.0 Backend-Entwicklung Web-Frontend Datenbank Betrieb und Instandhaltung Entwicklungswerkzeuge PHP-Framework tägliche Programmierung WeChat-Applet häufiges Problem andere Technik CMS-Tutorial Java System-Tutorial Computer-Tutorials Hardware-Tutorial Mobiles Tutorial Software-Tutorial Tutorial für Handyspiele
- Klassifizieren:
-
- Exklusives Gespräch mit Li Yan: Gefördert von Suhua, Jingwei und Redpoint, dem ersten „Generative Recommendation'-KI-Pionier |
- Die Menschheit leitet ein explosives Update auf dem Gebiet der künstlichen Intelligenz ein. Jeder Schritt bei der Ausweitung der Technologie ins Unbekannte hat erstaunliche Aufmerksamkeit erregt. Im Prozess der Erweiterung der Grenzen der künstlichen Intelligenz koexistieren Innovation und Meinungsverschiedenheit auf den technischen Wegen wichtiger Strecken. Das Urteilsvermögen und die Entscheidungen von Technologiepionieren beeinflussen die Fußstapfen vieler Anhänger. Im vergangenen Jahr übernahm diese Website ausschließlich die Führung bei der Vorstellung herausragender Unternehmen wie Dark Side of the Moon, Shengshu Technology, Aishi Technology und Wuwen Core Dome und hinterließ ihnen das erste „Interview-Skript mit 10.000 Wörtern“ in der Welt Internetwelt. In einer Phase, in der die technische Roadmap noch nicht konvergiert ist, haben wir die Führung von KI-Unternehmern gesehen, die wirklich über Vertrauen, Mut und systematische Erkenntnis verfügen. Deshalb starten wir „AIPioneers“
- KI 880 2024-07-19 05:03:59
-
- Posthume Arbeit des OpenAI Super Alignment Teams: Zwei große Modelle spielen ein Spiel und die Ausgabe wird verständlicher
- Wenn die Antwort des KI-Modells überhaupt unverständlich ist, würden Sie es wagen, sie zu verwenden? Da maschinelle Lernsysteme in immer wichtigeren Bereichen eingesetzt werden, wird es immer wichtiger zu zeigen, warum wir ihren Ergebnissen vertrauen können und wann wir ihnen nicht vertrauen sollten. Eine Möglichkeit, Vertrauen in die Ausgabe eines komplexen Systems zu gewinnen, besteht darin, vom System zu verlangen, dass es eine Interpretation seiner Ausgabe erstellt, die für einen Menschen oder ein anderes vertrauenswürdiges System lesbar ist, d. h. so vollständig verständlich, dass mögliche Fehler erkannt werden können gefunden. Um beispielsweise Vertrauen in das Justizsystem aufzubauen, verlangen wir von den Gerichten, dass sie klare und lesbare schriftliche Stellungnahmen abgeben, die ihre Entscheidungen erläutern und stützen. Für große Sprachmodelle können wir auch einen ähnlichen Ansatz verfolgen. Stellen Sie bei diesem Ansatz jedoch sicher, dass das Sprachmodell generiert wird
- KI 769 2024-07-19 01:29:52
-
- Die Tsinghua-Universität gewann den Best Paper + Time Test Award, die Shandong-Universität erhielt eine lobende Erwähnung und die SIGIR 2024-Auszeichnungen wurden bekannt gegeben
- Die Ergebnisse der Tsinghua-Universität sind hervorragend. Die 47. International Computer Society Conference on Information Retrieval (ACMSIGIR) findet vom 14. bis 18. Juli 2024 in Washington, DC, USA statt. Diese Konferenz ist die wichtigste akademische Konferenz im Bereich Information Retrieval. Gerade hat die Konferenz den Best Paper Award, den Best Paper Runner-up, den Best Paper Honourable Mention Award und den Time Test Award bekannt gegeben. Unter ihnen gewannen die Tsinghua University, die Hillhouse School of Artificial Intelligence an der Renmin University of China und das Xiaohongshu-Team den zweiten Platz; Forscher der University of Glasgow und der University of Pisa erhielten den zweiten Platz Die Arbeit wurde an die Shandong-Universität (Qingdao), die Universität Leiden und die Universität Amsterdam verliehen; der Time Test Award ging an Forscher der Tsinghua-Universität und der University of California, Santa Cruz. Als nächstes lasst uns
- KI 499 2024-07-19 00:06:43
-
- Melden Sie sich bei Science an, die Arzneimittelaffinität ist um das 37-fache gestiegen, die KI führt eine unbeaufsichtigte Optimierung von Protein- und Antikörperkomplexen durch
- Herausgeber |. Rettichhautproteine sind an vielen biologischen Funktionen wie der Zellzusammensetzung, der Muskelkontraktion, der Verdauung von Nahrungsmitteln und der Identifizierung von Viren beteiligt. Um bessere Proteine (einschließlich Antikörper) zu entwickeln, mutieren Wissenschaftler häufig wiederholt Aminosäuren (die Einheiten, aus denen Proteine in einer bestimmten Reihenfolge bestehen) an verschiedenen Positionen, bis das Protein die gewünschte Funktion erhält. Aber es gibt mehr Aminosäuresequenzen als Sandkörner auf der Welt, daher ist es oft eine Herausforderung, die besten Proteine und damit die besten potenziellen Medikamente zu finden. Angesichts dieser Herausforderung geben Wissenschaftler oft Millionen von Dollar aus und testen miniaturisierte, vereinfachte Versionen biologischer Systeme. „Dies erfordert viel Rätselraten und Überprüfung.“
- KI 769 2024-07-18 22:22:51
-
- Wie verarbeitet das Gehirn Sprache? Princeton-Team analysiert Transformer-Modell
- Herausgeber | Rettichhaut Bei der Verarbeitung von Sprache setzt das Gehirn spezielle Berechnungen ein, um aus komplexen sprachlichen Strukturen Bedeutung zu konstruieren. Ein auf der Transformer-Architektur basierendes künstliches neuronales Netzwerk ist ein wichtiges Werkzeug für die Verarbeitung natürlicher Sprache. Forscher der Princeton University erforschen das Transformer-Modell und die funktionale Spezialisierung des menschlichen Gehirns bei der Sprachverarbeitung. Transformer berechnet und integriert Kontextinformationen zwischen Wörtern durch strukturierte Schaltkreise. Die aktuelle Forschung konzentriert sich jedoch hauptsächlich auf die internen Darstellungen („Einbettungen“), die von diesen Schaltkreisen erzeugt werden. Die Forscher analysierten Schaltungsberechnungen direkt: Sie zerlegten diese Berechnungen in funktional spezialisierte „Transformationen“, die Kontextinformationen über Wörter hinweg integrieren. Teilnehmer ausnutzen
- KI 686 2024-07-18 20:52:41
-
- Das Doubao Big Model Team veröffentlicht einen neuen Bewertungsbenchmark für Detailbildunterschriften, um die Zuverlässigkeit der VLM-Untertitelbewertung zu verbessern
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. Einreichungs-E-Mail: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Das aktuelle visuelle Sprachmodell (VLM) führt hauptsächlich eine Leistungsbewertung durch QA-Frage- und Antwortformat durch, es fehlt jedoch eine Bewertung des grundlegenden Verständnisses des Modells, wie z. B. zuverlässige Bewertungsmethoden für DetailimageCaption-Leistung. Als Reaktion auf dieses Problem hat die Chinesische Akademie der Wissenschaften,
- KI 768 2024-07-18 20:10:02
-
- Die neuen Produkte der Samsung China Galaxy Z-Serie greifen auf ein großes Sitzsackmodell zu
- Am 17. Juli brachte Samsung Electronics eine neue Generation von Produkten der Galaxy Z-Serie für den chinesischen Markt auf den Markt. Bei dem Treffen gaben Samsung Electronics und Volcano Engine offiziell ihre Zusammenarbeit bekannt, um Sitzsackmodelle mit den intelligenten Assistenten und der KI-Vision der Mobiltelefone Galaxy Z Fold6 und Galaxy Z Flip 6 zu verbinden und so das intelligente Anwendungserlebnis von Mobiltelefonen zu verbessern. Zuvor hatte Samsung bei der Einführung neuer Produkte im Ausland eine intensive Zusammenarbeit mit Google Gemini angekündigt. In China wurden Hersteller wie Volcano Engine als große Modellpartner ausgewählt. Fenye-Bildunterschrift: Das intelligente Assistenten- und KI-Sitzsackmodell für den visuellen Zugriff der Mobiltelefone Samsung Galaxy Z Fold6 und Galaxy Z Flip 6. Zusätzlich zu den bekannt gegebenen KI-Funktionen wie Kreissuche, Echtzeitübersetzung und Aufzeichnungstranskription usw., dieses Mal
- KI 535 2024-07-18 20:07:33
-
- Dieses multimodale große Modell der „nativen Version' verzichtet auf den visuellen Encoder und ist auch mit Mainstream-Methoden vergleichbar
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail für die Einreichung: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Diao Haiwen ist Doktorand an der Technischen Universität Dalian und sein Betreuer ist Professor Lu Huchuan. Derzeit absolviert er ein Praktikum am Beijing Zhiyuan Artificial Intelligence Research Institute. Der Dozent ist Dr. Wang Xinlong. Seine Forschungsinteressen sind Vision und Sprache, effiziente Übertragung großer Modelle, multimodale große Modelle usw. Lasst uns gemeinsam Cui machen
- KI 341 2024-07-18 19:21:11
-
- Sind alle diese VLMs blind? GPT-4o und Sonnet-3.5 haben den Sehtest nacheinander nicht bestanden
- Die vier großen VLMs versuchen alle, die Blinden zu täuschen? Lassen Sie die beliebtesten SOTA-Modelle (GPT-4o, Gemini-1.5, Sonnet-3, Sonnet-3.5) zählen, wie viele Schnittpunkte es zwischen zwei Linien gibt. Werden sie besser abschneiden als Menschen? Die Antwort ist wahrscheinlich nein. Seit der Einführung von GPT-4V haben visuelle Sprachmodelle (VLMs) die Intelligenz großer Modelle dem von uns vorgestellten Niveau der künstlichen Intelligenz einen großen Schritt näher gebracht. VLMs können sowohl Bilder verstehen als auch Sprache verwenden, um zu beschreiben, was sie sehen, und auf der Grundlage dieser Erkenntnisse komplexe Aufgaben ausführen. Wenn Sie dem VLM-Modell beispielsweise ein Bild eines Esstisches und ein Bild einer Speisekarte senden, kann es aus den beiden Bildern die Anzahl der Bierflaschen und den Stückpreis auf der Speisekarte extrahieren und berechnen
- KI 609 2024-07-18 18:18:02
-
- MotionClone: Keine Schulung erforderlich, Klonen von Videobewegungen mit einem Klick
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. Übermittlungs-E-Mail: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Es ist keine Schulung oder Feinabstimmung erforderlich. Die Bewegung des Referenzvideos kann in der durch das Eingabeaufforderungswort angegebenen neuen Szene geklont werden Körperbewegungen können mit einem Klick durchgeführt werden. Papier: https://arxiv.org/abs/2406.05
- KI 971 2024-07-18 17:06:12
-
- Ein neuer Weg für Menschen, KI zu imitieren, KI: Wenn es um Wahnsinn geht, bist du mein Vater
- Herausgeber des Berichts über die Macht der Maschinen: Yang Wens KI wurde von Menschen in die Irre geführt! Diese Welt ist so verrückt... Kürzlich sind in den sozialen Medien eine Menge lustiger Videos aufgetaucht, unter dem Motto KI, echte Menschen, die mit KI Cosplay machen, und Douyin hat sogar ein heißes Thema – den Human Imitation AI Contest. (Video vom Douyin-Blogger „Guan Ni Luan Shi“) Videolink: https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlwDie Routinen sind alle gleich: ein altes Foto auf der linken Seite und „AI Repair“ auf der linken Seite richtig“ Untertitel, die blutige „Verschwörung“ fehlender Hirnstämme wird tatsächlich von echten Menschen aufgeführt. -1-AI: Dies ist das erste Mal, dass ich imitiert wurde, aber ich hatte nicht erwartet, dass es schlimmer sein würde als bei mir.
- KI 1580 2024-07-18 16:51:08
-
- Die Inferenzeffizienz großer Modelle wurde ohne Verlust um das Dreifache verbessert. Die University of Waterloo, die Peking University und andere Institutionen haben EAGLE veröffentlicht
- Große Sprachmodelle (LLM) werden zunehmend in verschiedenen Bereichen eingesetzt. Allerdings ist ihr Textgenerierungsprozess teuer und langsam. Diese Ineffizienz wird auf die Betriebsregeln der autoregressiven Dekodierung zurückgeführt: Die Generierung jedes Wortes (Tokens) erfordert eine Vorwärtsausbreitung, die den Zugriff auf ein LLM mit Milliarden bis Hunderten von Milliarden Parametern erfordert. Dies führt dazu, dass die herkömmliche autoregressive Dekodierung langsamer ist. Kürzlich haben die University of Waterloo, das Canadian Vector Institute, die Peking University und andere Institutionen gemeinsam EAGLE veröffentlicht, das darauf abzielt, die Inferenzgeschwindigkeit großer Sprachmodelle zu verbessern und gleichzeitig eine konsistente Verteilung des Modellausgabetextes sicherzustellen. Diese Methode extrapoliert den zweiten Merkmalsvektor der obersten Ebene von LLM, was die Generierungseffizienz erheblich verbessern kann. Technischer Bericht: https://sites.google.com/view
- KI 873 2024-07-18 14:43:48
-
- Um die tatsächliche Leistung von Agent effektiv zu bewerten, gibt es das neue Online-Bewertungsframework WebCanvas
- Pan Yichen: Masterstudent im ersten Jahr an der Zhejiang-Universität. Kong Dehan: Leiter Modellalgorithmus bei Cross Star Technology. Zhou Sida: Er hat 2024 seinen Abschluss an der Nanchang-Universität gemacht und wird an der Xi'an University of Electronic Science and Technology einen Master-Abschluss machen. Cui Cheng: Absolvent der Zhejiang-Universität für Traditionelle Chinesische Medizin im Jahr 2024 und wird an der Universität Suzhou einen Master-Abschluss machen. Pan Yichen, Zhou Sida und Cui Cheng haben die Forschungsarbeit dieser Arbeit gemeinsam als Algorithmen-Praktikanten bei Cross Star Technology abgeschlossen. Im heutigen Zeitalter der rasanten technologischen Entwicklung verändert das Large Language Model (LLM) die Art und Weise, wie wir mit der digitalen Welt interagieren, in einem beispiellosen Tempo. LLM-basierte intelligente Agenten (LLMAgent) werden nach und nach von der einfachen Informationssuche bis hin zu komplexen Webseitenvorgängen integriert.
- KI 512 2024-07-18 14:04:51
-
- AKOOL unterstützt die Cannes Advertising Awards und bringt eine revolutionäre digitale Echtzeit-Menschenplattform auf den Markt
- Da die Europameisterschaft 2024 in vollem Gange ist, erfreute sich auch ein Fußballspielvideo des französischen Telekommunikationsunternehmens Orange schnell großer Beliebtheit. Im Video sahen wir Mbappe, Giroud, Griezmann ... Tatsächlich sind alle Athleten, die auf dem Platz laufen, keine echten Menschen, sondern virtuelle Charaktere, die durch künstliche Intelligenz generiert wurden. Aufgrund seiner herausragenden Kreativität und Einzigartigkeit gewann das Werk den „Oscar“ in der Branche für kreatives Werbemarketing – die Auszeichnung in der Sportkategorie beim diesjährigen Cannes Lions International Festival of Creativity. AKOOL leistete grundlegenden technischen Support für diese preisgekrönte Arbeit. Das von ihnen entwickelte KI-Gesichtserfassungssystem kann mithilfe sorgfältig entwickelter Rendering-Technologie die subtilen Ausdrücke und Bewegungen menschlicher Gesichter präzise erfassen
- KI 421 2024-07-18 09:26:11
-
- 178 Seiten, 128 Fälle, umfassende Bewertung von GPT-4V im medizinischen Bereich, noch weit von der klinischen Anwendung und praktischen Entscheidungsfindung entfernt
- Die Shanghai Jiao Tong University und das Shanghai AILab haben einen 178-seitigen medizinischen Fallbericht zu GPT-4V veröffentlicht, der erstmals umfassend die visuelle Leistung von GPT-4V im medizinischen Bereich enthüllt. Angetrieben durch groß angelegte Basismodelle hat die Entwicklung der künstlichen Intelligenz in letzter Zeit große Fortschritte gemacht, insbesondere die leistungsstarken Fähigkeiten von OpenAI in Bezug auf Frage und Antwort sowie Wissen, die den Eureka-Moment im KI-Bereich erhellten und eine breite Öffentlichkeit hervorriefen Sorge. GPT-4V(ision) ist das neueste multimodale Basismodell von OpenAI. Im Vergleich zu GPT-4 bietet es zusätzliche Bild- und Spracheingabefunktionen. Diese Studie zielt darauf ab, die Leistung von GPT-4V(ision) im Bereich der multimodalen medizinischen Diagnose durch eine Fallanalyse zu bewerten
- KI 1148 2024-07-18 06:20:10