aktueller Standort:Heim > Technische Artikel > Technologie-Peripheriegeräte > KI
- Richtung:
- alle web3.0 Backend-Entwicklung Web-Frontend Datenbank Betrieb und Instandhaltung Entwicklungswerkzeuge PHP-Framework tägliche Programmierung WeChat-Applet häufiges Problem andere Technik CMS-Tutorial Java System-Tutorial Computer-Tutorials Hardware-Tutorial Mobiles Tutorial Software-Tutorial Tutorial für Handyspiele
- Klassifizieren:
-
- Es sind nur wenige Demonstrationen erforderlich, um große Modelle auszurichten. Das von Yang Diyis Team vorgeschlagene DITTO ist äußerst effizient.
- Auch für große Modelle funktionieren Methoden der menschlichen Bildung gut. Bei der Kindererziehung haben Menschen aller Zeiten über eine wichtige Methode gesprochen: mit gutem Beispiel voranzugehen. Das heißt, seien Sie ein Vorbild für Kinder, das sie nachahmen und von dem sie lernen können, anstatt ihnen nur zu sagen, was sie tun sollen. Beim Training eines großen Sprachmodells (LLM) können wir diese Methode möglicherweise auch verwenden und dem Modell demonstrieren. Kürzlich hat das Team von Yang Diyi an der Stanford University ein neues Framework DITTO vorgeschlagen, das LLM durch eine kleine Anzahl von Demonstrationen (von Benutzern bereitgestellte Beispiele für gewünschtes Verhalten) an bestimmte Einstellungen anpassen kann. Diese Beispiele können aus den vorhandenen Interaktionsprotokollen des Benutzers oder durch direktes Bearbeiten der Ausgabe von LLM abgerufen werden. Dies ermöglicht es dem Modell, Benutzer effizient zu verstehen und auf unterschiedliche Benutzer und Aufgaben auszurichten
- KI 863 2024-08-05 16:10:32
-
- Alle Mitarbeiter verließen ihren alten Verein und Stable Diffusion führte das Team dazu, ein Unternehmen zu gründen, sobald es veröffentlicht wurde. Es besiegte MJ v6 und SD3 sofort und öffnete auch die Quelle
- Im Bereich der KI-Bild- und Videogenerierung ist ein weiterer leistungsstarker Player hinzugekommen. Erinnern Sie sich an Robin Rombach, einen Forscher, der Ende März dieses Jahres vom KI-Startup StabilityAI zurückgetreten ist? Als einer der beiden Hauptautoren, die das Vincent-Graphenmodell StableDiffusion entwickelt haben, kam er 2022 zu StabilityAI. Jetzt, fast fünf Monate nach seinem Ausscheiden aus StabilityAI, verkündete Robin Rombach die guten Nachrichten seines eigenen Unternehmens auf Twitter! Er gründete „BlackForestLabs“, um die hochwertigen generativen Deep-Learning-Modelle von SOTA für Bilder und Videos zu fördern und sie möglichst vielen Menschen zugänglich zu machen. Teammitglied Youjie
- KI 1035 2024-08-05 16:06:52
-
- Forum-Vorschau | „Inspirierende kulturelle Kreativität, Stimulierung unbegrenzter neuer Produktivität' – Vorschau auf das Entwicklungsforum „KI + kulturelle Kreativität'.
- Thema des Forums: Kulturelle Kreativität von Zhiqi, Förderung unbegrenzter neuer Produktivität. Zeit des Forums: 6. Juli, 9:30–11:40 Uhr. Ort des Forums: Konferenzraum 515, Shanghai World Expo Center des Lebens Neue Impulse entstehen mit Hilfe neuer Technologien. Bei der Kultivierung und Entwicklung der neuen Produktivkräfte „KI + Kultur und Kreativität“ setzt Shanghai aktiv den Einsatz des digitalen China-Aufbaus um, bietet erstklassiges Design und strategisches Layout für digitale Kultur- und Kreativ- und Yuanverse-Neuheiten und schafft eine „Kernkraft“. „Explosionspunkt“ für die innovative Entwicklung der Kultur- und Kreativwirtschaft. Bietet neue Chancen. Um die chinesische Kultur zu fördern, die innovative Entwicklung der Kultur- und Kreativbranche zu fördern und eine Kommunikationsplattform für in- und ausländische Kultur- und Kreativbereiche aufzubauen, wurde dieses „AI+ Cultural and Creative Development Forum“ ins Leben gerufen. Das Forum lädt globale Experten, Wissenschaftler, Eliten der Kultur- und Kreativbranche sowie Branchenführer ein, zusammenzukommen
- KI 497 2024-08-05 15:58:42
-
- Die ultimative Frage der Erklärbarkeit lautet: Was ist die erste Erklärung? 20 CCF-A+ICLR-Artikel geben Ihnen Antworten
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. Einreichungs-E-Mail: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Die Autoren dieses Artikels sind Zhang Junpeng, Ren Qihan und Zhang Quanshi. Zhang Junpeng ist ein angehender Doktorand von Zhang Quanshi, und Ren Qihan ist ein Doktorand von Zhang Quanshi. In diesem Artikel wird zunächst kurz das „Equivalent Interaction Interpretability Theoretical System“ (20 CCF-A- und ICLR-Artikel) besprochen
- KI 900 2024-08-05 15:55:55
-
- Eine weitere „inländische Version von Sora' wird weltweit eingeführt! Dank des Unternehmerteams von Tsinghua Zhu Jun dauert die Videoerstellung nur 30 Sekunden
- Der KI-Videokreis „kämpfe gegeneinander“. Luma und Runway im Ausland, Kuaishou Keling, Byte Dream, Zhipu Qingying im Inland ... du singst und ich werde erscheinen. Ausnahmslos alle haben es auf die legendäre Sora abgesehen. Tatsächlich ist Vidu von Shengshu Technology unverzichtbar, wenn es um Soras globale Herausforderer geht. Bereits vor drei Monaten, als der Bereich der Videoerzeugung im In- und Ausland noch „still“ war, enthüllte Shengshu Technology plötzlich das Werbevideo seines neuesten groß angelegten Videomodells Vidu Mit seiner lebendigen und lebensechten Wirkung, die es nicht ist Sora unterlegen, es schockierte alle Internetnutzer. Gerade heute wird Vidu offiziell eingeführt. Es ist keine Bewerbung erforderlich, solange Sie über eine E-Mail-Adresse verfügen, können Sie loslegen. (Link zur offiziellen Website von Vidu: www.vidu.stud
- KI 813 2024-08-05 15:46:59
-
- Ein bedeutender Durchbruch in der Riemann-Hypothese! Tao Zhexuan empfiehlt dringend neue Arbeiten vom MIT und Oxford, und der 37-jährige Fields-Medaillengewinner nahm daran teil
- Kürzlich gelang der Riemann-Hypothese, die als eines der sieben großen Probleme des Jahrtausends bekannt ist, ein neuer Durchbruch. Die Riemann-Hypothese ist ein sehr wichtiges ungelöstes Problem in der Mathematik, das sich auf die genauen Eigenschaften der Verteilung von Primzahlen bezieht (Primzahlen sind Zahlen, die nur durch 1 und sich selbst teilbar sind, und sie spielen eine grundlegende Rolle in der Zahlentheorie). In der heutigen mathematischen Literatur gibt es mehr als tausend mathematische Thesen, die auf der Aufstellung der Riemann-Hypothese (oder ihrer verallgemeinerten Form) basieren. Mit anderen Worten: Sobald die Riemann-Hypothese und ihre verallgemeinerte Form bewiesen sind, werden diese mehr als tausend Sätze als Theoreme etabliert, die einen tiefgreifenden Einfluss auf das Gebiet der Mathematik haben werden, und wenn sich die Riemann-Hypothese als falsch erweist, dann unter anderem Auch diese Sätze werden teilweise ihre Gültigkeit verlieren. Neuer Durchbruch kommt von MIT-Mathematikprofessor Larry Guth und der Universität Oxford
- KI 1140 2024-08-05 15:32:26
-
- Lama wird zum Topmodel unter den großen Models, Zuckerberg löst eine Debatte aus: Open Source spielen, die Zeiten haben sich geändert
- Der Streit zwischen Open Source und Closed Source dauert schon lange und könnte nun einen neuen Höhepunkt erreicht haben. Wenn es um Open-Source-Großmodelle geht, ist die Llama-Serie seit ihrer Geburt ein typischer Vertreter. Ihre hervorragende Leistung und Open-Source-Funktionen haben die Anwendbarkeit und Zugänglichkeit der Technologie der künstlichen Intelligenz erheblich verbessert. Jeder Forscher und Entwickler kann davon profitieren und Forschung und Anwendungen breiter verbreiten. Jetzt ist MetaLlama3.1405B offiziell veröffentlicht. Im offiziellen Blog sagte Meta: „Bisher sind große Open-Source-Sprachmodelle hinsichtlich Funktionalität und Leistung größtenteils hinter geschlossenen Modellen zurückgeblieben. Jetzt läuten wir eine neue Ära ein, die von Open-Source-Gründer Zuckerberg angeführt wird.“ Open Source Die Bedeutung von KI ist eine notwendige Voraussetzung für die Entwicklung von KI. Gründer und CEO von Meta
- KI 941 2024-08-05 15:22:07
-
- Alibabas „flugbahnsteuerbare Version von Sora' verabschiedet sich vom „Kartenziehen' und sorgt dafür, dass die Videoerzeugung besser mit physikalischen Gesetzen übereinstimmt
- Sie geben eine Route an und Tora generiert ein Video der entsprechenden Flugbahn. Derzeit sind Diffusionsmodelle in der Lage, vielfältige und qualitativ hochwertige Bilder oder Videos zu erzeugen. Zuvor verwendeten Videodiffusionsmodelle die U-Net-Architektur, die sich hauptsächlich auf die Synthese von Videos mit begrenzter Dauer (normalerweise etwa zwei Sekunden) mit festen Einschränkungen hinsichtlich Auflösung und Seitenverhältnis konzentrierte. Das Aufkommen von Sora durchbricht diese Einschränkung. Es nutzt die DiffusionTransformer (DiT)-Architektur, die sich nicht nur gut für die Produktion hochwertiger Videos von 10 bis 60 Sekunden eignet, sondern auch aufgrund ihrer Fähigkeit, unterschiedliche Auflösungen, verschiedene Seitenverhältnisse usw. zu erzeugen Befolgen Sie die tatsächlichen Gesetze der Physik und heben Sie sich ab. Man kann sagen, dass Sora der beste Beweis für die DiT-Architektur ist. Allerdings ist das Transformer-basierte Diffusionsmodell wirksam
- KI 864 2024-08-05 15:10:01
-
- Xiaohongshus große Sitzung zum Austausch von Modellpapieren brachte Autoren von vier großen internationalen Konferenzen zusammen
- Große Modelle stehen an der Spitze einer neuen Forschungswelle, mit zahlreichen innovativen Ergebnissen sowohl in der Industrie als auch in der Wissenschaft. Auch das technische Team von Xiaohongshu forscht ständig an dieser Welle, und die Forschungsergebnisse zahlreicher Arbeiten wurden häufig auf internationalen Spitzenkonferenzen wie ICLR, ACL, CVPR, AAAI, SIGIR und WWW vorgestellt. Welche neuen Chancen und Herausforderungen entdecken wir an der Schnittstelle zwischen großen Modellen und der Verarbeitung natürlicher Sprache? Welche effektiven Bewertungsmethoden gibt es für große Modelle? Wie kann es besser in Anwendungsszenarien integriert werden? Am 27. Juni von 19:00 bis 21:30 Uhr wird [REDtech kommt] Die elfte Ausgabe von „Xiaohongshu 2024 Large Model Frontier Paper Sharing“ wird online übertragen! REDtech hat das Community-Suchteam von Xiaohongshu speziell in den Live-Übertragungsraum eingeladen.
- KI 704 2024-08-05 14:33:02
-
- Hochbewerteter Beitrag von COLM, der ersten großen Modellkonferenz: Der Präferenzsuchalgorithmus PairS macht die Textauswertung großer Modelle effizienter
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. Einreichungs-E-Mail: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Die Autoren des Artikels stammen alle vom Language Technology Laboratory der Universität Cambridge, und seine Betreuer sind die Professoren Nigel Collier und Ehsan Shareghi. Seine Forschungsinteressen sind große Modell- und Textauswertung, Datengenerierung usw. gemeinsam
- KI 964 2024-08-05 14:31:52
-
- Die RNN-Effizienz ist mit der von Transformer vergleichbar. Die neue Architektur von Google hat zwei aufeinanderfolgende Veröffentlichungen: Sie ist im gleichen Maßstab stärker als Mamba
- Im Dezember letzten Jahres sprengte die neue Architektur Mamba den KI-Kreis und forderte den ewigen Transformer heraus. Der heutige Start von Google DeepMind „Hawk“ und „Griffin“ bietet neue Optionen für den KI-Kreis. Dieses Mal hat Google DeepMind neue Schritte in Bezug auf Grundmodelle unternommen. Wir wissen, dass rekurrente neuronale Netze (RNN) in den Anfängen der Deep-Learning- und Natural-Language-Processing-Forschung eine zentrale Rolle spielten und in vielen Anwendungen praktische Ergebnisse erzielt haben, darunter auch Googles erstes durchgängiges maschinelles Übersetzungssystem. In den letzten Jahren wurden Deep Learning und NLP jedoch von der Transformer-Architektur dominiert, die Multi-Layer-Perceptron (MLP) und Multi-Head-Attention (MHA) kombiniert. Tra
- KI 1081 2024-08-05 14:20:15
-
- Fähigkeitsausrichtung, Langtext, Claude 3, dieses Mal werden wir über die wichtigsten technischen Pfade großer Modelle sprechen
- Große Textmodelle haben in mehreren Dimensionen wie Mathematik, Programmierung, Mehrsprachenverständnis und Vision neue Höhen erreicht. „Rasche Veränderung“ reicht nicht mehr aus, um den aktuellen Entwicklungstrend der Großmodelltechnik zu beschreiben. Um die neuesten Fortschritte in der Großmodelltechnologie besser zu teilen, starteten dieser Standort, Zhangjiang Science and Technology Investment, Zhangjiang Incubator und WAICCircle im Jahr 2024 gemeinsam die Aktivitätsreihe „Large Model Technology Workshop“, zu der Experten aus Industrie und Wissenschaft an vorderster Front eingeladen wurden und Forschung, um innovative Beobachtungen und Erkenntnisse zu liefern. Lassen Sie uns am Nachmittag des 22. März im 3. Stock von Block A, Kehai-Gebäude, Nr. 800 Naxian Road, Zhangjiang, Shanghai, mit dem Thema „Claude3 Hitzewelle kommt“ über die wichtigsten technischen Wege von Text-Großmodellen sprechen ".
- KI 1220 2024-08-05 14:01:32
-
- Ein weiterer Spieler auf Sora-Niveau kommt auf die Straße! Wir haben es mit Sora und Keling verglichen.
- Als Sora nicht herauskam, nutzten die Gegner von OpenAI ihre Waffen, um die Straßen zu zerstören. Wenn Sora nicht zur Nutzung geöffnet ist, wird es wirklich gestohlen! Heute hat das Startup LumaAI aus San Francisco einen Trumpf ausgespielt und eine neue Generation des KI-Videogenerierungsmodells DreamMachine auf den Markt gebracht. Kostenlos und für alle verfügbar. Berichten zufolge kann das Modell auf Basis einfacher Textbeschreibungen hochwertige, realistische Videos generieren, mit vergleichbaren Effekten wie Sora. Sobald die Nachricht bekannt wurde, strömten zahlreiche Benutzer auf die offizielle Website, um es auszuprobieren. Obwohl Beamte behaupten, dass das Modell in nur zwei Minuten Videos mit 120 Bildern erzeugen kann, warten viele Benutzer aufgrund des Anstiegs der Besuche stundenlang auf die offizielle Website. BarkleyDai, Lumas Leiter für Produktwachstum, musste sich auf Discord äußern
- KI 751 2024-08-02 10:19:44
-
- Wie bringt man Zellen dazu, Berechnungen durchzuführen? Vier inländische Universitäten schlugen eine neue Methode zum Entwurf biologischer Computerkomponenten vor und wurden in Cell aufgeführt
- Herausgeber |. Autor von Carrot Skin |. Thesenteam Eine Zelle ist wie ein Computer, der jede Sekunde verschiedene Informationen aus der Umgebung empfängt, analysiert und verarbeitet: Externe Informationen werden über hochparallele Signaltransduktionswege in der Zelle analysiert und verarbeitet und dann Informationen gelesen (Genexpression) oder schreibt Anweisungen (DNA-Modifikation und -Bearbeitung) aus dem „Speichergerät“ (d. h. DNA) in einer vordefinierten Weise, um sich selbst oder umgebende Zellen zu steuern, um auf Umweltinformationen zu reagieren. Auf dem Gebiet der Informatik und Biotechnologie ging es schon immer darum, die Rechenleistung von Organismen effektiv zu nutzen, Organismen so umzuwandeln, dass sie von Menschen gestellte Rechenaufgaben ausführen können, und neue Konzeptcomputer auf der Grundlage biologischer Systeme zu entwickeln. Heiße Themen in der Kreuzfusion . Kürzlich von der National University of Defense Technology, West Lake
- KI 642 2024-08-02 07:26:54
-
- Die neuen Funktionen von Poe sind so leistungsstark! Selbst ohne Programmierkenntnisse können Sie in 10 Minuten einen Meme-Editor erstellen
- Herausgeber des Machine Power Report: Ist es notwendig, dass die inländischen Großmodelle von Sia schnell aufholen? Kürzlich hat Poe, eine KI-Chat-Plattform von Quora, einer Q&A-Community in Nordamerika, eine neue Funktion namens „Previews“ eingeführt. Mit dieser Echtzeit-Vorschaufunktion können Benutzer im Poe-Chat generierte Webanwendungen direkt anzeigen und verwenden. Das heißt, in Poe können Sie mit einigen LLMs chatten, die sehr gut im Codieren sind, wie zum Beispiel Claude-3.5-Sonnet, GPT-4, Gemini1.5Pro. Codeschnipsel, Webdesign, Spiele und andere während des Chats generierte Inhalte können in diesem Fenster in der Vorschau angezeigt und für praktische Erfahrungen genutzt werden. Als ich es zum ersten Mal ausprobierte, hatte der Editor ohne Programmierkenntnisse Angst.
- KI 1374 2024-08-02 00:23:25