aktueller Standort:Heim > Technische Artikel > Technologie-Peripheriegeräte > KI
- Richtung:
- alle web3.0 Backend-Entwicklung Web-Frontend Datenbank Betrieb und Instandhaltung Entwicklungswerkzeuge PHP-Framework tägliche Programmierung WeChat-Applet häufiges Problem andere Technik CMS-Tutorial Java System-Tutorial Computer-Tutorials Hardware-Tutorial Mobiles Tutorial Software-Tutorial Tutorial für Handyspiele
- Klassifizieren:
-
- Fügen Sie dem Videomodell schnelle und langsame Augen hinzu, Apples neue trainingsfreie Methode übertrifft alles, was SOTA in Sekundenschnelle leistet
- Seit der Veröffentlichung von Sora ist der Bereich der KI-Videogenerierung „geschäftiger“ geworden. In den letzten Monaten haben wir erlebt, wie Jimeng, RunwayGen-3, LumaAI und Kuaishou Keling abwechselnd explodierten. Anders als früher, als man auf den ersten Blick erkennen konnte, dass die Modelle von KI generiert wurden, ist dieser Stapel großer Videomodelle möglicherweise der „Beste“, den wir je gesehen haben. Hinter der erstaunlichen Leistung des Video Large Language Model (LLM) steckt jedoch ein riesiger und fein annotierter Videodatensatz, der sehr hohe Kosten erfordert. In jüngster Zeit sind im Forschungsbereich eine Reihe innovativer Methoden aufgetaucht, die kein zusätzliches Training erfordern: Verwenden Sie trainierte Bild-Großsprachmodelle, um Videoaufgaben direkt zu verarbeiten und so den „teuren“ Trainingsprozess zu umgehen. Darüber hinaus die meisten vorhandenen Video-LLMs
- KI 599 2024-08-11 16:02:31
-
- Hybridexperten sind durchsetzungsfähiger und können mehrere Modalitäten wahrnehmen und je nach Situation handeln. Meta schlägt modalitätsbewusste Expertenhybride vor
- Gemischte Experten haben auch Spezialisierungen in ihrem Beruf. Bei aktuellen Basismodellen mit gemischten Modalitäten besteht ein üblicher Architekturentwurf darin, Encoder oder Decoder bestimmter Modalitäten zu fusionieren. Diese Methode weist jedoch Einschränkungen auf: Sie kann keine Informationen aus verschiedenen Modalitäten integrieren und es ist schwierig, Inhalte auszugeben, die mehrere Modalitäten enthalten. Um diese Einschränkung zu überwinden, hat das Chameleon-Team von MetaFAIR in der kürzlich erschienenen Arbeit „Chameleon: Mixed-modalearly-fusionfoundationmodels“ eine neue Single-Transformer-Architektur vorgeschlagen, die diskrete Bilder und Texte basierend auf dem Vorhersageziel des nächsten Tokens transformieren kann Die aus Tokens zusammengesetzte Sequenz wird modelliert, so dass in verschiedenen Modi
- KI 488 2024-08-11 13:02:22
-
- Open- und Closed-Source-Modell „Chaos': Mal sehen, welcher Agent die wahren Absichten der Menschen am besten erkennen kann
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail für die Einreichung: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Die ersten Autoren dieses Artikels sind Qian Cheng und He Bingxiang, Studenten der Fakultät für Informatik an der Tsinghua-Universität. Beide sind Mitglieder von THUNLP. Qian Chengs Hauptforschungsinteressen sind das Lernen von Werkzeugen und große modellgesteuerte Agenten. Er ist im Begriff, an der UIUC zu promovieren. Die Hauptforschungsinteressen von He Bingxiang sind die Ausrichtung großer Modelle und
- KI 1299 2024-08-11 13:02:02
-
- Die erste Künstliche-Intelligenz-Party wurde erfolgreich abgehalten
- Im Jahr 1905 wurde im Beijing Fengtai Photo Studio der erste von den Chinesen selbst gedrehte Film „Dingjun Mountain“ geboren und beendete damit die Geschichte, in der es in China keine einheimischen Filme gab. Mehr als hundert Jahre später, am 28. August 2023, wurde in der „Original Heart“-Halle des People's Daily New Media Building das Lied „New Dingjun Mountain“ in „dimensionaler Zusammenarbeit“ von chinesischen College-Studenten aufgeführt Akademie der Oper und digitaler Mensch Mu Lan, was beim anwesenden Publikum Applaus auslöste. Die alte Kunst der Peking-Oper, die iterative Licht- und Schattentechnologie und die neue digitale Technologie sind eine Hommage an die Klassiker, durchbrechen gleichzeitig die Zeit und zeigen einen neuen Charme. Dies ist eines der Hauptprogramme, die im Rahmen der ersten von People's Daily Online veranstalteten Gala für künstliche Intelligenz (KI) gestartet wurden. Durch eine Reihe von Kulturfestivals voller Technologie, Intelligenz und Zukunft, der Party
- KI 594 2024-08-10 22:23:02
-
- 2024 World Artificial Intelligence Conference TOP20 Young Excellent Papers veröffentlicht
- Im März 2024 wurde die „Mitteilung zur Empfehlung teilnehmender Beiträge für den „2024 World Artificial Intelligence Conference Youth Outstanding Paper Award““ veröffentlicht und eine Sammelaktion für junge herausragende Beiträge im Bereich der künstlichen Intelligenz für Universitäten und wissenschaftliche Forschungsinstitute gestartet und Unternehmen auf der ganzen Welt. Bis zum Einsendeschluss sind insgesamt 159 Gutachterbeiträge aus dem In- und Ausland eingegangen, darunter international renommierte Universitäten, wissenschaftliche Forschungseinrichtungen und Unternehmen. Nach vorläufiger Bewertung und Neubewertung werden nun die TOP20 der herausragenden Jugendzeitungen des Jahres 2024 veröffentlicht. (In alphabetischer Reihenfolge nach Fachgebiet und Name) Der 2024 World Artificial Intelligence Conference Youth Outstanding Paper Award wird auf der World Artificial Intelligence Conference im Juli bekannt gegeben, also bleiben Sie dran!
- KI 1042 2024-08-10 16:06:11
-
- Forum-Vorschau |. Das Forum „Wissen verändert die Welt – Vertikales Großmodell definiert Wissensmanagement neu'.
- Einleitung: Die Großmodelltechnologie hat ein großes Potenzial für die Beschleunigung des Wissenserwerbs, der Integration, der Anwendung und der Innovation und kann transformative Auswirkungen auf viele Branchen wie Bildung, Finanzen und Regierungsangelegenheiten haben. Derzeit befindet sich die Anwendung vertikaler Großmodelle in Unternehmensszenarien in meinem Land noch in der Erkundungsphase. Viele Unternehmen suchen nach dem besten Implementierungsplan für Großmodelle. Darunter gilt die tiefe Integration in die interne Wissensbasis des Unternehmens Unternehmensszenario für die Implementierung vertikaler Großmodelle. Zu diesem Zweck wird Daguan Data während der Weltkonferenz für künstliche Intelligenz 2024 und der hochrangigen Konferenz zur globalen Governance künstlicher Intelligenz gemeinsam mit dem Fudan-Daguan Financial Vertical Application Large Model School-Enterprise Joint Research Center und der Pudong Youth Federation gemeinsam Gastgeber sein „Wissen verändert die Welt“ – Vertikales großes Forum zum Thema „Modell definiert Wissensmanagement neu“. Das Forum findet im Juli 2024 statt
- KI 1017 2024-08-10 11:20:06
-
- Die Innovation der Tencent Cloud-Datenbanktechnologie wurde von der Behörde für die Aufnahme in die ICDE, der wichtigsten internationalen Datenbankkonferenz, ausgezeichnet
- Ich habe heute erfahren, dass zwei Beiträge zur Tencent Cloud Database für die ICDE, die wichtigste internationale Datenbankkonferenz, ausgewählt wurden. Das verteilte Transaktionsprotokoll Lion und das speicherplattenübergreifende Indexdesign-Framework haben häufige Probleme im Datenbankbereich gelöst, und seine technologische Innovation wurde von internationalen Behörden anerkannt. Das Tencent Cloud Database Team teilte die Technologie am ICDE-Veranstaltungsort, den drei Top-Datenbankkonferenzen. ICDE (IEEE International Conference on Data Engineering) ist eine internationale Konferenz im Bereich der Datenbankforschung, die auch als die drei bekannt ist Top-Datenbankkonferenzen. Verteilte Datenbanktransaktionsverarbeitung Die verteilte Transaktionsverarbeitung umfasst mehrere Runden knotenübergreifender Kommunikation und ist langsam. vergangene Migration
- KI 731 2024-08-10 07:10:06
-
- KI hilft mir bei meinen Schulaufgaben, erledigt sie aber nicht für mich (ChatGPT, NotebookLM)
- Ich bin ein reiner Absolvent und habe gemischte Gefühle gegenüber KI-Tools. Viele Menschen nutzen KI, um ihre eigenen Anstrengungen im akademischen Umfeld zu ersetzen. Aber Sie können KI nutzen, um Ihr Lernen zu unterstützen, die Effizienz der Forschung zu steigern und Ihr Studium zu verbessern. Starten Sie In-De
- KI 838 2024-08-10 06:43:32
-
- Tongyi Qianwen hat Qwen2-Math als Open-Source-Lösung entwickelt und ist damit das fortschrittlichste mathematikspezifische Modell
- Laut Nachrichten vom 9. August hat das Team von Alibaba Tongyi ein Open-Source-Mathematikmodell der neuen Generation Qwen2-Math bereitgestellt, das ein Basismodell und ein Befehls-Feinabstimmungsmodell mit den drei Parametern 1,5B, 7B und 72B umfasst. Qwen2-Math wurde auf der Grundlage des Open-Source-Großsprachenmodells Qwen2 von Tongyi Qianwen entwickelt. Das Flaggschiffmodell Qwen2-Math-72B-Instruct schneidet besser ab als GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro und Llama Der maßgebliche Bewertungssatz MATH. -3.1-405B usw. behandelt eine Vielzahl mathematischer Probleme wie Algebra, Geometrie, Zählen und Wahrscheinlichkeit, Zahlentheorie usw. mit einer Genauigkeit von 84 % und ist damit das fortschrittlichste mathematikspezifische Modell. HINWEIS: In der MATH-Benchmark-Bewertung
- KI 938 2024-08-09 19:44:14
-
- Google I/O Developer Conference China Station: Große Modelltechnologie dringt in das gesamte Ökosystem ein
- Am Mittwoch hielt Google seine China Developers Conference in Peking ab. Zusätzlich zur I/O-Konferenz im Mai in Mountain View, Kalifornien, startete die diesjährige I/OConnect-Welttournee von Berlin (Deutschland) nach Bangalore (Indien) und ist auch in Peking (China) angekommen. Bei dieser Veranstaltung tauschten Experten aus vielen verschiedenen Bereichen ausführlich Googles neueste technologische Fortschritte, Entwicklungstools und globale Serviceplattformen in den Bereichen KI, Web, Mobil, Cloud-Technologie und anderen Bereichen für inländische Entwickler aus. „China ist einer der größten Entwicklermärkte der Welt und unsere Entwickler waren schon immer eine unverzichtbare Pionierkraft auf der globalen Bühne“, sagte Chen Junting, Präsident von Google Greater China, in der Eröffnungsrede. „Im vergangenen Jahr haben 25 Entwicklungsteams aus China insgesamt 31 Spiele und Anwendungen in verschiedenen Regionen der Welt produziert.
- KI 673 2024-08-09 19:42:02
-
- Vollständige 1-Jahres-MD-Berechnung in 2,5 Tagen? Die neue Berechnungsmethode des DeepMind-Teams basiert auf dem Euclidean Transformer
- Herausgeber | Radieschenhaut In den letzten Jahren wurden große Fortschritte bei der Entwicklung von Kraftfeldern für maschinelles Lernen (MLFF) auf Basis von Ab-initio-Referenzberechnungen erzielt. Obwohl geringe Testfehler erzielt werden, wird die Zuverlässigkeit von MLFF in Molekulardynamiksimulationen (MD) aufgrund von Bedenken hinsichtlich der Instabilität über längere Simulationszeiträume zunehmend unter die Lupe genommen. Untersuchungen haben einen möglichen Zusammenhang zwischen der Robustheit gegenüber kumulativen Ungenauigkeiten und der Verwendung äquivarianter Darstellungen in MLFF gezeigt, aber die mit diesen Darstellungen verbundenen Rechenkosten können diesen Vorteil in der Praxis einschränken. Um dieses Problem zu lösen, haben Forscher von Google DeepMind und der Technischen Universität Berlin (TUBerlin) ein Transformator-Framework namens SO3krates vorgeschlagen.
- KI 773 2024-08-09 19:40:30
-
- Karpathys Ansichten sind umstritten: RLHF ist kein echtes Reinforcement Learning, und Google und Meta sind dagegen
- Es scheint, dass jeder immer noch unterschiedliche Meinungen darüber hat, ob RLHF und RL in dieselbe Kategorie eingeordnet werden können. KI-Guru Karpathy ist erneut hier, um das Konzept der künstlichen Intelligenz bekannt zu machen. Gestern twitterte er: „Reinforcement Learning based on Human Feedback (RLHF) ist einfach Reinforcement Learning (RL).“ Der vollständige Text von Karpathy wird wie folgt erklärt: RLHF ist die dritte (und auch die dritte) Methode zum Training großer Sprachmodelle (LLM). ). Die letzte) Hauptstufe, die ersten beiden Stufen sind Vortraining und überwachte Feinabstimmung (SFT). Ich denke, dass RLHF kaum als RL angesehen wird und nicht allgemein anerkannt ist. RL ist mächtig, RLHF jedoch nicht. Schauen wir uns das Beispiel von AlphaGo an, das mit echtem RL trainiert wurde. Computerspiele
- KI 1080 2024-08-09 16:40:09
-
- Zwei Arbeiten wurden gleichzeitig für die „Best Paper Honourable Mention' nominiert. Das erste Real-Time Live Chinese-Team bei SIGGRAPH nutzt generative KI, um eine 3D-Welt zu erschaffen.
- SIGGRAPH, die weltweit führende akademische Konferenz mit Schwerpunkt auf Computergrafik, zeichnet sich durch einen neuen Trend aus. Auf der SIGGRAPH2024-Konferenz, die letzte Woche stattfand, erhielt das Team vom MARS-Labor der Shanghai University of Science and Technology neben dem besten Paper und anderen Auszeichnungen gleichzeitig zwei Ehrennominierungen für das beste Paper, und auch seine Forschungsergebnisse sind auf dem Vormarsch in Richtung Industrialisierung. Der Autor nutzt die Methode der generativen Modelle, um einen neuen Weg zu eröffnen, Fantasie direkt in komplexe 3D-Modelle umzuwandeln. Die beiden für den besten Beitrag nominierten Beiträge – CLAY und DressCode – befassen sich mit der 3D-Generierung bzw. der 3D-Bekleidungsgenerierung. In der Real-TimeLive-Sitzung von SIGGARPH demonstrierte das Team der Shanghai University of Science and Technology Echtzeitergebnisse basierend auf diesen beiden Arbeiten.
- KI 1080 2024-08-09 16:03:49
-
- Der DeepMind-Roboter spielt Tischtennis und seine Vor- und Rückhand rutschen in die Luft, wodurch menschliche Anfänger völlig besiegt werden
- Aber vielleicht kann er den alten Mann im Park nicht besiegen? Die Olympischen Spiele in Paris sind in vollem Gange und Tischtennis hat viel Aufmerksamkeit erregt. Gleichzeitig haben Roboter auch beim Tischtennisspielen neue Durchbrüche erzielt. Gerade hat DeepMind den ersten lernenden Roboteragenten vorgeschlagen, der das Niveau menschlicher Amateurspieler im Tischtennis-Wettkampf erreichen kann. Papieradresse: https://arxiv.org/pdf/2408.03906 Wie gut ist der DeepMind-Roboter beim Tischtennisspielen? Vermutlich auf Augenhöhe mit menschlichen Amateurspielern: Sowohl Vorhand als auch Rückhand: Der Gegner nutzt unterschiedliche Spielstile, und auch der Roboter hält aus: Aufschlagannahme mit unterschiedlichem Spin: Allerdings scheint die Intensität des Spiels nicht so intensiv zu sein wie Der alte Mann im Park. Für Roboter, Tischtennis
- KI 1448 2024-08-09 16:01:32
-
- Wird spekulatives Sampling die Inferenzgenauigkeit großer Sprachmodelle verlieren?
- Das Prototyp-Konzept des spekulativen Samplings wurde 2018 von MitchellStern et al. Dieser Ansatz wurde seitdem durch verschiedene Arbeiten weiterentwickelt und verfeinert, darunter LookaheadDecoding, REST, Medusa und EAGLE, wo spekulatives Sampling den Inferenzprozess großer Sprachmodelle (LLMs) erheblich beschleunigt. Eine wichtige Frage ist: Beeinträchtigt spekulatives Sampling im LLM die Genauigkeit des Originalmodells? Lassen Sie mich mit der Antwort beginnen: Nein. Der standardmäßige spekulative Stichprobenalgorithmus ist verlustfrei, und dieser Artikel wird dies durch mathematische Analysen und Experimente beweisen. Mathematisch kann die spekulative Stichprobenformel wie folgt definiert werden: wobei: ? eine reelle Zahl ist, die aus einer gleichmäßigen Verteilung entnommen wird. ist das nächste vorherzusagende Token. ?(?) ist durch das Entwurfsmodell gegeben
- KI 1272 2024-08-09 13:09:05