aktueller Standort:Heim > Technische Artikel > Technologie-Peripheriegeräte > KI
- Richtung:
- alle web3.0 Backend-Entwicklung Web-Frontend Datenbank Betrieb und Instandhaltung Entwicklungswerkzeuge PHP-Framework tägliche Programmierung WeChat-Applet häufiges Problem andere Technik CMS-Tutorial Java System-Tutorial Computer-Tutorials Hardware-Tutorial Mobiles Tutorial Software-Tutorial Tutorial für Handyspiele
- Klassifizieren:
-
- Karpathys neues Tutorial geht viral und Internetnutzer beeilen sich, ihm H100: GPT-2-Training von Grund auf neu zu erstellen
- Der Meister Karpathy gibt sich nicht mehr mit der Verwendung der C-Sprache zur Erstellung von Lama zufrieden! Die neueste Herausforderung, der er sich stellte: die klassischen Ergebnisse von OpenAI zu reproduzieren, beginnend mit der Basisversion von GPT-2. Der Erfolg der Herausforderung selbst ist nicht unerwartet, aber die Durchführung des Trainings kostete nur 20 US-Dollar und 90 Minuten, und der Verlust und die Bewertung übertrafen die Originalversion um ein Vielfaches! haben! Punkt! Passieren! Punkt! Habe es! . Darüber hinaus schrieb er ein komplettes Tutorial zum Reproduktionsprozess, und tatsächlich wurde es wieder populär. Da Karpathy den A100-Cloud-Service selbst gemietet hat, kostete die Schulung der 124M-Version 20 US-Dollar. Doch jemand befolgte das Tutorial und lief mit H100. Dadurch verkürzte sich nicht nur die Trainingszeit, es sparte auch Geld: Es war in 43 Minuten abgeschlossen und kostete nur 14 US-Dollar. Darüber hinaus zahlte Karpathy auch 2 aus eigener Tasche
- KI 610 2024-06-07 10:29:25
-
- Sieben coole technische Interviewfragen für GenAI und LLM
- Um mehr über AIGC zu erfahren, besuchen Sie bitte: 51CTOAI.x Community https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou unterscheidet sich von der traditionellen Fragendatenbank, die überall im Internet zu sehen ist erfordert einen Blick über den Tellerrand hinaus. Large Language Models (LLMs) gewinnen in den Bereichen Datenwissenschaft, generative künstliche Intelligenz (GenAI) und künstliche Intelligenz zunehmend an Bedeutung. Diese komplexen Algorithmen verbessern die menschlichen Fähigkeiten, treiben Effizienz und Innovation in vielen Branchen voran und werden zum Schlüssel für Unternehmen, um wettbewerbsfähig zu bleiben. LLM hat ein breites Anwendungsspektrum und kann in Bereichen wie der Verarbeitung natürlicher Sprache, der Textgenerierung, der Spracherkennung und Empfehlungssystemen eingesetzt werden. Durch das Lernen aus großen Datenmengen ist LLM in der Lage, Text zu generieren
- KI 907 2024-06-07 10:06:29
-
- Stellen Sie große Sprachmodelle lokal in OpenHarmony bereit
- In diesem Artikel werden die Ergebnisse von „Local Deployment of Large Language Models in OpenHarmony“ auf der 2. OpenHarmony-Technologiekonferenz demonstriert. Open-Source-Adresse: https://gitee.com/openharmony-sig/tpc_c_cplusplus/blob/master/thirdparty/. InferLLM/docs/hap_integrate.md. Die Implementierungsideen und -schritte bestehen darin, das leichtgewichtige LLM-Modellinferenz-Framework InferLLM auf das OpenHarmony-Standardsystem zu übertragen und ein Binärprodukt zu kompilieren, das auf OpenHarmony ausgeführt werden kann. InferLLM ist ein einfaches und effizientes L
- KI 1186 2024-06-07 10:02:23
-
- Intel konzentriert sich auf Innovation und führt eine neue Xeon®-Markenstrategie ein
- Die Marke ist ein Symbol für die Mission und Entwicklung des Unternehmens und trägt auch Produkteigenschaften und Marktbekanntheit. Heute gab Brett Hannath, Global Vice President und Chief Marketing Officer der Intel Corporation, bei der Einführung des energieeffizienten Intel® Xeon® 6-Kernprozessors im Intel GTC Technology Experience Center die Einführung der neuen Marke Intel® Xeon® bekannt . Brett Hannath sagte, dass sich die neue Markenstrategie von Intel® Durch die Integration innovativer Technologien, hoher Leistung, hoher Effizienz, hoher Qualität und hoher Sicherheitsmerkmale schaffen wir ein neues Erlebnis für Industriepartner und Anwender. Seit ihrer Einführung im Jahr 1998 ist die Marke Intel® Xeon® bekannt
- KI 1053 2024-06-07 09:29:48
-
- Hochglänzender reflektierender Abschluss? Google NeRF-Casting: Raytracing kann es!
- NeRF hat keine „Angst“ mehr vor nahezu spiegelnden Reflexionen. Frühe NeRF-Varianten verwendeten mehrschichtige Perzeptrone (MLPs), um 3D-Koordinaten auf volumetrische Dichte und vom Blickwinkel abhängige Farben abzubilden. Die Darstellung detaillierter 3D-Geometrie und Farben erforderte jedoch das Training großer MLPs und die Auswertung extrem langsam. Die jüngste Arbeit konzentrierte sich darauf, NeRF effizienter zu machen, indem große MLPs durch voxelgitterartige Datenstrukturen oder eine Kombination aus Gittern und kleinen MLPs ersetzt wurden. Obwohl es für die Darstellung detaillierter großformatiger Szenen skalierbar ist, beschränken sich seine Vorteile auf die dreidimensionale Geometrie und überwiegend diffuse Farben. Die Erweiterung der Fähigkeit von NeRF, das aussichtsabhängige Erscheinungsbild der Realität zu modellieren, bleibt eine Herausforderung. Das aktuelle fortschrittliche Modell zur Sichtsynthese glänzender Objekte weist in zweierlei Hinsicht Einschränkungen auf: Es kann nur entferntes Umgebungslicht synthetisieren
- KI 1305 2024-06-07 09:27:53
-
- LLM |. Yuan 2.0-M32: Expertenmischungsmodell mit Aufmerksamkeitsrouting
- Bild 1. Die Schlussfolgerung ist oben geschrieben. Yuan+2.0-M32 ist eine Infrastruktur, ähnlich wie Yuan-2.0+2B, die eine Experten-Hybridarchitektur mit 32 Experten verwendet. 2 dieser Experten sind aktiv. Es wird eine Experten-Hybridarchitektur mit 32 Experten vorgeschlagen und übernommen, um Experten effizienter auszuwählen. Im Vergleich zum Modell mit dem klassischen Routing-Netzwerk wird die Genauigkeitsrate um 3,8 % verbessert. Yuan+2.0-M32 wird von Grund auf mit 2000B-Tokens trainiert und sein Trainingsverbrauch beträgt nur 9,25 % des eines dichten Ensemble-Modells mit der gleichen Parametergröße. Um Experten besser auswählen zu können, wird der Aufmerksamkeitsrouter eingeführt, der über die Fähigkeit verfügt, schnell zu erkennen und so eine bessere Auswahl von Experten zu ermöglichen. Yuan2,0-
- KI 698 2024-06-07 09:06:30
-
- Konstruktion eines Skalierungsgesetzes aus 80 Modellen: eine neue Arbeit eines chinesischen Doktoranden, die vom Autor der Denkkette wärmstens empfohlen wird
- Im Bereich der KI sind Skalierungsgesetze (Scalinglaws) ein leistungsstarkes Werkzeug zum Verständnis von LM-Skalierungstrends. Sie bieten eine Richtlinie für Forscher. Dieses Gesetz bietet einen wichtigen Leitfaden für das Verständnis, wie sich die Leistung von Sprachmodellen mit der Skalierung ändert. Leider ist die Skalierungsanalyse in vielen Benchmarking- und Post-Training-Studien nicht üblich, da die meisten Forscher nicht über die Rechenressourcen verfügen, um Skalierungsgesetze von Grund auf zu erstellen, und offene Modelle auf zu wenigen Skalen trainiert werden, um zuverlässige Skalierungsvorhersagen zu treffen. Forscher der Stanford University, der University of Toronto und anderer Institutionen haben eine alternative Beobachtungsmethode vorgeschlagen: Observational Scaling Laws (Observational Scaling Laws), die die Funktionen von Sprachmodellen (LM) mit Cross-Multiple-Modellen kombiniert.
- KI 633 2024-06-06 20:40:36
-
- Neugestaltung des Cloud-Build-Erlebnisses im Zeitalter der generativen KI
- Im Zeitalter der generativen KI beschleunigen sich die Veränderungen in der Cloud-Computing-Branche auf breiter Front und es ist an der Zeit, eine neue Cloud aufzubauen. Wie können wir uns als Entwickler problemlos an technologische Innovationen anpassen? Wie kann man neue Technologiechancen schnell nutzen, um schnell durchzustarten und zu wachsen? Nehmen Sie am Amazon Cloud Technology China Summit 2024 teil, einer unverzichtbaren Veranstaltung für Entwickler, die Ihnen dabei helfen kann, Ihre Fragen zu beantworten und Belohnungen zu erhalten! Amazon Cloud Technology gestaltet die One-Stack-Konstruktion von Entwicklung, Betrieb und Wartung sowie Optimierung im Zeitalter der generativen KI in der Cloud neu. Auf diesem Gipfel präsentieren wir Ihnen eine neue Entwicklerreise der generativen KI-Erkundung, einschließlich immersiver Star-Produkte . Erfahrung, praktische Spezialschulungen und Spitzenherausforderungen, Kompetenzzertifizierung und kostenloses Lernen, zukunftsweisender Technologieaustausch, Dialog mit globalen Community-Führungskräften, Entwickler-Kreativmarkt usw. helfen Entwicklern, unbegrenzt zu genießen
- KI 907 2024-06-06 18:48:01
-
- Die menschliche Präferenz ist der Herrscher! Mit der SPPO-Ausrichtungstechnologie können große Sprachmodelle miteinander und mit sich selbst konkurrieren
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. Einreichungs-E-Mail: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Richard Sutton hat in „TheBitterLesson“ diese Einschätzung abgegeben: „Die wichtigste Lehre, die aus 70 Jahren Forschung im Bereich der künstlichen Intelligenz gezogen werden kann, ist, dass die allgemeinen Methoden, die Computer nutzen, es irgendwann tun werden.“ ist am effektivsten und hat den Vorteil
- KI 659 2024-06-06 18:32:31
-
- Das von der physikalischen Wärmeübertragung inspirierte visuelle Darstellungsmodell vHeat versucht, den Aufmerksamkeitsmechanismus zu durchbrechen und weist sowohl eine geringe Komplexität als auch ein globales Empfangsfeld auf.
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. Einreichungs-E-Mail: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Die Autoren dieses Artikels sind die ursprünglichen Mitglieder von VMamba. Der Erstautor Wang Zhaozhi ist ein gemeinsam ausgebildeter Doktorand der University of Chinese Academy of Sciences und des Pengcheng Laboratory. Der Co-Autor ist Liu Yuesi, direkter Doktorand der Universität der Chinesischen Akademie der Wissenschaften im Jahr 2021. Ihre Hauptforschungsrichtung ist visuell
- KI 679 2024-06-06 17:28:46
-
- DenserRadar: 4D-Millimeterwellenradar-Punktwolkendetektor basierend auf einer dichten LiDAR-Punktwolke
- Originaltitel: DenserRadar: A4Dmillimeter-waveradarpointclouddetectorbasedondenseLiDARpointclouds Papierlink: https://arxiv.org/pdf/2405.05131 Autorenzugehörigkeit: Tsinghua University Papieridee: 4D-Millimeterwellenradar (mmWave) ist bekannt für seine Robustheit in extremen Umgebungen und seinen breiten Erkennungsbereich Die Fähigkeit, Geschwindigkeit und Höhe zu messen, hat ein erhebliches Potenzial zur Verbesserung der Wahrnehmung gezeigt, wenn autonome Fahrsysteme vor Herausforderungen stehen. Allerdings bestehen bei 4D-Millimeterwellenradar-Punktwolken inhärente Einschränkungen hinsichtlich der spärlichen Beschaffenheit und des Rauschens
- KI 878 2024-06-06 14:10:54
-
- Es werden die Bewertungsergebnisse des großen Sitzsackmodells enthüllt, die 19 % höher sind als die der vorherigen Generation „Skylark'.
- Kürzlich wurde das große Sitzsackmodell offiziell auf der Volcano Engine Power Conference vorgestellt. Während der Preissenkungstrend bei großen Modellen zu extrem niedrigen Preisen vorangetrieben wird, haben die Modellfähigkeiten von Doubao auch die Aufmerksamkeit der Branche auf sich gezogen. In einer Produktinformation von Volcano Engine veröffentlichte das Doubao Model-Team einige der internen Testergebnisse der ersten Phase: Auf den öffentlichen Bewertungssätzen von 11 Mainstream-Branchen wie MMLU, BBH, GSM8K, HumanEval usw. wurde die Gesamtpunktzahl ermittelt Doubao-pro-4k Es erzielte 76,8 Punkte, eine Steigerung von 19 % im Vergleich zu den 64,5 Punkten des Vorgängermodells Skylark 2. Dies ist auch besser als bei anderen inländischen Modellen, die im gleichen Zeitraum getestet wurden. Diese Evaluierung wurde im Mai dieses Jahres abgeschlossen und umfasste hauptsächlich neun inländische Großsprachmodelle, darunter Universal Model Pro, Skylark2 und
- KI 423 2024-06-06 13:45:41
-
- Yann LeCun: ViT ist langsam und ineffizient. Die Echtzeit-Bildverarbeitung hängt immer noch von der Faltung ab.
- Ist es im Zeitalter der Vereinheitlichung von Transformers immer noch notwendig, die CNN-Richtung der Computer Vision zu untersuchen? Zu Beginn dieses Jahres machte das große Videomodell Sora von OpenAI die VisionTransformer (ViT)-Architektur populär. Seitdem gibt es eine anhaltende Debatte darüber, wer leistungsfähiger ist: ViT oder das traditionelle Convolutional Neural Network (CNN). Kürzlich beteiligte sich auch Yann LeCun, Turing-Preisträger und Meta-Chefwissenschaftler, der in den sozialen Medien aktiv war, an der Diskussion über den Streit zwischen ViT und CNN. Der Grund für diesen Vorfall war, dass Harald Schäfer, CTO von Comma.ai, seine neuesten Forschungsergebnisse vorführte. Er (wie viele neuere KI-Forscher) hat sich jedoch an Yann LeCuns Gesichtsausdruck orientiert
- KI 1133 2024-06-06 13:25:02
-
- Sanofi arbeitet mit OpenAI und Formation Bio zusammen, um die Entdeckung von KI-Medikamenten zu beschleunigen
- Herausgeber | Diese Zusammenarbeit wird für die Pharmaindustrie von entscheidender Bedeutung sein. Durch die Kombination von Daten, künstlicher Intelligenz und Fachwissen in der Arzneimittelentwicklung wollen sie die Art und Weise revolutionieren, wie neue Medikamente entdeckt und auf den Markt gebracht werden. Paul Hudson, CEO von Sanofi, sagte: „Diese Zusammenarbeit ist ein wichtiger Schritt auf unserem Weg zu einem KI-gestützten Pharmaunternehmen.“ Brad Lightcap, COO von OpenAI, sagte: „KI hat ein enormes Potenzial, die Arzneimittelentwicklung zu beschleunigen. Wir.“
- KI 634 2024-06-06 12:54:35
-
- Verbesserter Erkennungsalgorithmus: zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern
- 01Ausblicksübersicht Derzeit ist es schwierig, ein angemessenes Gleichgewicht zwischen Detektionseffizienz und Detektionsergebnissen zu erreichen. Wir haben einen verbesserten YOLOv5-Algorithmus zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern entwickelt, der mehrschichtige Merkmalspyramiden, Multierkennungskopfstrategien und hybride Aufmerksamkeitsmodule verwendet, um die Wirkung des Zielerkennungsnetzwerks in optischen Fernerkundungsbildern zu verbessern. Laut SIMD-Datensatz ist der mAP des neuen Algorithmus 2,2 % besser als YOLOv5 und 8,48 % besser als YOLOX, wodurch ein besseres Gleichgewicht zwischen Erkennungsergebnissen und Geschwindigkeit erreicht wird. 02 Hintergrund und Motivation Mit der rasanten Entwicklung der Fernerkundungstechnologie wurden hochauflösende optische Fernerkundungsbilder verwendet, um viele Objekte auf der Erdoberfläche zu beschreiben, darunter Flugzeuge, Autos, Gebäude usw. Objekterkennung bei der Interpretation von Fernerkundungsbildern
- KI 1138 2024-06-06 12:33:01