aktueller Standort:Heim > Technische Artikel > Technologie-Peripheriegeräte > KI
- Richtung:
- alle web3.0 Backend-Entwicklung Web-Frontend Datenbank Betrieb und Instandhaltung Entwicklungswerkzeuge PHP-Framework tägliche Programmierung WeChat-Applet häufiges Problem andere Technik CMS-Tutorial Java System-Tutorial Computer-Tutorials Hardware-Tutorial Mobiles Tutorial Software-Tutorial Tutorial für Handyspiele
- Klassifizieren:
-
- Caltech-Chinesen nutzen KI, um mathematische Beweise zu untergraben! Beschleunigen Sie 5-mal schockiert Tao Zhexuan, 80 % der mathematischen Schritte sind vollständig automatisiert
- LeanCopilot, dieses formale Mathematikwerkzeug, das von vielen Mathematikern wie Terence Tao gelobt wurde, hat sich erneut weiterentwickelt? Soeben gab Caltech-Professorin Anima Anandkumar bekannt, dass das Team eine erweiterte Version des LeanCopilot-Papiers veröffentlicht und die Codebasis aktualisiert hat. Adresse des Bildpapiers: https://arxiv.org/pdf/2404.12534.pdf Die neuesten Experimente zeigen, dass dieses Copilot-Tool mehr als 80 % der mathematischen Beweisschritte automatisieren kann! Dieser Rekord ist 2,3-mal besser als der vorherige Basiswert von Aesop. Und wie zuvor ist es Open Source unter der MIT-Lizenz. Auf dem Bild ist er Song Peiyang, ein chinesischer Junge
- KI 808 2024-04-23 15:01:29
-
- Das Neueste von der Universität Oxford! Mickey: 2D-Bildabgleich in 3D SOTA! (CVPR\'24)
- Projektlink vorne geschrieben: https://nianticlabs.github.io/mickey/ Anhand zweier Bilder kann die Kameraposition zwischen ihnen geschätzt werden, indem die Korrespondenz zwischen den Bildern hergestellt wird. Normalerweise handelt es sich bei diesen Entsprechungen um 2D-zu-2D-Entsprechungen, und unsere geschätzten Posen sind maßstabsunabhängig. Einige Anwendungen, wie z. B. Instant Augmented Reality jederzeit und überall, erfordern eine Posenschätzung von Skalenmetriken und sind daher auf externe Tiefenschätzer angewiesen, um die Skalierung wiederherzustellen. In diesem Artikel wird MicKey vorgeschlagen, ein Keypoint-Matching-Prozess, mit dem metrische Korrespondenzen im 3D-Kameraraum vorhergesagt werden können. Durch das Erlernen des 3D-Koordinatenabgleichs zwischen Bildern können wir auf metrische Relativwerte schließen
- KI 849 2024-04-23 13:20:21
-
- Neuer Test-Benchmark veröffentlicht, der leistungsstärkste Open-Source-Llama 3 ist peinlich
- Wenn die Testfragen zu einfach sind, können sowohl Spitzenschüler als auch schlechte Schüler 90 Punkte erreichen, und der Abstand kann nicht vergrößert werden ... Mit der Veröffentlichung stärkerer Modelle wie Claude3, Llama3 und später sogar GPT-5 ist die Branche in Bewegung Dringender Bedarf an einem schwierigeren und differenzierteren Benchmark-Modell. LMSYS, die Organisation hinter der großen Modellarena, brachte den Benchmark der nächsten Generation, Arena-Hard, auf den Markt, der große Aufmerksamkeit erregte. Es gibt auch die neueste Referenz zur Stärke der beiden fein abgestimmten Versionen der Llama3-Anweisungen. Im Vergleich zu MTBench, das zuvor ähnliche Ergebnisse erzielte, stieg die Arena-Hard-Diskriminierung von 22,6 % auf 87,4 %, was auf den ersten Blick stärker und schwächer ist. Arena-Hard basiert auf menschlichen Echtzeitdaten aus der Arena und seine Übereinstimmungsrate mit menschlichen Vorlieben liegt bei bis zu 89,1 %.
- KI 748 2024-04-23 12:13:10
-
- Erkundung des Python-Artefakts: Wie interpretiert das eli5-Modul die Vorhersageergebnisse des maschinellen Lernmodells?
- Im Bereich der Python-Programmierung stoßen wir manchmal auf komplexe Codes oder Algorithmen, deren Logik und Prinzipien schwer zu verstehen sind. Um uns zu helfen, den Funktionsmechanismus hinter dem Code besser zu verstehen, wurde das ELI5-Modul ins Leben gerufen. Das ELI5-Modul ist eine Python-Bibliothek, die die Vorhersagen von Modellen für maschinelles Lernen interpretieren kann. Helfen Sie uns zu verstehen, wie das Modell Entscheidungen trifft. Mit dem ELI5-Modul können wir das Interpreter-Lernmodell verwenden, um die Vorhersagen des Modells zu verstehen. Dieses Modul bietet eine prägnante Möglichkeit, die Entscheidung des Modells für eine bestimmte Stichprobe zu erklären. Das Funktionsprinzip des ELI5-Moduls besteht darin, uns durch Sortieren und Visualisieren der Bedeutung von Funktionen zu helfen, das Modell zu verstehen. In diesem Artikel werden wir die Verwendung des eli5-Moduls in verschiedenen Szenarien untersuchen.
- KI 1380 2024-04-23 09:20:02
-
- Die kollaborativen SaaS-Produkte von Tencent sind vollständig in das Hunyuan-Modell integriert, um intelligente Upgrades zu ermöglichen
- Am 22. April gab Tencent bekannt, dass seine kollaborativen SaaS-Produkte vollständig in das Hunyuan-Modell von Tencent integriert sind. Zusätzlich zu „drei herausragenden Produkten“ wie Enterprise WeChat, Tencent Conference und Tencent Documents, Tencent Enjoy, Tencent Electronic Signature, Tencent Questionnaire und Collaborative Auch SaaS-Produkte wie der Tencent Cloud AI Code Assistant wurden intelligent aktualisiert. Tencent Hunyuan hat seit seiner Einführung sein Label der Praktikabilität hervorgehoben und eine seiner Kernaufgaben ist die Optimierung des Benutzererlebnisses von Tencent-Produkten. Das Hunyuan-Großmodell von Tencent wurde nun auf eine Parameterskala auf Billionenebene erweitert. Es ist das erste in China, das eine hybride Expertenmodellstruktur (MoE) einführt. Es ist besser in der Lage, komplexe Szenarien und Multitasking-Szenarien zu bewältigen Die Leistung ist auf dem branchenweit führenden Niveau. Tencent Hunyuan verfügt über hervorragende Leistungen in den Bereichen Mathematik, Codierung, logisches Denken, Mehrrundendialog und Textgenerierung und bietet gleichzeitig hervorragende Leistungen
- KI 714 2024-04-23 08:13:27
-
- Effiziente einstufige Kurzzeit-RGB-T-Einzelzielverfolgungsmethode basierend auf Transformer
- Einführung Wie in Abbildung 1 dargestellt, verwendet das bestehende dreistufige RGB-T-Einzelzielverfolgungsnetzwerk normalerweise zwei unabhängige Merkmalsextraktionszweige, die jeweils für die Extraktion der Merkmale der beiden Modalitäten verantwortlich sind. Allerdings führen voneinander unabhängige Merkmalsextraktionszweige zu einem Mangel an effektiver Informationsinteraktion zwischen den beiden Modalitäten in der Merkmalsextraktionsphase. Sobald das Netzwerk das Offline-Training abgeschlossen hat, kann es daher nur feste Merkmale aus jedem Modalbild extrahieren und kann sich nicht dynamisch an den tatsächlichen Modalzustand anpassen, um gezieltere dynamische Merkmale zu extrahieren. Diese Einschränkung schränkt die Fähigkeit des Netzwerks ein, sich an verschiedene bimodale Zielerscheinungen und die dynamische Entsprechung zwischen modalen Erscheinungen anzupassen. Wie in Abbildung 2 dargestellt, eignet sich diese Methode zur Merkmalsextraktion nicht für praktische Anwendungsszenarien der RGB-T-Einzelzielverfolgung, insbesondere in komplexen Umgebungen, da dies der Fall ist
- KI 954 2024-04-23 08:01:01
-
- OpenAI oder DIY? Entdecken Sie die wahren Kosten für das Selbsthosten großer Sprachmodelle
- Ihr Servicestandard wurde durch die Integration umfangreicher Sprachmodelle als „KI-gesteuert“ positioniert. Die Homepage Ihrer Website präsentiert stolz die revolutionäre Wirkung Ihrer KI-gesteuerten Dienste durch interaktive Demos und Fallstudien. Dies ist auch die erste Spur, die Ihr Unternehmen im globalen GenAI-Bereich hinterlassen hat. Ihre kleine, aber treue Benutzerbasis genießt ein verbessertes Kundenerlebnis und Sie sehen Potenzial für zukünftiges Wachstum. Doch als der Monat in die dritte Woche geht, erhalten Sie eine E-Mail von OpenAI, die Sie überrascht: Noch vor einer Woche haben Sie mit Kunden gesprochen und die Produktmarkttauglichkeit (Product Market Fit, PMF) beurteilt, und jetzt strömen Tausende von Benutzern auf Ihre Website ( Heutzutage kann in den sozialen Medien alles viral gehen) und Ihre KI
- KI 1297 2024-04-22 18:01:02
-
- Jenseits von BEVFusion! DifFUSER: Das Diffusionsmodell tritt in die autonome Fahr-Multitask ein (BEV-Segmentierung + Erkennung Dual-SOTA)
- Oben geschrieben und persönliches Verständnis des Autors. Da die autonome Fahrtechnologie derzeit ausgereifter wird und die Nachfrage nach autonomen Fahrwahrnehmungsaufgaben zunimmt, hoffen Industrie und Wissenschaft sehr auf ein ideales Wahrnehmungsalgorithmusmodell, das gleichzeitig die dreidimensionale Zielerkennung durchführen kann basierend auf einer semantischen Segmentierungsaufgabe im BEV-Raum. Ein autonom fahrendes Fahrzeug ist in der Regel mit Rundumsichtkamerasensoren, Lidar-Sensoren und Millimeterwellen-Radarsensoren ausgestattet, um Daten in verschiedenen Modalitäten zu sammeln. Auf diese Weise können die komplementären Vorteile zwischen verschiedenen Modaldaten vollständig genutzt werden, sodass die komplementären Vorteile von Daten zwischen verschiedenen Modalitäten erzielt werden können. Beispielsweise können 3D-Punktwolkendaten Informationen für 3D-Zielerkennungsaufgaben liefern, während Farbbilddaten kann mehr Informationen für semantische Segmentierungsaufgaben liefern. Nadel
- KI 738 2024-04-22 17:49:07
-
- Entdecken Sie die Leistungsfähigkeit großer Sprachmodelle (LLMs): Wie Startups ihre Arbeitsweise durch optimierte Integration revolutionieren
- Große Sprachmodelle (LLMs) haben sich für Unternehmen jeder Größe zu einem Wendepunkt entwickelt, ihre Auswirkungen auf Startups waren jedoch besonders dramatisch. Um zu verstehen, warum, werfen wir einen Blick darauf, welche Vorteile Startups gegenüber etablierten Playern haben und warum KI für sie ein wichtiger Wegbereiter ist. Erstens verfügen Startups über eine größere Flexibilität als traditionelle Unternehmen. Sie verfügen in der Regel nicht über übermäßige Schichten und umständliche Entscheidungsprozesse und können sich schneller an Marktveränderungen und Kundenbedürfnisse anpassen. Diese Agilität ermöglicht es Startups, neue Produkte und Dienstleistungen schneller auf den Markt zu bringen und ihre Strategien flexibel anzupassen. Zweitens sind Start-ups in der Regel mit begrenzten Budgets und knappen Zeitvorgaben im Wettbewerb um größere Branchenteilnehmer konfrontiert.
- KI 1126 2024-04-22 17:49:01
-
- Vier empfohlene KI-gestützte Programmiertools
- Dieses KI-gestützte Programmiertool hat in dieser Phase der schnellen KI-Entwicklung eine große Anzahl nützlicher KI-gestützter Programmiertools zu Tage gefördert. KI-gestützte Programmiertools können die Entwicklungseffizienz verbessern, die Codequalität verbessern und Fehlerraten reduzieren. Sie sind wichtige Helfer im modernen Softwareentwicklungsprozess. Heute wird Dayao Ihnen 4 KI-gestützte Programmiertools vorstellen (und alle unterstützen die C#-Sprache). https://github.com/YSGStudyHards/DotNetGuide1.GitHubCopilotGitHubCopilot ist ein KI-Codierungsassistent, der Ihnen hilft, Code schneller und mit weniger Aufwand zu schreiben, sodass Sie sich mehr auf Problemlösung und Zusammenarbeit konzentrieren können. Git
- KI 1639 2024-04-22 17:34:12
-
- Transformer könnte nachdenklich sein, tut es aber einfach nicht
- Wird das Sprachmodell zukünftige Token planen? Dieses Papier gibt Ihnen die Antwort. „Lass YannLeCun es nicht sehen.“ YannLeCun sagte, es sei zu spät, er habe es bereits gesehen. Die Frage, die in dem Artikel „LeCun Must Read“ diskutiert wird, den ich heute vorstellen werde, lautet: Ist Transformer ein durchdachtes Sprachmodell? Wenn es an einem bestimmten Standort Rückschlüsse zieht, antizipiert es dann nachfolgende Standorte? Die Schlussfolgerung dieser Studie ist, dass Transformer dazu in der Lage ist, dies jedoch in der Praxis nicht tut. Wir alle wissen, dass Menschen denken, bevor sie sprechen. Zehn Jahre Sprachforschung zeigen, dass Menschen, wenn sie Sprache verwenden, die bevorstehende Spracheingabe, Wörter oder Sätze, mental vorhersagen. Im Gegensatz zu Menschen, aktuellen Sprachmodellen
- KI 534 2024-04-22 17:22:07
-
- CVPR 2024 |. Byte schlägt eine neue Generation von COCONut-Datensätzen vor, die dichter als die granulare COCO-Segmentierung sind
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail-Adresse: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com. Mit der Entwicklung künstlicher Intelligenz haben Sprachmodelle und generative Modelle große Erfolge erzielt, und im Prozess des Modellentwurfs nimmt auch die Anzahl der Parameter der Modelle zu. Für feinkörnige Verständnisaufgaben nimmt auch die Anzahl der Modellparameter zu. Allerdings ist der Umfang der vorhandenen Datensätze derzeit
- KI 1266 2024-04-22 16:20:12
-
- CVPR 2024 | KI kann den fliegenden Rock auch beim Tanzen stark wiederherstellen
- Die AIxiv-Kolumne ist eine Kolumne, in der diese Website akademische und technische Inhalte veröffentlicht. In den letzten Jahren sind in der AIxiv-Kolumne dieser Website mehr als 2.000 Berichte eingegangen, die Spitzenlabore großer Universitäten und Unternehmen auf der ganzen Welt abdecken und so den akademischen Austausch und die Verbreitung wirksam fördern. Wenn Sie hervorragende Arbeiten haben, die Sie teilen möchten, können Sie gerne einen Beitrag leisten oder uns für die Berichterstattung kontaktieren. E-Mail-Adresse: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com. Bei alltäglichen Aktivitäten führen die Bewegungen von Menschen häufig zu sekundären Bewegungen der Kleidung und damit zu unterschiedlichen Falten der Kleidung, was ein Verständnis der Geometrie und Bewegung des menschlichen Körpers und der Kleidung (menschliche Körperhaltung und Geschwindigkeitsdynamik) erfordert.
- KI 1003 2024-04-22 14:37:01
-
- Der Restaurierungsfilm „Volcano Engine 4K' wurde für das Beijing Film Festival ausgewählt und die entsprechende Technologie gewann die Meisterschaft beim CVPR2024
- Am 18. April wurde das 14. Internationale Filmfestival Peking offiziell eröffnet. Die Hongkonger Filme „Plan A“ und „The Pledge of Allegiance“, die gemeinsam vom China Film Archive, Douyin und Volcano Engine restauriert wurden, wurden in die Sektion „Tribute and Restoration“ aufgenommen und werden am 18. und 19. April gezeigt. 4K-Version der Filmplakate „Plan A“ und „The Pact“ „Plan A“ und „The Pact“ wurden 1983 bzw. 1978, also vor mehr als 40 Jahren, veröffentlicht. Im August 2023 starteten das China Film Archive, Douyin und Volcano Engine gemeinsam das „Classic Hong Kong Movie Restoration Project“ und kündigten die Restaurierung von 100 Hongkong-Filmen an. Die beiden diesmal gezeigten Filme stammen aus den oben genannten Projekten. Die Original-Drehnegative der Filme wurden im 4K-Format in Hongkong gescannt. Der gesamte Restaurierungsprozess umfasste physische und digitale Aufzeichnungen aus dem China Film Archive.
- KI 729 2024-04-22 14:10:35
-
- Wie prädiktive KI dazu beitragen wird, Netto-Null-Emissionen zu erreichen
- Prädiktive künstliche Intelligenz (KI), ein Cousin der produktiven künstlichen Intelligenz, nutzt Muster in historischen Daten, um zukünftige Ergebnisse vorherzusagen oder zukünftige Ereignisse zu klassifizieren. Experten sagen, dass die Technologie genutzt werden kann, um umsetzbare Erkenntnisse zu liefern und die Entscheidungsfindung und Strategieentwicklung zu unterstützen. Predictive AI nutzt groß angelegte Datenanalysen und Algorithmen für maschinelles Lernen, um verborgene Muster und Trends in historischen Daten zu entdecken und sie auf zukünftige Szenarien anzuwenden. Indem wir vergangene Muster verstehen, können wir besser verstehen, was in der Zukunft passieren könnte, und entsprechend Strategien entwickeln. Prädiktive KI findet in verschiedenen Bereichen Anwendung. Im letzten Jahr haben wir beispielsweise viele neue und aufregende Anwendungen prädiktiver KI in der Energiebranche gesehen, um das Eigentum an Energieressourcen besser zu erhalten und zu optimieren.
- KI 434 2024-04-22 12:10:01