


Die Nachfrage nach Rechenleistung ist im Zuge der Welle großer KI-Modelle explodiert. „Großes Modell + große Rechenleistung' von SenseTime ermöglicht die Entwicklung mehrerer Branchen.
Kürzlich fand die „Lingang New Area Intelligent Computing Conference“ mit dem Thema „KI führt die Ära an, Rechenleistung treibt die Zukunft“ statt. Bei dem Treffen wurde die New Area Intelligent Computing Industry Alliance offiziell als Anbieter von Rechenleistung gegründet. Gleichzeitig wurde SenseTime der Titel „New Area Intelligent Computing Industry Chain Master“ verliehen.
Als aktiver Teilnehmer am Lingang-Rechenleistungs-Ökosystem hat SenseTime derzeit eine der größten intelligenten Computerplattformen in Asien aufgebaut – SenseTime AIDC, die eine Gesamtrechenleistung von 5.000 Petaflops ausgeben und 20 Projekte mit Hunderten von Milliarden Parametern unterstützen kann. Sehr große Modelle werden gleichzeitig trainiert. SenseCore, ein auf AIDC basierendes und zukunftsorientiertes Großgerät, hat sich zum Ziel gesetzt, eine hocheffiziente, kostengünstige und groß angelegte KI-Infrastruktur und -Dienste der nächsten Generation zu schaffen und so ein neues Paradigma der Produktion künstlicher Intelligenz zu ermöglichen wird in der AGI-Ära zu einem Infrastrukturdienstleister.
Unter der Welle großer KI-Modelle ist der Bedarf an Rechenleistung explodiert
Zu den drei Hauptelementen der künstlichen Intelligenz gehören hauptsächlich Daten, Algorithmen und Rechenleistung. Laut kürzlich von OpenAI veröffentlichten Daten ist die Rechenleistung, die für Trainingsaufgaben im Bereich der künstlichen Intelligenz eingesetzt wird, seit 2012 exponentiell gestiegen, wobei sich die Wachstumsrate alle 3,5 Monate verdoppelt. Bisher ist der Bedarf der Menschen an Rechenleistung um mehr als das 300.000-fache gestiegen. Die Popularität von ChatGPT hat neue Marktanforderungen an Rechenleistung ausgelöst.
Derzeit wächst der Rechenleistungsmarkt meines Landes weiter. Nach Schätzungen der Akademie für Informations- und Kommunikationstechnologie wird der Gesamtumfang der Rechenleistung der Computerausrüstung meines Landes im Jahr 2021 202 EFlops erreichen, was einer Wachstumsrate von etwa 50 % entspricht. , was höher ist als die globale Wachstumsrate.
In diesem Zusammenhang nutzt Shanghai Lingang aktiv die Vorteile und die ökologische Traktion der lokalen Computerindustrie und hat den „Lingang New Area Action Plan to Accelerate the Construction of a Computing Industry Ecosystem“ (im Folgenden als „Plan“ bezeichnet) veröffentlicht.
Berichten zufolge hat die Rechenleistungsbranche in der Lingang New Area entsprechende Vorkehrungen für Upstream-Software und -Hardware, Midstream-Rechenzentren, Dispatching-Plattformen und Downstream-Anwendungen getroffen. Derzeit übersteigt die Gesamtrechenleistung von Lingang 3EFLOPS (FP32). Der Anteil der intelligenten Rechenleistung beträgt fast 80 %, und die gesamte Rechenleistung macht fast 20 % von Shanghai aus.
Der „Plan“ sieht vor, dass die Lingang New Area bis 2025 ein diversifiziertes Rechenleistungssystem bilden wird, das sich auf intelligente Rechenleistung konzentriert und grundlegende Rechenleistung und Supercomputing-Leistung koordiniert. Die Gesamtrechenleistung übersteigt 5EFLOPS (FP32), AI Der Anteil Die Rechenleistung hat 80 % erreicht, und der Gesamtumfang der Rechenleistungsbranche hat 10 Milliarden Yuan überschritten. Es wurde eine öffentliche Rechenleistungsdienstplattform aufgebaut, der Rechenleistungshandelsmechanismus wurde standardisiert und eine regionale Rechenleistungsplanung wurde realisiert. und es wurde ein Cluster für die Rechenleistungsindustrie mit nationalem Einfluss aufgebaut. Eine Reihe von Benchmark-Szenarien für Rechenleistungsanwendungen.
Xu Li, Vorsitzender und CEO von SenseTime, sagte, dass die Rechenleistung die Energiequelle der neuen Ära sei. In gewissem Maße bestimme die Rechenleistung die Wettbewerbsfähigkeit des Marktes. „Rechenleistung ist ein Ausdruck der Fähigkeiten des gesamten Modells, die gleich den Parametern des Algorithmus oder großen Modells multipliziert mit der Datenmenge ist, die es verarbeitet. Im Zeitalter großer Modelle gilt: Je größer die Parameter, desto größer die Menge.“ Daten vervielfachen sich und desto größer ist die erforderliche Rechenleistung.“
Gleichzeitig wurde die Lingang New Area Intelligent Computing Industry Alliance offiziell gegründet. Die Mitglieder der Industrieallianz werden durch 25 Unternehmen und 3 Universitäten und Forschungsinstitute vertreten durchgeführt, um neue Filme zu fördern. Der Einsatz der intelligenten Computerindustrie im Bezirk fördert die wirtschaftliche Entwicklung.
SenseTime wurde mit dem Titel „Chain Leader of the Intelligent Computing Industry Chain in the New Area“ ausgezeichnet. Das SenseTime Intelligent Computing Center in der Lingang New Area trägt die wichtige Aufgabe, groß angelegte Forschung und Entwicklung im Bereich der künstlichen Intelligenz sowie Industrialisierung durchzuführen im Jangtse-Delta und wird sich in Zukunft aktiv an der kollaborativen Integration und Clusterentwicklung der intelligenten Computerindustriekette beteiligen.
Großes Modell + Innovation bei der Integration großer Rechenleistung
Die Integration großer Modelle und großer Rechenleistung führt zu einem großen Wandel im Produktionsparadigma und treibt wissenschaftliche Forschung und industrielle Anwendungen in die Ära der allgemeinen künstlichen Intelligenz (AGI), die durch intelligentes Rechnen vorangetrieben wird. In den frühen Phasen der schnellen Technologieiteration muss die Branche dringend eine neue Generation von Infrastruktur aufbauen, um die Anwendungsschwellen zu senken, F&E-Zyklen zu verkürzen und die Innovationseffizienz zu verbessern.
SenseTime Technology legte seine Pläne im Voraus dar und verbrachte fünf Jahre mit dem Aufbau von SenseCore, einem großen Gerät von SenseTime. Auf dieser Grundlage baute es das große Modellsystem „SenseTime New SenseNova“ auf, um der Industrie große Modellalgorithmusdienste, Schulungen und andere bereitzustellen Inferenz. AGI-Infrastruktur, die Software und Hardware wie Optimierung und Datendienste kombiniert.
Berichten zufolge nutzt SenseCore, ein großes Gerät von SenseTime, das SenseTime Artificial Intelligence Computing Center (bezeichnet als „SenseTime Intelligent Computing Center oder SenseTime AIDC“) als Rechenleistungsbasis. Es enthält 27.000 GPUs und kann eine Gesamtrechenleistung ausgeben Leistung von 5.000 Petaflops Mit branchenführender Rechenleistung, extrem großem Modelltraining und umfangreichen Argumentationsfunktionen ist es derzeit eine der größten intelligenten Computerplattformen in Asien.
Die aktuelle Rechenleistung von SenseCore, einem großen Gerät von SenseTime, kann das gleichzeitige Training von 20 extrem großen Modellen mit Hunderten von Milliarden Parametern unterstützen und bietet ein umfassendes Servicesystem für die Infrastruktur großer Modelle, das Daten, Trainingstools und Inferenzen abdeckt Bereitstellung und Leistungsoptimierung.
Das große Gerät von SenseTime verfügt über hervorragende parallele Rechenfunktionen und kann ein Einzelaufgaben-Training mit einem Cluster im Maximalmaßstab von 3200 Karten durchführen und ein ununterbrochenes, stabiles Training für mehr als sieben Tage erreichen. Es unterstützt nicht nur die eigenen großen Modelltrainingsprojekte von SenseTime, sondern auch Schulungen Modelle, die von anderen Unternehmen angepasst wurden.
Darüber hinaus integrieren SenseTime-Großgeräte die Kernfunktionen von KI, Supercomputing und Big Data. Durch Hochleistungsrechnen, Hochleistungsspeicher und -caching sowie für KI optimierte Hochleistungsnetzwerke wird eine Trennung von Speicher und Rechenleistung erreicht , große Elastizität und fehlertolerante Planung und andere Funktionen, die große Modelle auf Tausenden von Karten und Speicher auf PB-Ebene unterstützen, um das Training großer Modelle mit Billionen von Parametern abzuschließen.
SenseCore AI-Plattformprodukte bieten außerdem modulare, vollständige Datenketten-, Trainings- und Argumentationsfunktionen. Es kann zig Milliarden Datenverwaltungs- und -abrufdienste sowie manuelle Anmerkungsdienste realisieren und die Effizienz der Entwicklung großer KI-Modelle beschleunigen. One-Click-Quantifizierung, One-Click-Deployment und One-Click-Anwendung bieten Tools für die schnelle Online-Verifizierung großer Modelle und beschleunigen Innovationen.
Darüber hinaus stellt Big Device Kunden und ökologischen Partnern auch MaaS-Großmodell-as-a-Service mit vollständiger Kette zur Verfügung und beschleunigt so die Innovation und Anwendungseffizienz großer Modelle.
Unter anderem kann der automatisierte Datenanmerkungsdienst die Effizienz der intelligenten Annotation um das Hundertfache steigern; der große Modellinferenzbereitstellungsdienst kann die Effizienz der großen Modellinferenz um 600 % steigern; der große Modellparalleltrainingsdienst unterstützt einzelne Cluster-3200-Karten 500 Milliarden dichtes Parametermodelltraining; große Modellsteigerung Der Volumentrainingsservice kann die inkrementellen Feinabstimmungskosten um 90 % reduzieren.
Das große SenseTime AI-Modell ermöglicht die branchenübergreifende Entwicklung
Durch große Geräte hat SenseTime eine rasante Entwicklung im Bereich großer Modelle erzielt.
Laut Xu Li hat das multimodale Großmodell „Scholar 2.5“, das im März dieses Jahres als Open Source veröffentlicht wurde, die Führung in mehr als 20 maßgeblichen Datensätzen in den drei gängigen visuellen Aufgaben Erkennung, Segmentierung und Klassifizierung übernommen Bietet Möglichkeiten für autonomes Fahren, Roboter usw. Gemeinsame Szenenaufgaben bieten effiziente und genaue Unterstützung für Wahrnehmungs- und Verständnisfähigkeiten.
Für die Grundlagenforschung der künstlichen Intelligenz (AI For Science) ist die globale mittelfristige Wettervorhersage neben meteorologischen und klimatischen Vorhersageaufgaben eine der wichtigsten Vorhersageaufgaben. Das im April dieses Jahres eingeführte große globale mittelfristige Wettervorhersage-KI-Modell „Fengwu“ erzielte erstmals eine effektive Vorhersage zentraler atmosphärischer Variablen mit hoher Auflösung für mehr als 10 Tage und übertraf das GraphCast-Modell in 80 % der Bewertungsindikatoren . Dank hochauflösender globaler atmosphärischer Datenmodellierung kann „Fengwu“ auch extreme Wetterereignisse wie Taifune simulieren und die Flugbahn von Taifunen genau vorhersagen.
UniAD, die branchenweit erste von SenseTime entwickelte End-to-End-Lösung für autonomes Fahren mit integrierter Wahrnehmung und Entscheidungsfindung, übertrifft die SOTA-Methode in einer Reihe wichtiger Datensätze und Indikatoren und verbessert die Genauigkeit der Spurlinienvorhersage um 30 % sowie die Bewegungsvorhersage Der Verschiebungsfehler wird um fast 40 % und der Planungsfehler um fast 30 % reduziert.
Darüber hinaus verfügt das im letzten Monat von SenseTime eingeführte große Fernerkundungsmodell SenseEarth 3.0 nicht nur über die umfassendsten Interpretationskategorien in der Branche, sondern hat auch technologische Durchbrüche bei vielen Indikatoren wie Interpretationseffizienz, Generalisierungsfähigkeit und Interpretationsgenauigkeit erzielt.
Xu Li sagte: „In der AGI-Ära kann die Fähigkeit eines Modells anhand der Rechenleistung gemessen werden. Wir verwenden SenseCore, ein großes Gerät von SenseTime, um die Infrastruktur der AGI-Ära aufzubauen. Wir aktualisieren ständig die Iterationsgeschwindigkeit des Modells.“ und Problemlösungsfähigkeiten. Erschließen Sie mehr Möglichkeiten mit AGI.“
Berichten zufolge hat SenseTime seit Mai dieses Jahres mehr als 40 Kernkunden bedient, darunter mehr als 10 große Modellkunden, und deckt Spitzenbereiche wie intelligentes Fahren, Biopharmazeutika, Chipdesign, Smart Business und universitäre wissenschaftliche Forschung ab und hat in mehr als 20 Landungsszenarien eine große Modellauslieferung erreicht.
Yang Fan, Mitbegründer von SenseTime und Präsident der Large Device Business Group, sagte, dass die Leistungsentwicklung großer Modelle, die wir heute beobachten, die Verbesserung des technischen Werts sei, die durch die kontinuierliche Vergrößerung des Umfangs der drei Elemente der künstlichen Intelligenz herbeigeführt werde , und es ist auch die Grundlage dafür. Die perfekte Kombination aus F&E-Fähigkeiten und systematischen Engineering-Fähigkeiten. Diese drei Elemente sind oft gemeinsam abgestimmt: Algorithmenoptimierung, Datensortierung und -auswahl sowie Rechenleistungsplattform. Es ist schwierig, sie in separate Links umzuwandeln und dies allein zu tun. Aus diesem Grund müssen wir eine intelligente Industriekette für Rechenleistung aufbauen, denn nur wenn mehr Unternehmen in der Kette den Austausch, die Zusammenarbeit, das Denken und eine tiefergehende Zusammenarbeit fördern, können wir in der neuen kritischen Welle wichtiger technologischer Fortschritte besser abschneiden und Unterstützung.
Das obige ist der detaillierte Inhalt vonDie Nachfrage nach Rechenleistung ist im Zuge der Welle großer KI-Modelle explodiert. „Großes Modell + große Rechenleistung' von SenseTime ermöglicht die Entwicklung mehrerer Branchen.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Kürzlich fand die „Lingang New Area Intelligent Computing Conference“ mit dem Thema „KI führt die Ära an, Rechenleistung treibt die Zukunft“ statt. Bei dem Treffen wurde die New Area Intelligent Computing Industry Alliance offiziell als Anbieter von Rechenleistung gegründet. Gleichzeitig wurde SenseTime der Titel „New Area Intelligent Computing Industry Chain Master“ verliehen. Als aktiver Teilnehmer am Lingang-Rechenleistungs-Ökosystem hat SenseTime derzeit eine der größten intelligenten Computerplattformen Asiens aufgebaut – SenseTime AIDC, die eine Gesamtrechenleistung von 5.000 Petaflops ausgeben und 20 ultragroße Modelle mit Hunderten von Milliarden Parametern unterstützen kann. Trainiere gleichzeitig. SenseCore, ein auf AIDC basierendes und zukunftsorientiertes Großgerät, hat sich zum Ziel gesetzt, eine hocheffiziente, kostengünstige und groß angelegte KI-Infrastruktur und -Dienste der nächsten Generation zu schaffen, um künstliche Intelligenz zu stärken.

IT House berichtete am 13. Oktober, dass „Joule“, eine Schwesterzeitschrift von „Cell“, diese Woche einen Artikel mit dem Titel „Der wachsende Energie-Fußabdruck künstlicher Intelligenz“ veröffentlicht hat. Durch Nachfragen erfuhren wir, dass dieses Papier von Alex DeVries, dem Gründer der wissenschaftlichen Forschungseinrichtung Digiconomist, veröffentlicht wurde. Er behauptete, dass die Denkleistung der künstlichen Intelligenz in Zukunft viel Strom verbrauchen könnte. Schätzungen zufolge könnte der Stromverbrauch der künstlichen Intelligenz bis 2027 dem Stromverbrauch der Niederlande für ein Jahr entsprechen Die Außenwelt hat immer geglaubt, dass das Training eines KI-Modells „das Wichtigste in der KI“ sei.

Ich glaube, dass Freunden, die dem Handykreis folgen, der Satz „Bekomme eine Punktzahl, wenn du sie nicht akzeptierst“ nicht unbekannt sein wird. Beispielsweise haben theoretische Leistungstestsoftware wie AnTuTu und GeekBench große Aufmerksamkeit bei Spielern auf sich gezogen, da sie die Leistung von Mobiltelefonen bis zu einem gewissen Grad widerspiegeln können. Ebenso gibt es entsprechende Benchmarking-Software für PC-Prozessoren und Grafikkarten, um deren Leistung zu messen. Da „alles bewertet werden kann“, nehmen auch die beliebtesten großen KI-Modelle an Benchmarking-Wettbewerben teil, insbesondere an den „Hundert Modellen“. Der „Krieg“ begann, fast jeden Tag gab es Durchbrüche. Die großen inländischen KI-Modelle fielen in Bezug auf die Leistungswerte fast nie zurück, waren jedoch nie in der Lage, GP zu übertreffen der Benutzererfahrung.

IT House berichtete am 3. November, dass auf der offiziellen Website des Instituts für Physik der Chinesischen Akademie der Wissenschaften kürzlich ein Artikel der SF10-Gruppe des Instituts für Physik der Chinesischen Akademie der Wissenschaften/Beijing National Research Center for Condensed Matter Physics veröffentlicht wurde und das Computer Network Information Center der Chinesischen Akademie der Wissenschaften haben zusammengearbeitet, um große KI-Modelle auf die Materialwissenschaft anzuwenden. Vor Ort werden Zehntausende von Daten zu chemischen Synthesewegen in das große Sprachmodell LLAMA2-7b eingespeist, wodurch ein MatChat-Modell entsteht , mit deren Hilfe die Synthesewege anorganischer Materialien vorhergesagt werden können. IT House stellte fest, dass das Modell logische Überlegungen basierend auf der abgefragten Struktur durchführen und den entsprechenden Vorbereitungsprozess und die entsprechende Formel ausgeben kann. Es wurde online bereitgestellt und steht allen Materialforschern offen und bringt neue Inspiration und neue Ideen in die Materialforschung und -innovation. Diese Arbeit konzentriert sich auf große Sprachmodelle im Bereich der segmentierten Wissenschaft

Mit der rasanten Entwicklung der Branche der künstlichen Intelligenz wird künstliche Intelligenz in alle Richtungen kommerzialisiert. KI-Technologie wurde in vielen Bereichen wie Finanzen, medizinische Versorgung, Fertigung, Bildung und Sicherheit implementiert. Die Anwendungsszenarien werden immer vielfältiger und die Bedeutung von Daten wird immer wichtiger. Als wichtiges Glied in der Industriekette der künstlichen Intelligenz spielen Qualität und Quantität der Daten eine Schlüsselrolle bei der Verbesserung der Genauigkeit und Zuverlässigkeit von KI-Modellen. Künstliche Intelligenz (KI) entwickelt sich heute mit großen Modellen als Kern schneller und tritt mit voller Geschwindigkeit in eine neue Ära ein. Als Vertreter hochwertiger, szenariobasierter Datendienste für künstliche Intelligenz verlässt sich Cloud Measurement Data auf seine führenden technischen Fähigkeiten, seine hervorragende Servicequalität und seine umfassende Branchenerfahrung, um professionelle, effiziente und sichere KI-Datendienste für die Branche der künstlichen Intelligenz bereitzustellen.

Das Transformer-Modell stammt aus dem vom Google-Team im Jahr 2017 veröffentlichten Artikel „Attentionisallyouneed“. In diesem Artikel wurde zunächst das Konzept vorgeschlagen, Aufmerksamkeit als Ersatz für die zyklische Struktur des Seq2Seq-Modells zu verwenden, was große Auswirkungen auf den NLP-Bereich hatte. Und mit der kontinuierlichen Weiterentwicklung der Forschung in den letzten Jahren sind Transformer-bezogene Technologien nach und nach von der Verarbeitung natürlicher Sprache auf andere Bereiche übergegangen. Bisher sind die Modelle der Transformer-Serie zu Mainstream-Modellen in NLP, CV, ASR und anderen Bereichen geworden. Daher ist die Frage, wie Transformer-Modelle schneller trainiert und abgeleitet werden können, zu einer wichtigen Forschungsrichtung in der Branche geworden. Quantisierungstechniken mit geringer Präzision können

Was ist Google Gemini? Gemini ist das neueste und leistungsstärkste KI-Modell von Google, das nicht nur Text, sondern auch Bilder, Videos und Audio verstehen kann. Als multimodales Modell wird beschrieben, dass Gemini in der Lage ist, komplexe Aufgaben in Mathematik, Physik und anderen Bereichen zu erledigen sowie hochwertigen Code in verschiedenen Programmiersprachen zu verstehen und zu generieren. Derzeit kann es in Google Bard und integriert werden Google Pixel 8 und wird schrittweise in andere Google-Dienste integriert Denis Hassabis, CEO und Mitbegründer von Google DeepMind, sagte: „Gemini ist das Ergebnis einer umfassenden Zusammenarbeit des gesamten Teams bei Google, einschließlich unserer Kollegen bei Google Research.“ . Es

Zhao Zhiguo, Chefingenieur des Ministeriums für Industrie und Informationstechnologie, erklärte kürzlich auf dem Zhongguancun-Forum 2023, dass mein Land durch die gemeinsamen Anstrengungen der Industrie eine vollständige Industriekette von Gehirn-Computer-Schnittstellen gebildet habe, die die Grundschicht und die technische Schicht abdeckt und Anwendungsschicht und entwickelt sich in den Bereichen medizinische Versorgung, Bildung, Industrie, Unterhaltung und anderen Bereichen. Das Ministerium für Industrie und Informationstechnologie wird die Gehirn-Computer-Schnittstelle als eine wichtige Richtung für die Förderung der künftigen industriellen Entwicklung betrachten, die Erforschung von Anwendungsszenarien für Gehirn-Computer-Schnittstellen verstärken und die dynamische Entwicklung der Gehirn-Computer-Schnittstellenindustrie beschleunigen. Kurz gesagt ist die Gehirn-Computer-Schnittstelle eine Technologie, die eine direkte Verbindung zwischen dem Gehirn und externen Geräten herstellt, um die Gehirnfunktionen zu verbessern, zu verbessern und zu erweitern. Welche Einsatzszenarien gibt es für diese Technologie? In diesem Zusammenhang interviewte „Financial Attitude“ von Economic Voice Pan Helin, Co-Direktor des Forschungszentrums für digitale Wirtschaft und Finanzinnovation der International Joint Business School der Zhejiang-Universität. △30. Mai
