Dewu-Client-Live-Übertragungsraum APM-Stresstestpraxis
1. Hintergrund
Mit der rasanten Entwicklung der Live-Übertragungsbranche engagieren sich immer mehr Unternehmen in diesem Bereich. Die Stabilität und das Benutzererlebnis des Live-Übertragungsraums sind zu wichtigen Faktoren im Wettbewerb der Live-Übertragungsplattformen geworden. Da der Live-Übertragungsraum jedoch viele komplexe technische Zusammenhänge wie Videoübertragung, Netzwerkkommunikation, Datenverarbeitung usw. umfasst, ist der Leistungsstresstest des Live-Übertragungsraums besonders wichtig. In der Praxis von Stresstests in Live-Übertragungsräumen von Kunden ist die APM-Stresstesttechnologie eine häufig verwendete Leistungstestmethode. Durch Echtzeitüberwachung und -diagnose der Anwendungsleistung können Leistungsengpässe schnell lokalisiert und behoben werden, und die Stabilität der Live-Übertragung wird verbessert Übertragungsraum und Benutzererfahrung verbessert werden.
Die Bedeutung von APM-Stresstests
- Erkennung der Systemstabilität: APM-Stresstests können Testern dabei helfen, die Leistung und Stabilität des Live-Übertragungsraums unter Bedingungen hoher Parallelität zu bewerten, um sicherzustellen, dass das System normal funktionieren kann und nicht abstürzt oder abstürzt Fehlfunktion.
- Benutzererfahrung verbessern: Ein hoher APM-Wert bedeutet normalerweise, dass der Live-Übertragungsraum mehr Vorgänge reibungslos abwickeln kann, wodurch die Benutzererfahrung verbessert wird. Wenn der APM-Wert niedrig ist, kann es bei Benutzern zu Einfrierungen und Verzögerungen im Live-Übertragungsraum kommen, was sich negativ auf das Benutzererlebnis auswirkt.
- Systemengpässe entdecken: APM-Stresstests können Testern und Entwicklern dabei helfen, Systemengpässe und -probleme zu entdecken, sodass gezielte Optimierungen und Verbesserungen vorgenommen werden können. Wenn beispielsweise während des APM-Stresstests ein Problem mit der Lese- und Schreibleistung der Datenbank festgestellt wird, kann die Systemleistung durch ein Upgrade der Datenbank oder andere Optimierungsmaßnahmen verbessert werden.
- Systemleistung optimieren: Durch APM-Stresstests können Entwickler Probleme mit der Systemleistung identifizieren und gezielte Optimierungen durchführen. Beispielsweise kann Lastausgleichstechnologie zur Verteilung des Datenverkehrs, Caching-Technologie zur Reduzierung der Datenbanklast oder asynchrone Verarbeitung zur Verbesserung der Parallelitätsfähigkeit des Systems eingesetzt werden.
Es ist ersichtlich, dass APM-Stresstests sehr wichtig sind, um die Stabilität des Live-Übertragungsraums sicherzustellen, die Benutzererfahrung zu verbessern, Systemengpässe zu entdecken und die Systemleistung zu optimieren.
2. Gängige Stresstestmethoden in Live-Übertragungsräumen
- Belastungstest: Testen Sie die Leistung und Stabilität des Live-Übertragungsraums unter Bedingungen hoher Parallelität, indem Sie eine große Anzahl von Benutzern simulieren, die auf den Live-Übertragungsraum zugreifen. Sie können Tools wie JMeter oder LoadRunner verwenden, um Benutzeranforderungen zu simulieren und die Leistung des Live-Übertragungsraums unter verschiedenen Lasten zu bewerten.
- Bandbreitentest: Der Live-Übertragungsraum muss eine ausreichende Bandbreite sicherstellen, um die Echtzeitübertragung von hochauflösenden Videos zu unterstützen. Daher ist ein Bandbreitentest erforderlich, um sicherzustellen, dass der Live-Übertragungsraum über ausreichende Bandbreite verfügt. Sie können Tools zum Testen der Netzwerkgeschwindigkeit verwenden, um die tatsächliche Bandbreite und Stabilität Ihrer Bandbreite zu bewerten.
- Leistungstest: Testen Sie durch die Simulation des Benutzerzugriffs in verschiedenen Szenarien die Leistung des Live-Übertragungsraums in verschiedenen Szenarien, z. B. beim gleichzeitigen Ansehen von Live-Übertragungen, beim gleichzeitigen Senden von Sperrfeuern usw. Sie können Leistungstesttools wie WebLOAD verwenden, um gleichzeitige Anforderungen zu simulieren und die Leistung des Live-Übertragungsraums in verschiedenen Szenarien zu bewerten.
- Sicherheitstests: Der Live-Übertragungsraum muss die Sicherheit der Benutzerinformationen und der Privatsphäre gewährleisten. Daher sind Sicherheitstests erforderlich, um sicherzustellen, dass es im Live-Übertragungsraum keine Sicherheitslücken gibt. Mit Tools wie Burp Suite können Sie Penetrationstests durchführen, um die Sicherheit des Live-Übertragungsraums zu bewerten.
- Zuverlässigkeitstest: Testen Sie durch die Simulation verschiedener Fehler und anormaler Situationen die Leistung und Wiederherstellungsfähigkeit des Live-Übertragungsraums unter anormalen Umständen. Mit Tools wie Chaos Monkey können abnormale Situationen simuliert werden, um die Zuverlässigkeit und Wiederherstellungsfähigkeiten des Live-Übertragungsraums zu bewerten.
Zusammenfassend lässt sich sagen, dass durch Stresstestmethoden wie Lasttests, Bandbreitentests, Leistungstests, Sicherheitstests und Zuverlässigkeitstests die Leistung, Stabilität, Sicherheit und Zuverlässigkeit des Live-Übertragungsraums umfassend bewertet werden können, um dies sicherzustellen Der Live-Übertragungsraum kann die Bedürfnisse und Erwartungen der Benutzer erfüllen.
Die wichtigsten Stresstestmethoden, die im Dewu Live Broadcast Room verwendet werden, sind Belastungstests und Leistungstests.
3. Implementierungsmethode
Zuallererst ist unser Stresstestziel [IM-Leistungsstresstest basierend auf Live-Übertragungsräumen]. Der Client empfängt über einen längeren Zeitraum eine große Anzahl von IM-Nachrichten. Treten Leistungsprobleme wie Verzögerungen, Abstürze oder OOM auf? Führen Sie vor jeder Veröffentlichung eine Runde Stresstests durch, um Leistungsprobleme im Offline-Live-Übertragungsraum im Voraus aufzudecken und zu verhindern, dass Leistungsprobleme online übertragen werden.
In Bezug auf spezifische Stresstestmethoden hoffen wir, die folgenden Bedingungen zu erfüllen:
- Versuchen Sie, so viele IM-Nachrichtentypen wie möglich abzudecken.
- Der Drucktest ist hochgradig automatisiert, wodurch weitere Probleme bei der manuellen Bedienung vermieden werden
- Geringe Wartungskosten
- Stresstests verlassen sich nicht so weit wie möglich auf den Server und können es auch sein direkt auf der lokalen Seite implementiert Stresstest für Nachrichten
Basierend auf den oben genannten Anforderungen und der Erkundung der Stresstestmethode hat unser Live-Broadcast-Geschäftsteam diese durchlaufen die folgenden drei Phasen: #🎜 🎜#
4. Stresstestphase4.1 Die erste PhaseDie Methode, die in verwendet wird Die erste Phase des Stresstests im Live-Übertragungsraum. Es ist relativ einfach, ein Skript zu verwenden, um zu simulieren, dass Benutzer Kommentare, Likes usw. an den Raum senden, der einem Stresstest unterzogen werden muss. Sie müssen den entsprechenden Python-Code selbst schreiben und die entsprechende IM-Nachricht an einen Live-Übertragungsraum senden. Folgendes ist Teil des Python-Skripts:
class APIUtils: """ 仅适用于测试环境 """ @staticmethod def token(user_id: int): resp = requests.get('https://xxxx.com', params={'user_id': user_id}) return resp.json().get('token') @staticmethod def change_rc_im(user_id: int): try: im_info = requests.post( 'http://xxxx.com', headers={'userId': '1'}, data={'kolUserId': user_id} ) im_id = im_info.json().get('data', {}).get('list', [{}])[0].get('id', 0) requests.post( 'http://xxxx.com', headers={'userId': '1'}, data={'kolUserId': user_id, 'id': im_id} ) except: pass time.sleep(3) data = { "startTime": int(time.time()) + 1, "endTime": int(time.time()) + 600 * 6, "kolUserId": user_id, "imSwitch": 1, "id": 0 } requests.post('xxxx.com', headers={'userId': '1'}, data=data) @staticmethod def get_topic(user_id: int, room_id: int): """ 获取房间号 """ headers = { 'POIZON-USERID': str(user_id), 'POIZON-ISGUEST': 'false', 'platform': 'iPhone', 'v': '4.78.0' } try: resp = requests.get('xxxx.com', headers=headers, params={'roomId': room_id}) return resp.json().get('data').get('room').get('imInfo').get('chatRoomId') except Exception as e: raise e
#🎜🎜 #
Der Hauptprozess ist wie folgt: Der so implementierte Stresstest ist relativ einfach und kann auch einige wichtige IM-Nachrichten abdecken, weist aber auch einige offensichtliche Mängel auf:
# 🎜 🎜# Um einen Live-Übertragungsraum einem Stresstest zu unterziehen, müssen Sie die Raum-ID oder das IM-Thema kennen. Um diese Informationen zu erhalten, müssen Sie Pakete erfassen oder die Übertragungsaufzeichnung überprüfen, was ziemlich mühsam ist.
- Jedes Mal, wenn der Client-Code eine IM-Nachricht hinzufügt, muss das Python-Skript manuell verwaltet werden, um die entsprechende IM-Nummer hinzuzufügen. Es gibt bestimmte Anforderungen für die spätere Wartung Wer Wartung benötigt, kann Python schreiben, und in Zukunft müssen Betreuer die Initiative ergreifen, um die in jeder Versionsiteration hinzugefügten neuen IM-Nachrichten zu verstehen und die IM-Nachrichtentypen des Skripts aktiv zu aktualisieren. Dies erhöht zweifellos die Wartungskosten.
- 4.2 Die zweite Phase In dieser Phase konzentrieren wir uns auf die Lösung der aus der vorherigen Phase verbleibenden Probleme und konzentrieren uns darauf beim Abrufen der Raum-ID Das Problem besteht darin, dass das Backend lediglich die entsprechende Broadcast-Listenschnittstelle bereitstellen muss. Die Frage ist, wie der Stresstestprozess komfortabler gestaltet werden kann. Hier denken wir an Visualisierung. Ist es nicht sehr einfach, Stresstests mit nur einem Mausklick durchzuführen? Basierend auf der Front-End-Technologie haben wir Vue3 verwendet, um eine einfache IM-Nachrichten-Bedienungsseite zu erstellen. Auf dieser visuellen Oberfläche können Sie den Raum und die IM-Nummer auswählen, die Sie senden möchten Es kann für Nachrichtenpriorität, Raumnachrichten oder standortweite Nachrichten personalisiert werden, und übrigens wurde einige Arbeit für das IM-Mock-Debugging geleistet.
Dann teilt die Anpassungsschnittstelle dem Backend auf dieser Basis mit, dass ein Stress vorliegt Testen Sie den erforderlichen Raum und lassen Sie dann das Backend das Skript der ersten Stufe aufrufen, um den entsprechenden Raum einem Stresstest zu unterziehen.
Diese Methode macht das manuelle Abrufen der Raum-ID überflüssig. Bei der Erstellung dieser visuellen Mock-Plattform wurde die Funktion von Mock-IM hinzugefügt, die wenig mit Stresstests zu tun hat. Sie ist im Wesentlichen dieselbe wie die durch Skripte implementierte Stresstestmethode.
Diese Phase löst die oben genannten verbleibenden Probleme der Nachrichtentypabdeckung mit Funktionsiteration und gleichzeitig z weitere Befreiung Manueller Eingriff, basierend auf der Teslalab-Automatisierungsplattform, verwendet UI-Skripte, um unsere Stresstestfunktion regelmäßig auszuführen und so eine wirklich automatisierte Stresstestfunktion zu realisieren. Die spezifischen Vorgänge jedes Schritts werden unten erläutert Jeder zusätzliche IM-Nachrichtentyp verfügt über eine entsprechende Entitätsklasse. Diese Klassen erben alle von der Basisklasse BaseLiveChatMessage, daher haben wir BaseLiveChatMessage eine abstrakte Schnittstellenmethode hinzugefügt, um diesen Nachrichtentyp zu generieren.
那么我们在新加IM数据的时候,继承BaseLiveChatMessage,就需要强制覆盖这个方法,去生成自己的mock消息,非常好的解决了维护性的问题,因为不覆盖这个mock方法是无法通过编译的。
下面是警告消息和抽奖消息的Mock代码:
有了上面的基础,在测试工程里面加一个IMTest测试类,主要逻辑是扫描所有继承BaseLiveChatMessage类的子类,然后反射构造函数,调用mock接口即可获取到相应IM类的mock消息实体,伪代码如下:
//获取BaseLiveChatMessage子类 if (allSubClass == null) { allSubClass = ClassUtils.getAllSubClass(BaseApplication.getInstance(), BaseLiveChatMessage::class.java) val iterator = allSubClass?.iterator() while (iterator?.hasNext() == true) { val next = iterator.next() try { next.getDeclaredMethod("mock", Int::class.java) } catch (e: NoSuchMethodException) { } } } // .... allSubClass?.forEach { val o = constructorMap[it]?.newInstance() as BaseLiveChatMessage var message: BaseLiveChatMessage? = null message = o.mock(0) justPostIM(message) //发送IM }
之后的压测就是控制发送频率、压测时间即可实现本地的压测,无需依赖服务端实现。
到此为止,基本已经解决了文章最开始的几个问题,IM消息的覆盖率和可维护性也得到了保证。
4.3.2 自动化
在现有的基础上,为了使得压测更加自动化,我们接入了Teslab自动化测试平台,可以定时启动自动化UI脚本,提升压测效率,自动化脚本是基于UiAutomator,语法非常简易,维护成本很低。
- 客户端内部备齐所有的IM压测类型。在进行IM压测时,客户端应当支持各种类型的IM消息,例如文本消息、语音消息、Dewu-Client-Live-Übertragungsraum APM-Stresstestpraxis消息、礼物消息等等。同时,客户端还应当支持各种不同的IM操作,如点赞、评论、送礼等,以全面测试IM功能的稳定性和性能。
- 直播debug工具接通了kylin,kylin组件已经打通了amp平台。为了更好地收集和记录压测指标,我们需要将直播debug工具与kylin组件和amp平台进行打通,确保能够快速地收集和分析压测数据。在这个过程中,kylin组件将负责接收客户端发送的压测数据,并将这些数据传递给amp平台进行进一步处理和分析。
- apm平台收到了直播IM压测记录飞书通知到固定的群。为了及时发现和解决潜在的性能问题,我们需要将压测记录及时通知到相应的人员,例如开发人员、测试人员等。在这个过程中,我们可以利用飞书等即时通讯工具,将压测记录发送到固定的群,以便相关人员及时查看并进行分析。
综上,第三阶段的压测策略通过客户端发起的方式,实现了IM压测使用方式方便、支持多设备压测和压测指标有记录的目标。同时,我们还需要在实际实施过程中不断优化和改进,以进一步提高压测效率和结果的可靠性。
压测流程图:
五、压测效果
六、收益
压测只是一个手段,最重要的是发现问题,解决问题,通过三个阶段的压测也发现了不少问题。
Durch drei Stresstestphasen hat das Team einige iOS-Probleme erfolgreich entdeckt und gelöst. Das Wichtigste dabei ist, dass die CPU ungewöhnlich hoch war und die Schnittstelle hängen blieb, wenn der Stresstest länger als 20 Minuten dauerte. Nach einer Untersuchung wurde festgestellt, dass das Problem auf die Verteilung von Nachrichten nacheinander an die Geschäftsschicht zurückzuführen war, was zu einer übermäßigen CPU-Auslastung und zu häufigen Aktualisierungen der Benutzeroberfläche (bis zu Dutzenden Mal pro Sekunde) führte. Um dieses Problem anzugehen, hat das Team zwei Lösungen angenommen: Eine besteht darin, Nachrichtengruppen über Timer an die Geschäftsschicht zu verteilen, anstatt Nachrichten einzeln zu verteilen, und die andere darin, einen Threadwechsel innerhalb des Timers durchzuführen, um sicherzustellen, dass es nur einen Threadwechsel gibt innerhalb eines Zeitraums.
Darüber hinaus entdeckte das Team auch die OOM-Situation, die durch die kontinuierliche Erhöhung des Speichers während des Stresstests verursacht wurde. Der Grund dafür ist, dass einige IMs nur einmal in einem bestimmten Zeitraum ausgeführt werden In Situationen mit hoher Parallelität wird es sich weiterhin ansammeln und einen Speicherüberlauf verursachen. Um dieses Problem zu lösen, hat das Team eine Optimierungslösung für die Animationsausführung eingeführt, um einen Speicherüberlauf zu vermeiden.
Darüber hinaus entdeckte das Team durch die Kylin-Komponente mehrere Speicherleckprobleme und löste sie rechtzeitig, um die Stabilität und Zuverlässigkeit der Live-Übertragungsanwendung sicherzustellen. Kurz gesagt: Durch die drei Phasen des Stresstests konnte das Team mehrere Probleme erfolgreich entdecken und lösen, was nicht nur die Leistung und Stabilität der Anwendung verbesserte, sondern auch nützliche Erfahrungen und Inspiration für die Technologieakkumulation und -entwicklung des Teams lieferte.
7. Fazit
Leistungsstresstests sind zwar ein wichtiges Mittel, um den stabilen und effizienten Betrieb des Live-Übertragungsraums sicherzustellen, aber wir können dies nicht als das Ende der Codeentwicklung betrachten. Guter Code sollte vom gesamten Team wartbar sein. Die Lesbarkeit, Wartbarkeit und Skalierbarkeit des Codes sind gleichermaßen wichtig. Nur durch die kontinuierliche Fokussierung auf Codequalität und Teamzusammenarbeit während des Entwicklungs- und Wartungsprozesses kann der Live-Übertragungsraum den Benutzern weiterhin qualitativ hochwertige Dienste bieten.
Bei der Durchführung von Leistungsbelastungstests im Live-Übertragungsraum müssen Sie auch auf die Lesbarkeit und Wartbarkeit des Codes achten. Wir sollten einen strengen Codeüberprüfungsmechanismus zur Überwachung und Kontrolle der Codequalität einrichten, um die Zuverlässigkeit und Skalierbarkeit des Codes sicherzustellen. Gleichzeitig konzentrieren wir uns auf die Teamzusammenarbeit und etablieren einen Kommunikations- und Kooperationsmechanismus innerhalb des Teams, damit die Teammitglieder gemeinsam den Live-Übertragungsraum pflegen und ein besseres Benutzererlebnis bieten können.
Das obige ist der detaillierte Inhalt vonDewu-Client-Live-Übertragungsraum APM-Stresstestpraxis. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Leistungsvergleich Windows 10 vs. Windows 11: Welches ist besser? Aufgrund der kontinuierlichen Weiterentwicklung und Weiterentwicklung der Technologie werden Betriebssysteme ständig aktualisiert und aktualisiert. Als einer der weltweit größten Betriebssystementwickler hat Microsoft mit seinen Windows-Betriebssystemen schon immer große Aufmerksamkeit bei den Benutzern auf sich gezogen. Im Jahr 2021 veröffentlichte Microsoft das Betriebssystem Windows 11, was breite Diskussionen und Aufmerksamkeit auslöste. Was ist also der Leistungsunterschied zwischen Windows 10 und Windows 11?

PHP und Go sind zwei häufig verwendete Programmiersprachen und weisen unterschiedliche Eigenschaften und Vorteile auf. Unter ihnen sind Leistungsunterschiede ein Problem, das im Allgemeinen allen Sorgen bereitet. In diesem Artikel werden PHP- und Go-Sprachen aus Leistungssicht verglichen und ihre Leistungsunterschiede anhand spezifischer Codebeispiele demonstriert. Lassen Sie uns zunächst kurz die Grundfunktionen von PHP und der Go-Sprache vorstellen. PHP ist eine Skriptsprache, die ursprünglich für die Webentwicklung entwickelt wurde. Sie ist einfach zu erlernen und zu verwenden und wird im Bereich der Webentwicklung häufig verwendet. Die Go-Sprache ist eine von Google entwickelte kompilierte Sprache.

Das Windows-Betriebssystem war schon immer eines der am weitesten verbreiteten Betriebssysteme auf PCs, und Windows 10 war lange Zeit das Flaggschiff-Betriebssystem von Microsoft, bis Microsoft vor kurzem das neue Windows 11-System auf den Markt brachte. Mit der Einführung des Windows 11-Systems haben sich die Menschen für die Leistungsunterschiede zwischen Windows 10 und Windows 11-Systemen interessiert. Welches ist besser? Werfen wir zunächst einen Blick auf W

Ollama ist ein superpraktisches Tool, mit dem Sie Open-Source-Modelle wie Llama2, Mistral und Gemma problemlos lokal ausführen können. In diesem Artikel werde ich vorstellen, wie man Ollama zum Vektorisieren von Text verwendet. Wenn Sie Ollama nicht lokal installiert haben, können Sie diesen Artikel lesen. In diesem Artikel verwenden wir das Modell nomic-embed-text[2]. Es handelt sich um einen Text-Encoder, der OpenAI text-embedding-ada-002 und text-embedding-3-small bei kurzen und langen Kontextaufgaben übertrifft. Starten Sie den nomic-embed-text-Dienst, wenn Sie o erfolgreich installiert haben

Der Leistungsvergleich der PHP-Methoden zum Umdrehen von Array-Schlüsselwerten zeigt, dass die Funktion array_flip() in großen Arrays (mehr als 1 Million Elemente) eine bessere Leistung als die for-Schleife erbringt und weniger Zeit benötigt. Die for-Schleifenmethode zum manuellen Umdrehen von Schlüsselwerten dauert relativ lange.

Leistungsvergleich verschiedener Java-Frameworks: REST-API-Anforderungsverarbeitung: Vert.x ist am besten, mit einer Anforderungsrate von 2-mal SpringBoot und 3-mal Dropwizard. Datenbankabfrage: HibernateORM von SpringBoot ist besser als ORM von Vert.x und Dropwizard. Caching-Vorgänge: Der Hazelcast-Client von Vert.x ist den Caching-Mechanismen von SpringBoot und Dropwizard überlegen. Geeignetes Framework: Wählen Sie entsprechend den Anwendungsanforderungen. Vert.x eignet sich für leistungsstarke Webdienste, SpringBoot eignet sich für datenintensive Anwendungen und Dropwizard eignet sich für Microservice-Architekturen.

Die Auswirkungen von Funktionen auf die Leistung von C++-Programmen umfassen den Overhead für Funktionsaufrufe sowie den Overhead für die Zuweisung lokaler Variablen und Objekte: Overhead für Funktionsaufrufe: einschließlich Stapelrahmenzuweisung, Parameterübertragung und Steuerungsübertragung, was erhebliche Auswirkungen auf kleine Funktionen hat. Overhead bei der Zuordnung lokaler Variablen und Objekte: Die Erstellung und Zerstörung einer großen Anzahl lokaler Variablen oder Objekte kann zu einem Stapelüberlauf und Leistungseinbußen führen.

Seit der Einführung von ChatGLM-6B am 14. März 2023 haben die Modelle der GLM-Serie große Aufmerksamkeit und Anerkennung erhalten. Insbesondere nachdem ChatGLM3-6B als Open Source verfügbar war, sind die Entwickler voller Erwartungen an das von Zhipu AI eingeführte Modell der vierten Generation. Diese Erwartung wurde mit der Veröffentlichung von GLM-4-9B endlich vollständig erfüllt. Die Geburt von GLM-4-9B Um kleinen Modellen (10B und darunter) leistungsfähigere Fähigkeiten zu verleihen, hat das GLM-Technikteam nach fast einem halben Jahr dieses neue Open-Source-Modell der GLM-Serie der vierten Generation auf den Markt gebracht: GLM-4-9B Erkundung. Dieses Modell komprimiert die Modellgröße erheblich und stellt gleichzeitig Genauigkeit sicher. Es verfügt über eine schnellere Inferenzgeschwindigkeit und eine höhere Effizienz. Die Untersuchungen des GLM-Technikteams haben dies nicht getan
