Letzten Freitag hatten Ma Chi und Lai Wei einen Online-Austausch. Das Thema war: Sind Betriebs- und Wartungsstellen wirklich nicht mehr verfügbar? Als Gastgeber bin ich sowohl der Initiator als auch der Moderator :) Ich habe sehr davon profitiert, den beiden Veteranen zuzuhören, wie sie einige ihrer jeweiligen Meinungen äußerten. Nehmen Sie es unbedingt noch heute auf, um es nicht zu vergessen. Es kann als Rückblick auf die Live-Übertragung betrachtet werden.
Die Werkzeugplattform wird einen Teil der Arbeitskräfte ersetzen. Das ist eigentlich offensichtlich und bedarf keiner Einführung.
Aber wer wird die Tool-Plattform bauen? Das ist einen Blick wert. Überwachungssysteme, CI/CD-Plattformen, Chaos-Engineering-Plattformen, Middleware-Dienste usw. sind alle Plattformen und werden von Platform Engineer, auch PE genannt, erstellt. PE ist offensichtlich in viele Gruppen unterteilt, und jede PE-Gruppe ist für eine begrenzte Anzahl von Plattformen verantwortlich. Diese verstreuten PE-Teams können zu einem großen Team zusammengefasst werden, beispielsweise dem Infrastrukturteam, oder sie können in mehrere Teams aufgeteilt werden. Beispielsweise kann das PE-Team für die technische Leistung in einer Abteilung (z. B. der Abteilung für Leistungstechnik) untergebracht werden ), Datenbank und Big Data sind in einer Abteilung (z. B. der Datenabteilung) und die mit der Stabilitätssicherung verbundenen PE-Teams in einer Abteilung (z. B. der Betriebs- und Wartungsabteilung) untergebracht.
Die Aufteilung dieser Organisation kann in verschiedenen Unternehmen unterschiedlich sein. Die Beziehung ist nicht sehr groß. Der Schlüssel ist, wie das PE-Team seine Arbeit ausführen soll. Der Kern des PE-Teams muss Folgendes tun:
Intuitiv wird jeder das spüren: Europäische und amerikanische Unternehmen sind eher bereit, SaaS-Dienste zu kaufen, während inländische Unternehmen eher bereit sind, ihre eigenen Dienste auf Basis von Open Source aufzubauen. Liegt es daran, dass die inländische Firmenphilosophie nicht gut ist? Nicht wirklich. Das Kernproblem ist der Mangel an zuverlässigen ToB-Unternehmen und -Produkten in vielen inländischen Bereichen. Stellen Sie sich vor, ein ToB-Unternehmen könnte Partei A Folgendes bieten:
Ausgezeichnete, fortschrittliche Methodik Stabile, benutzerfreundliche ProdukteNatürlich sind wir bei unseren Vorhersagen für die Zukunft meist zu optimistisch oder zu pessimistisch. Wenn es um Zeitschätzungen geht, treffen wir in der Regel sowohl zu frühe als auch zu späte Vorhersagen. Das ist richtig, Bruder, es hängt davon ab, wie du urteilst.
Sollte die OnCall-Fehlerreaktion von der Forschung und Entwicklung übernommen werden? Oder Betrieb und Wartung? Diese Frage ist sehr interessant. Ma Chi glaubt, dass 80 % der Online-Fehler auf Änderungen zurückzuführen sind, die von der Forschung und Entwicklung vorgenommen werden, und dass die Forschung und Entwicklung offensichtlich besser auf OnCall-Fehler reagieren kann, was bedeutet, dass die Forschung und Entwicklung schneller auf 80 % der Probleme reagieren kann.
Geschäftsforschung und -entwicklung sind wie folgt: Datenbankänderungen, grundlegende Netzwerkänderungen und Zugriffsschichtänderungen sind für die Person, die die Änderung vornimmt, sinnvoller, auf den Fehleralarm ihres eigenen Dienstes zu reagieren.
Tatsächlich hängt dies von zwei Voraussetzungen ab:
Tatsächlich können wir Behandeln Sie die Änderung in zwei Situationen. Die anschließende Überwachung der Dienststabilität liegt in der Verantwortung der Person, die die Änderung vorgenommen hat, und sollte separat behandelt werden. Wer sollte also den täglichen OnCall übernehmen? Es sollten diejenigen sein, die direkt an der Fehlerlokalisierung und -unterbrechung beteiligt sein können. Der Grund liegt auf der Hand. Wenn die OnCall-Person einen Alarm erhält und andere kontaktieren muss, ist die Aktualität der Fehlerunterbrechung zu gering.
Also zunächst einmal sollten die Alarme in verschiedenen Kategorien verarbeitet werden. Verschiedene Personen OnCall verschiedene Alarme. Es ist unvernünftig, alle Alarme der Forschung und Entwicklung oder dem Betrieb und der Wartung zuzuordnen. Dieser absolute Ansatz ist unvernünftig.
Es besteht ein Konsens über das ultimative Ziel, das darin besteht, der Unternehmensforschung und -entwicklung die freie Veröffentlichung von Versionen zu ermöglichen, aber wir möchten auch kontrolliert werden, wir möchten sicher veröffentlichen und wir möchten die Geschäftskontinuität gewährleisten beim Loslassen. Dies stellt extrem hohe Anforderungen an das CI/CD-System.
Wenn es Ihnen egal ist: Wenn Sie die unterste Ebene des Systems ändern, müssen Sie lediglich ein Skript stapelweise auf mehreren Maschinen ausführen. Aber nachdem die oben genannten Anforderungen hinzugefügt wurden, wird es viel schwieriger und wird zu einem systematischen Projekt.
Auf der Seite der Unternehmensforschung und -entwicklung ist es notwendig, beobachtbare Punkte zu machen, und ein Überwachungssystem ist erforderlich, um Probleme rechtzeitig zu erkennen und den Freigabeprozess nach einem Alarm sogar automatisch zu blockieren. Es bedarf einiger Mittel zur Blue-Green-Freigabe und zur automatischen Code- und Sicherheitsscanfunktion. Es ist unangemessen, blindlings Forschung und Entwicklung zu fordern, um sicherzustellen, dass Änderungen rückgängig gemacht werden können Änderungen sind sicher. Der Grad der CI/CD-Fähigkeiten kann grundsätzlich Aufschluss über die technische Stärke des Unternehmens geben.
Wenn Ihr Unternehmen der Forschung und Entwicklung immer noch Frachtbriefe für Betrieb und Wartung zur Verfügung stellt und Betrieb und Wartung online abgewickelt werden, sollten Sie überlegen, ob dies sinnvoll ist. Natürlich ist der obige Ansatz eher ein Internet-Ansatz und möglicherweise nicht für alle Unternehmen geeignet. Diese Live-Übertragung liefert nur eine Idee, und Sie müssen selbst darüber nachdenken.
Natürlich, wie erreicht man diese ideale Situation? Wie sollten wir Schritt für Schritt vorgehen, bis dieser Idealzustand erreicht ist? Das Thema Zeit wurde in der Live-Übertragung nicht thematisiert. Wenn das Unternehmen für den Betrieb auf Kubernetes geeignet ist, ist es relativ einfach, ein solches System mit Kubernetes aufzubauen, und Sie können so schnell wie möglich Maßnahmen ergreifen. Wenn das Geschäft des Unternehmens in einer physischen Maschinen- oder virtuellen Maschinenumgebung ausgeführt werden muss, erstellen Sie zunächst eine einheitliche Plattform für die Änderungsfreigabe, schließen Sie dann die Lücken und verbessern Sie sie schrittweise.
Die beiden Gäste redeten nicht viel, aber alle waren in dieser Angelegenheit sehr vorsichtig. Erinnern Sie alle daran:
Das obige ist der detaillierte Inhalt vonUm dieses Thema zu beenden: Stimmt es, dass Betriebs- und Wartungsarbeiten nicht mehr durchgeführt werden können?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!