


Zuoyebang Nie An : Comment transformer l'exploitation et la maintenance, écoutez les idées OPaS de Zuoyebang
Dans le premier numéro, le patron de Yangjingjing a exprimé de nombreuses opinions intéressantes. Certaines personnes ont laissé un message disant qu'il s'agissait d'un guide pour dissuader l'exploitation et la maintenance Haha, les opinions des invités à ce sujet. Le problème sera différent. Veuillez rester avec moi. Gardez l’esprit ouvert, écoutez les opinions de centaines d’écoles de pensée et faites vos propres projets de carrière et de vie. Comme le dit le proverbe, si vous écoutez les deux, vous serez éclairé, mais si vous croyez seulement, vous serez sombre. Si vous n'écoutez que ce qui convient à vos oreilles, il y a de fortes chances qu'il n'y ait pas d'approfondissement. réflexion et collision, ce qui est dommage.
C'est le deuxième numéro du "Forum Exploitation et Maintenance", terre-à-terre et de haut niveau, commençons !
Présentation de l'invité
Dans ce numéro, nous invitons Nie An, le responsable de l'exploitation et de la maintenance de Zuoyebang, un vétéran de l'industrie. Il a travaillé chez Alibaba, Xiaomi, Didi et Zuoyebang. 10 ans d’expérience en exploitation/R&D/gestion.
Brève description des points clés
- L'exploitation et la maintenance traditionnelles sont chargées d'assembler les produits industriels en services, de les livrer aux utilisateurs et de maintenir les opérations de service. Elles se caractérisent par une forte dépendance à l'égard des entreprises
- Crise sur le terrain et l'utilisation intensive des cloud publics à l'ère du cloud natif, l'architecture des microservices et DevOps ont été véritablement réalisées, le système d'outils continue de prospérer et les responsabilités traditionnelles d'exploitation et de maintenance sont constamment externalisées, transférées et remplacées, et une crise de domaine est apparue
- La structure organisationnelle et la méthode de collaboration sont progressivement passées de la collaboration de tous à la plateforme en libre-service. Le thème principal de la maintenance est passé de la collaboration horizontale aux produits de service et à la plateforme intermédiaire technologique
- Transformation de l'exploitation et de la maintenance techniquement. plate-forme de service, des capacités de service d'exploitation et de maintenance externes OPaS (OP as Service) sont fournies, qui sont divisées en deux couches : objet et scène ; la couche inférieure Lorsque les objets sont maintenus de manière isomorphe, une architecture d'exploitation et de maintenance durable est formée
- Opération commerciale et la maintenance. Le cœur de la transformation orientée services est la reconnaissance des rôles. Le personnel d'exploitation et de maintenance doit s'adapter du rôle opérationnel qui dépend de l'entreprise à celui de fournisseur de services d'exploitation et de maintenance indépendant dans une perspective d'hyperservice, d'exploitation et de maintenance ; a un grand potentiel
- L'exploitation et la maintenance des composants, le contrôle des composants eux-mêmes, vont plus loin que la pure gestion de l'exploitation et de la maintenance et suivent le modèle de l'oignon, c'est-à-dire basé sur la plate-forme de livraison, de construction et de gestion des ressources, puis approfondissez le domaine professionnel du composant lui-même
- Développement d'exploitation et de maintenance, décoller le travail d'itération répétitif de la plate-forme, se concentrer sur le centre public d'exploitation et de maintenance, faire une technologie professionnelle et un effet de levier élevé
Étape d'exploitation et de maintenance
Exploitation et maintenance d'Internet, Il est passé par plusieurs étapes, notamment le travail manuel pur, la standardisation, la plateforme et l'intelligence numérique, comme le montre la figure ci-dessous. Parmi eux, DevOps est un changement organisationnel axé sur la technologie et un changement non professionnel.
De l'historique de développement de l'exploitation et de la maintenance, nous pouvons voir plusieurs caractéristiques :
- Héritage. La nouvelle étape hérite et perpétue souvent l'excellente expérience de l'ancienne étape et innove dans les concepts, les technologies et les organisations
- Par exemple, la plateforme hérite et renforce les résultats de l'étape de standardisation, et l'intelligence numérique hérite des résultats de platformisation. , tout en introduisant la technologie du big data
- Transfert de responsabilité. DevOps est un tournant dans le modèle de gestion de l'exploitation et de la maintenance. Opérations et maintenance après DevOps
- D'une part, continuer à progresser dans la direction de la spécialisation en exploitation et maintenance et maintenir la capacité de gérer l'isomorphisme pour l'exploitation et la maintenance de niveau supérieur. objets
- D'autre part, il met l'accent sur l'intégration de l'exploitation et de la maintenance, de la R&D, et les responsabilités d'exploitation et de maintenance sont progressivement transférées à la recherche et au développement des entreprises
Apprendre l'histoire du développement d'un certain domaine permet nous d'apprendre de l'histoire et de profiter de la tendance.
Exploitation et maintenance traditionnelles
Dans le modèle d'exploitation et de maintenance traditionnel, les objets de service peuvent essentiellement être divisés en trois couches. La couche la plus basse est l'infrastructure matérielle IaaS, qui est principalement composée d'informatique, de réseau et de stockage ; la couche intermédiaire est l'infrastructure logicielle, y compris les systèmes d'exploitation, la technologie de virtualisation, les cadres de code, les middlewares, etc. ; couche, principalement les services d'application.
La responsabilité de l'exploitation et de la maintenance traditionnelles est de assembler des produits industriels en services, de les fournir aux utilisateurs et de maintenir les opérations de service grâce à une série de processus, de technologies et de méthodes généralement nécessaires pour atteindre la stabilité et la stabilité. coût, sécurité, efficacité et autres objectifs multidimensionnels (opérationnels). Dans une certaine mesure, l'exploitation et la maintenance traditionnelles doivent dépendre de l'entreprise pour générer de la valeur. De nombreuses entreprises se demanderont si elles comprennent l'activité comme l'une des principales évaluations des travailleurs de l'exploitation et de la maintenance (dépendance). Avec la popularisation du cloud computing et de la technologie cloud native, le modèle traditionnel d'exploitation et de maintenance a rencontré de nombreux défis. Par exemple,
- Une fois que les entreprises utilisent le cloud public, IaaS/PaaS et même SaaS sont essentiellement orientés services et peuvent être obtenus via l'API ; une grande partie des travaux de construction d'exploitation et de maintenance est réalisée avec l'aide de fournisseurs de cloud, tels que le matériel, les systèmes, réseaux, bases de données et big data, etc. L'usine d'origine n'a besoin de conserver qu'une petite quantité de capacités de sélection professionnelle et d'intégration (externalisation)
- Après la vulgarisation de la technologie cloud native, l'architecture des microservices et le DevOps ont été réalisés à grande échelle, et les opérations précédemment réalisées par du personnel professionnel d'exploitation et de maintenance seront progressivement confiées à la recherche et au développement des entreprises. Achèvement en libre-service, tel que la livraison, le changement, la surveillance, la capacité, etc., les responsabilités d'exploitation et de maintenance sont largement transférées à la recherche et au développement des entreprises. (transfert)
- L'effet d'agrégation professionnelle du cloud public et du système open source cloud natif offre une amélioration continue des perspectives d'outillage . Une fois que l'outillage améliore l'efficacité, moins de main d'œuvre est nécessaire pour le même poste ; l'outillage accumule des capacités professionnelles et le seuil technique pour les opérateurs devient de plus en plus bas ; une fois que les outils ont évolué vers l'automatisation et l'intelligence, les machines peuvent remplacer la main d'œuvre. Le remplacement de la main-d'œuvre par des plates-formes s'approfondit encore progressivement (remplacement)
Comme mentionné ci-dessus, une fois l'infrastructure externalisée vers le cloud public et le cloud natif, les responsabilités d'exploitation et de maintenance sont transférées à la recherche et au développement des entreprises, et la plate-forme remplace le professionnalisme de travail. Face à de telles tendances et faits, les praticiens de l’exploitation et de la maintenance doivent procéder à certaines transformations.
Structure organisationnelle
Tout d’abord, parlons de la structure organisationnelle. À long terme, la forme organisationnelle d'une entreprise à l'ère du cloud natif comprendra les éléments suivants :
Les principaux utilisateurs finaux sont les clients du groupe A de l'entreprise et les groupes à but lucratif potentiels. L'équipe commerciale est responsable des utilisateurs finaux et ses rôles incluent le produit, l'entreprise, le marketing, le marketing, etc. La recherche et le développement commerciaux sont directement au service de l'équipe commerciale, en fournissant principalement des applications/services SaaS. La recherche et le développement de plates-formes servent la recherche et le développement des entreprises, fournissent diverses fonctionnalités PaaS et encapsulent les fournisseurs de cloud. Il y aura également des organisations transversales, comme les coûts d'exploitation FinOps, l'efficacité des opérations EP, l'équipe administrative informatique, etc.
Dans la nouvelle structure organisationnelle, l’objectif ultime de chacun est d’accomplir ses propres tâches et de bien servir les utilisateurs finaux. L'équipe commerciale accorde plus d'attention à la valeur commerciale et le système R&D se concentre sur la qualité du service. Avec les progrès des technologies de l'information, les fonctions actuellement exercées par les organisations interfonctionnelles seront progressivement décomposées en équipes de R&D de plate-forme, et la principale méthode de collaboration organisationnelle passera de la collaboration de tous au libre-service de la plate-forme. Les opérations et la maintenance ont de nouveaux objectifs de travail, à savoir : Le thème principal de l'exploitation et de la maintenance est la plate-forme de gestion, le centre de ressources et de technologie, et non la collaboration horizontale. Les opérations et la maintenance doivent être un levier de haute technologie, responsabiliser les entreprises et aider les entreprises à améliorer leurs opérations. efficacité.
Transformation de l'exploitation et de la maintenance, l'objectif est de fournir des services de gestion de l'exploitation et de la maintenance aux équipes de niveau supérieur via une plateforme en libre-service l'essence est l'OPaS d'exploitation et de maintenance (OP as Service) ; . Selon les différences de contenu, les travaux d'exploitation et de maintenance peuvent être divisés en deux catégories : la gestion des objets et la gestion des scènes, comme le montre la figure ci-dessous.
La gestion des scénarios est un mode horizontal qui gère les étapes du cycle de vie de divers objets d'exploitation et de maintenance en fonction de scénarios d'exploitation et de maintenance. La classification des scénarios d'exploitation et de maintenance, y compris la livraison/changement, la surveillance/mesure, le multi-cloud, les coûts, etc., est très proche des habitudes de travail de la recherche et du développement des entreprises, couvre quelques scénarios à haute fréquence et est similaire dans différentes entreprises. Chaque type de scénario d'exploitation et de maintenance dispose d'une plateforme de gestion de scénario indépendante, telle qu'un centre d'ordres de travail, un centre de données, une plateforme FinOps, etc. La gestion des scénarios s'appuie sur la gestion des objets. La plateforme de gestion des scénarios gère les objets d'exploitation et de maintenance en unifiant les modèles, en agrégeant les données, en orchestrant les API de gestion et de contrôle, etc. L'objectif de la gestion de scène est de fournir des capacités de gestion d'entreprise en libre-service et de créer une plate-forme de développement interne IDP.
Les moyens courants de générer des objets d'exploitation et de maintenance incluent l'auto-recherche, la construction open source, l'approvisionnement externe (cloud public), etc. Chaque objet d'exploitation et de maintenance peut être subdivisé en différentes catégories, clusters, instances, etc., avec une ampleur et une complexité sans précédent. Ce n'est qu'en maintenant l'isomorphisme des caractéristiques de gestion des objets d'exploitation et de maintenance que nous pouvons construire et maintenir des services d'exploitation et de maintenance à grande échelle et à faible coût, réalisant ainsi une exploitation et une maintenance à grande échelle (effet de levier technique donc l'isomorphisme). des objets d'exploitation et de maintenance constitue la base de l'ensemble de l'architecture d'exploitation et de maintenance.
Maintenance isomorphe
La maintenance isomorphe vise les caractéristiques de gestion des objets d'exploitation et de maintenance, pas toutes les caractéristiques. La méthode de maintien de l'isomorphisme est la suivante : contrôler l'incrément, réparer l'inventaire et empêcher la fission. Comme le montre la figure ci-dessous, la plate-forme est utilisée pour fournir des incréments de demande et de contrôle, piloter la gouvernance grâce à des mesures pour réparer les stocks et empêcher une fission à grande échelle du système technique grâce à des cadres de services standardisés et des mesures qui suivent strictement les spécifications et les spécifications ; nécessitent également des mesures ou la saisie de questions sur la plateforme pour s'améliorer, les trois se complètent. Les spécifications sont divisées en spécifications de service (correspondant à la gouvernance des services), spécifications de gestion (correspondant au contrôle d'exploitation et de maintenance) et autres types.
La maintenance isomorphe repose sur une division organisationnelle du travail avec des responsabilités principales claires. Par exemple, l'exploitation et la maintenance se concentrent sur la gestion, en supprimant les outils commerciaux et en les renvoyant à la R&D commerciale, tels que la gouvernance du statu quo, la réponse aux alarmes et le CD. La R&D commerciale se concentre sur la mise en œuvre commerciale, en supprimant la logique non commerciale du service ; cadre et le confier à l'infrastructure. La mise en œuvre, telle que la découverte de services et le contrôle du trafic ; l'infrastructure se concentre sur les capacités de milieu de gamme telles que le cadre de service, en supprimant les fonctions de gestion et en les confiant à l'exploitation et à la maintenance, telles que la fourniture de la demande, changer de contrôle, etc. L'influence de la culture ne peut être ignorée. Les opérations et l'architecture généreront des concepts et cultiveront les habitudes des utilisateurs grâce à la communication et aux conseils, par exemple en ne fournissant pas d'engagements SLA pour les besoins personnalisés et en fournissant des capacités d'observation prêtes à l'emploi pour les applications standard.
Basé sur la maintenance isomorphe des objets d'exploitation et de maintenance, le support ascendant du système technologique orienté services d'exploitation et de maintenance a formé une architecture d'exploitation et de maintenance durable, comme indiqué ci-dessous. Au niveau technique actuel, les services d'exploitation et de maintenance basés sur des plates-formes en libre-service peuvent résoudre 70 % des besoins, et les 30 % restants nécessitent encore du travail manuel, comme la communication de la demande, le dépannage, l'acceptation des résultats, la conformité aux politiques, etc. Avec l’avancement de la technologie et des concepts, on estime que la proportion des services d’exploitation et de maintenance va encore augmenter.
Remarque : Le cadre de service présenté dans cet article comprend non seulement le cadre de code et la bibliothèque de codes d'il y a N ans, mais également la gouvernance, l'étape de transition et la dénomination populaires actuelles des microservices.
Pratique de transformation
Opération et maintenance en tant que service OPaS
L'exploitation et la maintenance d'entreprise, également appelées exploitation et maintenance d'applications par certains, sont les plus proches du cloud natif et les plus touchées. En plus des responsabilités traditionnelles entre équipes telles que la formulation des spécifications, la construction des processus et la gestion globale, les opérations commerciales et la maintenance doivent être transformées dans une direction orientée service :
- Premièrement, la perception du rôle doit changer. Passez d'un rôle opérationnel qui s'appuie sur l'entreprise pour générer de la valeur à un rôle de fournisseur de services d'exploitation et de maintenance avec une valeur indépendante. Le changement de rôle est la clé
- Sur le plan organisationnel, redistribuez les principales responsabilités. Business R&D est la principale partie responsable de l'application, et l'exploitation et la maintenance ne sont pas la principale partie responsable de l'application, ni une nounou de plug-in, mais le fournisseur de capacités de gestion pour l'application utilise l'exploitation et la maintenance. entretient et complète le travail d'opération par lui-même
- En termes de mécanisme, l'évaluation est un système reconstruit. La performance des postes d'exploitation et de maintenance des entreprises n'est plus fortement liée à l'équipe commerciale et à la recherche et au développement de l'entreprise, mais davantage axée sur l'exploitation et la maintenance axées sur les services, avec moins d'accent sur l'évaluation subjective et davantage sur l'évaluation technique. la transformation de l’exploitation et de la maintenance se déroule en quatre étapes. Clarifier l'objet--> Points communs abstraits--> Construire la plate-forme--> L'objet de la réalisation d'une exploitation et d'une maintenance à grande échelle
- Le point commun abstrait est la difficulté et le point clé. Il existe un grand nombre d'applications, des piles technologiques complexes et de nombreuses fonctionnalités personnalisées. Il est nécessaire de faire abstraction des caractéristiques communes de gestion des applications pour éviter de tomber dans des cas personnalisés. À proprement parler, les caractéristiques communes des applications sont les objets de gestion de l'exploitation et de la maintenance
- La plate-forme de construction fait référence à la plate-forme de gestion des applications, et l'exploitation et la maintenance à grande échelle sont un état final durable
- Troisièmement, les objets d'application restent isomorphes. En plus du renforcement des capacités orientées services, l'énergie principale du personnel d'exploitation et de maintenance doit être investie dans la maintenance des isomorphismes en tant que service OPaS (OP as Service) est l'objectif proposé du point de vue de l'exploitation et de la maintenance des entreprises au milieu. -terme de notre transformation. Il est souligné que l'orientation générale, mais le manque de chemins, était relativement abstraite plus tard, OPaS a été progressivement affiné en une architecture d'exploitation et de maintenance ICSP+IDP, et son champ d'application a été étendu au secteur ; toute l’équipe d’exploitation et de maintenance, afin qu’il y ait un chemin et un point de départ clairs.
- Livraison des exigences : centre de bons de travail, moteur d'orchestration, moteur d'exécution
- Contrôle des modifications : cinq règles fourre-tout, gestion et contrôle centralisés, approbation de l'orchestration , approbation de l'exécution, métriques de vérification et de modification du service
- Métriques d'observation : regroupez et affichez les données d'observation et de mesure d'un point de vue commercial, en prenant en charge l'exploration jusqu'à la granularité des applications
- Architecture multi-cloud : mesure, gouvernance, plans et exercices tout au long du processus. l'ensemble du système technique
- Contrôle des coûts : Toute l'informatique de l'entreprise La facturation, l'allocation, la gestion et le contrôle ainsi que l'optimisation des ressources sont formulées de manière indépendante pour la direction FinOps
- : l'établissement des spécifications d'exploitation et de maintenance du point de vue global de l'entreprise, et la supervision de mise en œuvre de processus pour éviter la construction répétée de cheminées de petites équipes
- etc.
- La première phase est basée sur la fourniture de ressources, transformant les objets d'exploitation et de maintenance d'origine en entités de ressources, fournissant des fonctions de service garanties en amont et établissant le résultat net de la valeur du travail
- La deuxième phase est investissement Faites de gros efforts pour construire une plateforme de gestion pour gérer le cycle de vie des entités de ressources et vous libérer. La plateforme doit être capable de mettre en libre-service la ToC et de réaliser le découplage
- La troisième étape approfondit les domaines professionnels des composants eux-mêmes, de l'architecture, du code, des performances, Améliorer le professionnalisme dans tous les aspects tels que l'exploitation et la maintenance. Une fois cette étape franchie, l'exploitation et la maintenance sont devenues des experts en services dans ce domaine, et non seulement des administrateurs. Le modèle oignon a d'abord été vérifié dans les bases de données, les mégadonnées, les middlewares et d'autres postes, puis utilisé dans le service cloud. a également été couronnée de succès. Par exemple, l'équipe CloudOps d'exploitation et de maintenance des services cloud de notre entreprise met en œuvre la transformation selon le modèle oignon. Les détails sont les suivants :
- Après cela, nous avons commencé à construire une plateforme de gestion multi-cloud pour gérer les machines, bande passante, stockage d'objets, cycle de vie des services cloud tels que CDN. Au cours de ce processus, la plate-forme de gestion CloudOps a été transformée avec succès en fournisseur de services cloud secondaire interne de l'entreprise ICSP (capacité de la plate-forme)
- Ensuite, nous continuerons à renforcer l'apprentissage, la reconnaissance, la sélection et l'évolution des produits de cloud public Promouvoir et ainsi de suite , efforcez-vous d'établir plus de professionnalisme dans ce domaine (composant lui-même)
- Plate-forme intermédiaire d'exploitation et de maintenance (développement de l'exploitation et de la maintenance)
- Il devrait y avoir un compromis entre la transformation et conservatisme. La transformation de l'exploitation et de la maintenance traditionnelles en prestataire de services ne se fera pas du jour au lendemain, et tous les employés ne migreront pas non plus. Il y aura toujours quelqu'un qui restera sur place (le niveau technique actuel est d'environ 73 %). Une fois les ressources concentrées, le personnel back-end recevra davantage de retours de valeur
- Gradient de différenciation des capacités de R&D. La capacité de passer de l'exploitation et de la maintenance au développement est inégale. Elle doit partir de l'itération des besoins de l'entreprise, contrôler strictement la conception et l'acceptation pour garantir la qualité, compléter consciemment la théorie de l'ingénierie et être équipée d'un excellent milieu de gamme d'exploitation et de maintenance. capacités pour garantir Une couche inférieure propre
- plate-forme n'est pas la seule option. La plateforme est le moyen le plus puissant de mettre en œuvre des capacités de service, mais ce n’est certainement pas le seul. L'organisation, la culture, les normes, les processus et les plateformes sont tous indispensables (mais le coût de transfert peut être légèrement plus élevé)
- Effacer les objets de gestion de l'exploitation et de la maintenance. En matière d'exploitation et de maintenance, en particulier d'exploitation et de maintenance des applications, l'objet de gestion n'est pas l'application elle-même, mais les caractéristiques communes de l'application, plus la valeur de l'exploitation et de la maintenance de l'application (effet de levier) est grande ; 🎜# Garantie organisationnelle On ne peut l'ignorer. La structure organisationnelle est la principale force productive. Le CTO doit faire la différence, avoir des objectifs clairs et avoir une division du travail claire, comme la clarification des principales responsabilités, la mise en place d'agences d'acceptation indépendantes, des cycles de mesure et de gouvernance, etc. garantie organisationnelle pour la transformation de l'exploitation et de la maintenance
- #🎜🎜 #Méfiez-vous de la réflexion pure projet. Les opérations et la maintenance doivent encore participer à certains projets pour faire exploser la valeur et acquérir un sentiment d'accomplissement à court terme, mais il est également facile pour les gens de perdre leur sang-froid et de ramener la valeur à zéro, cela nécessite des objectifs de conception conscients et une accumulation de services ; capacités pendant le processus du projet # 🎜🎜#La prévention est plus efficace que l'intervention d'urgence. Les problèmes de stabilité doivent être résolus dans le domaine architectural, et la prévention est plus efficace que l'intervention d'urgence. Donnez la priorité à l'extension du MTBF, puis au raccourcissement du MTTR
- Ce qui suit est un contenu supplémentaire, et non le cœur de cet article.
Perspective hyper-service (exploitation et maintenance de l'entreprise)
En plus de la servitisation, l'exploitation et la maintenance de l'entreprise peuvent également conduire à la construction d'une perspective hyper-service (désormais renommée scénario). Le puzzle technologique DevOps sous le cloud natif n'est pas complet. Seule la partie application + informatique est terminée, et il existe des lacunes dans les capacités dans d'autres directions, en particulier la perspective ascendante de l'entreprise, la perspective du département, la perspective de l'entreprise, etc. perspective hyper-service. Dans une perspective d'hyperservice, le personnel de R&D des entreprises n'a généralement pas la capacité ou la motivation pour prendre les devants ; les chefs de département ou les architectes peuvent s'occuper de leurs propres départements, mais sont limités par leurs responsabilités professionnelles et ont du mal à se développer. situation globale. D'un autre côté, la perspective de l'hyperservice est l'ancien champ de bataille de l'exploitation et de la maintenance des entreprises traditionnelles, avec une expérience, une compréhension et des avantages cognitifs sans précédent. L'exploitation et la maintenance des entreprises conduisent à la construction d'une perspective d'hyperservice, qui peut non seulement combler les lacunes dans le domaine du cloud natif, mais également faire jouer pleinement les avantages professionnels de l'exploitation et de la maintenance des entreprises et tirer parti des opportunités de transformation. Ce sera un choix gagnant-gagnant, comme indiqué ci-dessous.
Perspective de super service, incluant mais sans s'y limiter :
sous cloud natif En regardant le puzzle technologique DevOps, il existe des lacunes dans les capacités. Par exemple, la prise en charge des services de base tels que CDN, object. le stockage, MQ et EMR ne sont pas parfaits, et ils sont encore en période exploratoire en 2022 du point de vue de la gestion de l'exploitation et de la maintenance, tant qu'ils sont couverts par le cadre de service (Authentification, découverte, communication, perception, flux) ; contrôle) est rayonné, même s'il est géré par Cloud Native.
Modèle Onion (services cloud, middleware, exploitation et maintenance du big data)
Services cloud, middleware, big data et autres objets d'exploitation et de maintenance, la pile technologique est convergée et axée sur les professionnels. Lors de la mise en œuvre de la transformation du personnel d’exploitation et de maintenance, ils peuvent suivre le modèle de l’oignon.
Cette équipe cible divers services cloud, répartis entre plusieurs fournisseurs de cloud tels que Tencent, Alibaba et Baidu.
- Il y a deux ans, nous avons fourni des machines, du stockage et d'autres ressources en externe via diverses méthodes manuelles pour soutenir le développement rapide de l'entreprise (livraison de ressources)
La plate-forme intermédiaire d'exploitation et de maintenance est un sous-ensemble de la plate-forme d'exploitation et de maintenance d'origine. Elle n'a pas besoin de reconstruire les connaissances du domaine et a des exigences de qualité de code relativement élevées (les mêmes que celles de base). composants). C’est exactement ce que OpDev Les points forts des chaussures pour enfants. À mesure que les responsabilités sont centralisées et réduites, OpDev doit simultanément se réduire et obtenir un effet de levier plus important.
Quelques leçons
Permettez-moi de partager brièvement certaines des leçons de transformation de notre entreprise, notamment
Évolution de la fourniture à la demande Qu'il s'agisse d'un cloud public ou d'une plateforme K8S interne, il existe un grand nombre d'opérations de livraison à la demande. Ce type de plateforme de livraison ToM (ToManager) manque souvent des contraintes nécessaires et ne peut être ouvert qu'à des personnes expérimentées. Afin d'optimiser la division du travail et d'améliorer l'efficacité, la surface de gestion de l'exploitation et de la maintenance ToC (ToRD) peut être intégrée à la gestion de l'exploitation et de la maintenance grâce à la méthode « arrangement des ordres de travail + approbation » Le flux de travail/ordre de travail lui-même sera fortement intégré à la gestion de l'exploitation et de la maintenance. Les meilleures pratiques pourront être ouvertes en toute sécurité à la R&D. Il s’agit d’une direction importante pour la servitisation des capacités d’exploitation et de maintenance. Le chemin d'évolution de la livraison en libre-service est le suivant :
À l'heure actuelle, la communication relie les exigences aux aspects techniques. Les solutions sont relativement nombreuses. Celles qui sont difficiles à mettre en libre-service ou à automatiser nécessiteront davantage de tentatives à l'avenir.
La technologie cloud native réduit la difficulté de maintenir l'isomorphisme (favorisant le déplacement de la courbe de maintenance de l'isomorphisme vers la droite) et améliore les capacités orientées vers les services d'exploitation et de maintenance (favorisant le déplacement vers le bas de la courbe de gestion de l'exploitation et de la maintenance) permettant au personnel d'exploitation et de maintenance de gérer davantage d'objets d'exploitation et de maintenance à moindre coût, améliorant ainsi considérablement l'efficacité de la production.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds





Il était une fois, alors que j'étais fraîchement diplômé en informatique, que je parcourais de nombreuses offres d'emploi sur les sites de recrutement, j'étais déconcerté par les postes techniques fulgurants : ingénieur R&D, ingénieur d'exploitation et de maintenance, ingénieur de tests... Au collège. , mes parcours professionnels étaient médiocres, sans parler d'une vision technique, et je n'avais aucune idée claire sur la direction technique à suivre. Jusqu'à ce qu'un étudiant senior me dise : « Faites de l'exploitation et de la maintenance. Vous n'avez pas besoin d'écrire du code tous les jours pour faire de l'exploitation et de la maintenance. Il vous suffit de pouvoir jouer à Liunx ! C'est beaucoup plus facile que de faire du développement ! à croire... Je suis dans l'industrie depuis plus de dix ans, j'ai beaucoup souffert, j'ai enduré beaucoup de reproches, j'ai tué des serveurs et j'ai connu des licenciements dans des services. Si quelqu'un me dit maintenant que l'exploitation et la maintenance sont plus faciles que le développement. , alors je le ferai

1. Introduction au point de terminaison SpringBootActuator 1.1 Qu'est-ce que le point de terminaison Actuator SpringBootActuator est un sous-projet utilisé pour surveiller et gérer les applications SpringBoot. Il fournit une série de points de terminaison intégrés (Endpoints) qui peuvent être utilisés pour afficher l'état, l'état de fonctionnement et les indicateurs de fonctionnement de l'application. Les points de terminaison des actionneurs peuvent être exposés à des systèmes externes sous HTTP, JMX ou sous d'autres formes pour permettre au personnel d'exploitation et de maintenance de surveiller, diagnostiquer et gérer les applications. 1.2 Le rôle et la fonction du point de terminaison Le point de terminaison Actuator est principalement utilisé pour mettre en œuvre les fonctions suivantes : assurer le contrôle de santé de l'application, y compris la connexion à la base de données, la mise en cache,

Avec le développement rapide d’Internet, la complexité des applications d’entreprise augmente de jour en jour. En réponse à cette situation, l’architecture des microservices a vu le jour. Grâce à sa modularité, son déploiement indépendant et sa grande évolutivité, il est aujourd'hui devenu le premier choix pour le développement d'applications au niveau de l'entreprise. En tant qu'excellente architecture de microservices, Spring Cloud a montré de grands avantages dans les applications pratiques. Cet article présentera le déploiement, l'exploitation et la maintenance de l'architecture de microservices SpringCloud. 1. Déployer l'architecture de microservices SpringCloud SpringCloud

Avant les vacances, j'ai collaboré avec la communauté PG Chine pour organiser une diffusion en direct en ligne sur la façon d'utiliser D-SMART pour exploiter et maintenir la base de données PG. Il est arrivé qu'un de mes clients du secteur financier ait écouté ma présentation et m'ait appelé. pour discuter. Ils sélectionnent la base de données Xinchuang et ont essayé plusieurs bases de données nationales. Enfin, ils vont choisir TDSQL. J'ai été un peu surpris à l'époque. Ils sélectionnaient des bases de données nationales depuis 2020, mais il semblait que la première expérience après l'utilisation de TDSQL n'était pas très bonne. Plus tard, après la communication, j'ai appris qu'ils venaient de commencer à utiliser la base de données distribuée de TDSQL et ont trouvé que les exigences de recherche et développement étaient trop élevées, ils ont donc tous choisi l'instance MYSQL centralisée de TDSQL. Après l'avoir utilisée, ils ont trouvé qu'elle était très facile à utiliser. . L'ensemble du cloud de base de données

Le terme observabilité provient du domaine de l’ingénierie et est devenu de plus en plus populaire dans le domaine du développement de logiciels ces dernières années. En termes simples, l'observabilité est la capacité de comprendre l'état interne d'un système sur la base de sorties externes. IBM définit l'observabilité comme suit : Généralement, l'observabilité fait référence au degré auquel l'état ou la condition interne d'un système complexe peut être compris sur la base de la connaissance de sa sortie externe. Plus le système est observable, plus le processus de localisation de la cause première d'un problème de performances peut être rapide et précis, sans nécessiter de tests ou de codage supplémentaires. Dans le cloud computing, l'observabilité fait également référence aux outils et pratiques logiciels qui regroupent, corrèlent et analysent les données des systèmes d'applications distribués et de l'infrastructure qui prend en charge leur fonctionnement afin de surveiller, dépanner et déboguer plus efficacement les systèmes d'applications, offrant ainsi une expérience client. optimisation et accord de niveau de service

Par le biais d'entretiens et de présentations, les vétérans du domaine de l'exploitation et de la maintenance sont invités à fournir des informations approfondies et à se confronter, en vue de former un consensus avancé et de promouvoir l'industrie pour qu'elle progresse mieux. Dans ce numéro, nous invitons Zou Yi, le directeur de l'exploitation et de la maintenance de Tuyou Games, M. Zou se qualifie souvent en plaisantant de représentant de l'exploitation et de la maintenance des 5 millions de plus grandes entreprises mondiales. les idées de construction d'exploitation et de maintenance des petites et moyennes entreprises sont différentes de celles des grandes entreprises. Aujourd'hui, nous avons quelques questions et demandons à M. Zou de partager son parcours d'intégration de la recherche et des opérations pour les petites et moyennes entreprises. entreprises de taille. C'est le 6ème numéro du "Forum Exploitation et Maintenance", terre-à-terre et de haut niveau, qui commence dès maintenant ! Aperçu de la question Tuyou est une société de jeux. Selon vous, quelles sont les caractéristiques uniques de l'exploitation et de la maintenance des jeux ? Quels sont les plus grands défis opérationnels auxquels vous êtes confrontés ? Comment avez-vous résolu ces défis ? Personnes chargées de l'exploitation et de la maintenance des jeux

N'apprenez pas Golang pour l'exploitation et la maintenance.Les raisons sont les suivantes : 1. Golang est principalement utilisé pour développer des applications avec des exigences de performances élevées et simultanées ;2. Les outils et langages de script couramment utilisés par les ingénieurs d'exploitation et de maintenance peuvent déjà répondre. la plupart des exigences en matière de gestion et de maintenance ; 3. L'apprentissage du golang nécessite une certaine base de programmation et une certaine expérience ; 4. L'objectif principal de l'ingénieur d'exploitation et de maintenance est d'assurer la stabilité et la haute disponibilité du système, et non de développer des applications ;

Par le biais d'entretiens et de présentations, les vétérans du domaine de l'exploitation et de la maintenance sont invités à fournir des informations approfondies et à se confronter en vue de former un consensus avancé et de promouvoir l'industrie pour qu'elle progresse mieux. Dans ce numéro, nous invitons Chen Cunli, directeur général du département d'exploitation et de maintenance du système Du Xiaoman. Il a passé la majeure partie de ses 20 ans de carrière dans le domaine d'Internet. Pendant son séjour au département des opérations et de la maintenance de Baidu, les membres de son équipe l'appelaient « Commandant Chen » en raison de son excellent style de leadership. Aujourd'hui, nous invitons le « Commandant Chen » à parler de son point de vue. Il s'agit du cinquième numéro du « Forum Exploitation et Maintenance », terre-à-terre et de haut niveau, qui commence dès maintenant ! Aperçu de la question : Vous avez rejoint Baidu très tôt, puis êtes devenu indépendant avec Du Xiaoman. Nous comprenons qu'il y a de nombreux employés autour de vous qui vous suivent depuis longtemps et ont vécu de nombreux tests d'exploitation et de maintenance d'entreprise. Je pense que tout le monde est très. intéressé.
