Flashcat Lai Wei: 運用保守の仕事を安定させる方法
フォーラム「京源 - 運用と保守の幾何学」の最初の号と、少し前の Ma Chi の「」は、「運用」を行う時間です。 「保守要員は一括解雇された」という報道が業界内で広く議論を呼んでいますが、本当に運用保守職に未来はないのでしょうか?仕事を安定させるにはどうすればよいですか?今回は、クアイマオ星雲のライ・ウェイさんにインタビューしました。ライ・ウェイさんは、運用・保守の枠から抜け出して起業する起業家であり、起業できる以上、業界での経験も豊富なはずですが、この問題をどう捉えているのでしょうか?一緒に新しい音を聴きましょう!
今回は、地に足の着いたハイレベルな「運用保守百人フォーラム」の第3回目です、始めましょう!
自己紹介と現在の会社について説明してください。
みなさんこんにちは、クアイマオ星雲のライウェイです。 Kuaimao Nebula は、オープンソース監視ツール「Nightingale Monitor」の中核開発チームで構成される、クラウドネイティブのインテリジェント運用保守テクノロジー企業です。 Kuaimao Nebula によって作成されたクラウドネイティブの監視および分析プラットフォームである「Flashcat プラットフォーム」は、クラウドネイティブおよびハイブリッド クラウド アーキテクチャ下での困難な統合監視と遅い障害位置の問題を解決することを目的としています。 Kuaimao Nebula の設立の背後にあるストーリーについて詳しく知りたい場合は、ITPub で私との独占インタビューを読むことができます。「第一線のエンジニアからエンジニアに至るまでの 10 年間の努力CEO" 、皆さんの修正を歓迎します。
運用および保守のベテランの中には、会社が運用および保守の価値についてほとんど知らないと報告する人もいます。運用および保守の価値を会社に明確に説明するにはどうすればよいですか?
仕事の価値を経営陣にいかに分かりやすく説明し、理解とサポートを得るかは、ミドル・バックエンド技術者全員が直面する共通の課題です。そうしないと、数分で仕事を失うことになるため、運用保守作業の価値を明確に説明するのはさらに困難です。 私の友人関係から判断すると、運用保守の解雇や転職を促す投稿を時々見かけます:
たとえば、スウェーデンの馬作業員- 「運営とメンテナンスを一括して一時解雇する時が来た」
- 、感動的で啓発的な、冒頭で述べた: 真実を知っている人は知らない秘密を語る: クラウドネイティブとDevOpsが成熟した現在、私たちは立場として、チームとして、歴史的な使命を終え、舞台から引退すべきです。
もう 1 つの例は、私をこの業界に紹介してくれた Jing 上司です。SRETalk の創刊号で、彼は次のような善意のアドバイスを与えてくれました。時代の変化、役職の死は普通のことであり、タイムリーな調整と計画が思考の焦点です。
-
しかし、
運用保守の立場とその背後にいる運用保守担当者は、何度も何度も淘汰の危機に瀕し、頑なに守り続けてきました。何度でも生き返る、柳は暗く、花は明るい。彼らはしばしば自分自身を喜んで笑い、積極的に危機を受け入れ、あえて変化を求めます。過去 10 年間を振り返ると、クラウド コンピューティング、クラウド ネイティブ、DevOps、SRE のいずれであっても、IT におけるこれらの大きな変化はすべて、「大規模な運用と保守」の分野を継続的に最適化および改善する試みでした。運用保守業界は消滅したわけではなく、進化を続け、新たな意味合いを獲得してきました。
これは何を示していますか?これは、運用と保守が非常に重要であることを示していますが、運用と保守が難しいことも示しています。しかし、この値を明確に説明するにはどうすればよいでしょうか?ポジショニング、目標設定、産業連関比率の観点から分析してみましょう。
運用保守作業の最も重要な目標は何だと思いますか?これらの目標をどのように達成しましたか?運用と保守の価値をより適切に反映するにはどうすればよいでしょうか?最も重要な職務責任である従来の運用および保守の分野に焦点を当てます
:コードのリリースと配信 (配信)、ラストマイルで価値を提供するために適切な仕事をする;
- アーキテクチャのスケーラビリティを改善し、実装する;
- システムの安定性 (信頼性) を確保し、継続的に改善する;
- 最初の 3 つの目標を達成しながら、システムの運用コスト (finops) を継続的に最適化して削減します。
- あなたの仕事が上記のカテゴリを中心に展開していないことがわかった場合は、2 つの可能性があります。運用と保守に携わっていないか、またはあなたの仕事が範囲を超えています。
- コードのリリースと配信については、リリースの数によって単純に測定できます。
- システムのスケーラビリティについては、拡張の適時性によって測定できます。
- 安定性については、コア機能が利用できない期間を観察することで測定できます。
- システム運用コストについては、各コア トランザクションの完了に費やされるリソース コストと人件費を計算して追跡できます。
運用保守の価値をどう体現するかについて:
まずは運用保守担当者の意識やスタンスを変え、しっかりと立つことビジネスと連携し、ビジネス目標の共有に努めます。
一例を挙げますと、人事部も会社のバックエンドに属する部門であり、バックエンドとしては使えませんが、私がこれまで接してきた優秀な人事の中には、事業部門の一員として、事業部門の目標を自分自身の目標として捉えてください。立場が一貫していて、全員が自分の人間であれば、価値を言いやすくなります。
第二に、価値は常に「コスト投入」に関連しています。大規模な運用保守チームを設立し、社内で人件費が非常に高く設定されている場合、あなたは上司の目に簡単に「重要な焦点」となり、上司からより厳しい課題にさらされることになります。ビジネス面。諺にあるように、チュー人には才能がありません。罪は明らかです:) 客観的に言えば、運用保守チームのリソース投資は事業収入と一致する必要があります。高すぎても低すぎても不健全であり、ビジネスの利益にもつながりません。チームの発展。したがって、「運用・保守における価値創造」は、最終的には運用・保守効率の競争に帰着します。
最後に、価値については、定量的記述と定性的記述の両方が必要です。例えば、業界レベルとの定量的な比較、企業の事業部門満足度調査の定量的なデータなどです。企業の戦略プロジェクトを支える「存在感」などの定性的なデータも必要です。
ChatGPT のような AI 機能は、将来的に運用保守業界の問題を解決できると思いますか?
まず第一に、ChatGPT の主な利点は何でしょうか? ChatGPT は、豊富な知識、自然言語理解機能 (およびコンテキスト理解)、およびコンテンツ生成機能の点で世代を超えた革新性を持っています。
それでは、運用保守業界の中核的な問題は何なのかを分析してみましょう。
- ドメインの知識が不足しているのでしょうか?
- インタラクション効率は低いですか?
- コンテンツのアウトプットは難しいですか?
上記のいずれにも当てはまりません。運用保守業界が扱う問題は、本質的にはシステム エンジニアリングの問題です。IT システムの価値を迅速に提供するという問題を解決し、拡張性の問題を解決することです。 、安定性の問題を解決しますが、問題はシステムの運用と保守の費用対効果を継続的に向上させることです。
現在、クラウド コンピューティングとマイクロサービスは、運用保守業界にさらに大きな変化をもたらしています。 ChatGPT は、運用および保守業界における知識の蓄積の問題を効果的に改善することができ、間もなく一部のジュニア運用および保守アーキテクトの職に取って代わられる可能性があります。
ツールの選択に関しては、自分で開発するか、オープンソースを使用するか、商用製品を使用するかをどのように決定しますか?
この質問に対する絶対的な答えはありません。私の個人的な経験から、おそらく次のような状況が考えられます:
自己研究の利点 :
- 心理的な自律性とコントロールの感覚が強化されます;
- 短期および中期的には、チームの開発スペースにとってより有益になります;
- 自らの実情に応じて、的を絞った柔軟な設計ができる。
自己調査のデメリット:
- 時間コストが非常に高くつくため、長時間の遅れが生じ、マイナスの結果がもたらされます。事業の発展に確実な影響;
- 人件費が高い北京を例にとると、比較的上級の技術者を採用する必要があり、年収は50万程度。 - 研究関連の運用および保守ツールが成熟するまでは、2 人の投資が必要です エンジニアはまだ必要です;
- 研究開発担当者の認識によって制限されるため、自己研究は業界のベスト プラクティスから簡単に切り離すことができます。長期的には社内ツールが時代に遅れる原因となります。
オープンソースおよびオープンソースの二次開発:
利点は、効果を迅速に発揮して本番環境に導入できることです。
オープンソース ツールは、一般的に柔軟性を重視し、比較的機能に重点を置いており、製品化やユーザー エクスペリエンスが欠けていることが多いです。質問;- コードを書く人は誰でも経験を持っています。実際、他の人のコードを完全に読んで理解し、自分でコードを開発することも同様に難しいのです。したがって、オープンソース プロジェクトが本番環境に導入されるときは、十分な投資が必要です。習得するには人手と時間が必要です。
- オープンソース プロジェクトの二次開発のほとんどは、コミュニティ バックボーンからの切り離しにつながり、その結果、後続の最新バージョンにスムーズにアップグレードできなくなります。 、そしてオープンソースプロジェクトの本当の恩恵を享受できないこと。
:利点:
- 時間コストの利点は明らかです。商用製品の助けを借りて、ビジネスの開発ニーズを迅速かつ機敏にサポートできます。まず第一に、遅れてはいけません。
- 製品化された製品のコストは、原則として自社開発製品に比べて数倍低くなります。このコストギャップはビジネスモデルによって決まります。市販品が儲かる根本的な理由は、顧客数の増加に伴って商品の研究開発費(+販売費)が希薄化するからであり、そうでなければ企業の存在意義も可能性もありません。商用製品の競争力には、ノウハウ、究極の製品エクスペリエンス、優れた技術サポートとサービスが含まれます。これは通常、商用製品を使用する技術チームが企業のビジネス面でより良い評価を得ることを意味します。
- 欠点:
- 当事者 A の顧客の多くは、豊富な技術的歴史と多くの個別化されたソリューションを持っています。商用製品と完全に一致することは多くの場合困難であり、その結果、顧客は苦肉の策で独自の製品を開発することを選択する必要があります。自社製品。
業界では、クラウド コンピューティングや Kubernetes などのインフラストラクチャの台頭により、運用保守の職が徐々に排除されるという見方がありますが、この見方についてはどう思いますか? クラウド コンピューティングと K8s の登場は主に「運用保守」業界の改善を目的としており、運用保守の働き方に大きな影響を与えているのは事実です。業界。例:
以前のクリック操作は段階的に IaC に移行しました- 従来の監視はより包括的な可観測性システムにアップグレードされました
- リリースも大型バージョンの通常リリースから変更されましたより機敏な継続的インテグレーション
- 古い漢方薬スタイルのオープンソース ソフトウェア メンテナンス モデルは、対応するクラウド サービスの正しい選択と使用になりました
- マシンをコンピュータに設置する物理的な作業シェルフがシンプルになりました コンソールは数分で開きます
- コマンドを入力してネットワーク ルーティングを構成する専門的な作業が、クラウド サービスのさまざまなネットワーク製品の組み合わせとマッチングに変換されます
- 物理的なものからの変換マイクロシステムの使用率を向上させるためのマシンのコロケーション サービスとクラウドネイティブ アーキテクチャのコストは自然に低下しました #…
- 運用保守の業務内容は変わらず、業務の価値も薄れておらず、運用保守に必要なスキルツリーも高度化している。運用保守担当者が危機感を持ち続け、変化を求める積極的な精神を維持し、ビジネスにうまく貢献することに集中すれば、トレンドを常に把握し、あらゆる場所で明るい未来を見ることができるでしょう。
#オプションの監視ツールが多数ありますが、ユーザーはなぜ御社の Flashcat プラットフォームを選択するのでしょうか?
確かに、多くのオープンソースおよび商用監視プラットフォームがあります。私も以前に次のブログを書きました: 「過去 20 年間の 12 の主要なオープンソース監視ツール」比較》
を参考にしてください。Flashcat プラットフォームを選択した理由に戻り、監視システムの開発トレンドと Flashcat プラットフォームの特徴から始める必要があります。監視システムの開発傾向については、私の以前のブログ記事 「クラウド ネイティブ監視のトップ 10 の特徴と傾向」
を参照してください。 Flashcat プラットフォームは、次のトレンドを対象としたソリューションです。 Flashcat は、運用および保守エンジニア グループからすべての研究開発者まで、より広範囲で多様なユーザー グループを対象としています。オペレーション、CTO/CIO、Flashcat により、監視分析と情報収集が非常に簡単になります。- Flashcat はビジネス指標と密接にリンクしています: ビジネスが損害を受けた場合、Flashcat は常に最初の発見となることができます、IT システムとの綿密な連携により、技術チームが迅速に調査を開始できるよう支援します。
- クラウド ネイティブおよびハイブリッド クラウドの統合監視: どのような種類の IT アーキテクチャが採用されていても、必要な Flashcat プラットフォームは 1 セットだけです。
以上がFlashcat Lai Wei: 運用保守の仕事を安定させる方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

1. SpringBootActuator エンドポイントの概要 1.1 Actuator エンドポイントとは SpringBootActuator は、SpringBoot アプリケーションを監視および管理するために使用されるサブプロジェクトです。アプリケーションのステータス、動作ステータス、動作インジケーターを表示するために使用できる一連の組み込みエンドポイント (エンドポイント) を提供します。アクチュエータ エンドポイントは、HTTP、JMX、またはその他の形式で外部システムに公開できるため、運用および保守担当者がアプリケーションを監視、診断、管理することが容易になります。 1.2 エンドポイントの役割と機能 Actuator エンドポイントは主に次の機能を実装するために使用されます: データベース接続、キャッシュ、

昔、コンピュータサイエンスを専攻していた新卒の頃、求人サイトでたくさんの求人情報を見ていたのですが、研究開発エンジニア、運用保守エンジニア、テストエンジニア…というまぶしい技術職に戸惑いました。 、私の専門コースはまあまあで、技術的なビジョンを持っていなかったことは言うまでもなく、どの技術的な方向性を追求するかについて明確なアイデアがありませんでした。先輩に「運用保守をやれ。運用保守は毎日コードを書く必要はない。Liunx が遊べるようになればいい!開発よりずっと楽だよ!」と言われるまでは、私はその道を選びました。信じられない...私はこの業界に10年以上従事しており、多くの苦しみ、多くの責任を負い、サーバーを停止させ、部門の解雇を経験しました。今、誰かが開発より運用と保守の方が簡単だと言うなら、 、それならそうします

インターネットの急速な発展に伴い、エンタープライズレベルのアプリケーションの複雑さは日に日に増しています。この状況に対応して、マイクロサービス アーキテクチャが登場しました。そのモジュール性、独立した展開、および高い拡張性により、今日ではエンタープライズレベルのアプリケーション開発の最初の選択肢となっています。 Spring Cloud は優れたマイクロサービス アーキテクチャとして、実際のアプリケーションで大きな利点を示しています。この記事では、SpringCloud マイクロサービス アーキテクチャのデプロイと運用保守について紹介します。 1. SpringCloud マイクロサービス アーキテクチャ SpringCloud をデプロイする

連休前に、PG China コミュニティと協力して、D-SMART を使用して PG データベースを運用および保守する方法についてオンライン ライブ ブロードキャストを実施したところ、金融業界のクライアントの 1 人が私の紹介を聞いて電話をかけてきました。チャットするために。彼らはデータベース Xinchuang を選択し、いくつかの国内データベースを試しましたが、最終的に TDSQL を選択する予定です。そのとき少し驚いたのは、2020年から国内データベースを選定していたのですが、TDSQLを使った後の初期体験があまり良くなかったようです。その後のやり取りの結果、彼らは TDSQL の分散データベースを使い始めたばかりで、研究開発の要件が高すぎることがわかったので、全員が TDSQL の集中型 MYSQL インスタンスを選択したことを知りました。 。データベース クラウド全体

インタビューや提出を通じて、運用とメンテナンスの分野のベテランが招待され、高度な合意を形成し、業界がより良く前進することを促進することを目的として、深い洞察を提供し、意見をぶつけ合うことができます。今回は、Tuyou Games の運営保守ディレクター、Zou Yi 氏をお招きします。鄒氏は、よく冗談めかして自分のことを世界トップ 500 万企業の運営保守代表者と呼んでいますが、心の中では次のように感じていることがわかります。中小企業の運用保守構築の考え方は大企業の考え方とは異なります。違いがあります。今日はいくつか質問があり、鄒氏に中小企業向けの研究と運用を統合するまでの道のりについて語ってもらいます。規模の企業。堅実でハイレベルな「運用・保守フォーラム」の第6回が始まります!質問プレビュー Tuyou はゲーム会社ですが、ゲームの運営とメンテナンスの特徴は何だと思いますか?直面している運用上の最大の課題は何ですか?これらの課題をどのように解決しましたか?ゲームの運営・保守担当者

運用保守のために Golang を学ばない理由: 1. Golang は主に、高パフォーマンスおよび同時パフォーマンス要件を持つアプリケーションの開発に使用されます; 2. 運用保守エンジニアが一般的に使用するツールとスクリプト言語は、すでに満たしていますほとんどの管理およびメンテナンス要件; 3. golang の学習には、一定のプログラミングの基礎と経験が必要; 4. 運用およびメンテナンス エンジニアの主な目標は、アプリケーションの開発ではなく、システムの安定性と高可用性を確保することです。

可観測性という用語はエンジニアリング分野に由来し、近年ソフトウェア開発分野でますます普及しています。簡単に言えば、可観測性とは、外部出力に基づいてシステムの内部状態を理解する能力です。 IBM は可観測性を次のように定義しています。 一般に、可観測性とは、複雑なシステムの内部状態または状態が、その外部出力の知識に基づいて理解できる程度を指します。システムの観察可能性が高ければ高いほど、追加のテストやコーディングを必要とせずに、パフォーマンス問題の根本原因を特定するプロセスがより速く、より正確になります。クラウド コンピューティングでは、可観測性は、アプリケーション システムをより効果的に監視、トラブルシューティング、デバッグするために、分散アプリケーション システムとその運用をサポートするインフラストラクチャからのデータを集約、関連付け、分析するソフトウェア ツールと実践を指し、それによって顧客エクスペリエンスを実現します。最適化とサービスレベル契約

この記事は Uber エンジニア Gergely Orosz による記事です。元のアドレスは: https://blog.pragmaticengineer.com/operating-a-high-scale-distributed-system/ ここ数年、私は大規模な分散システム: Uber の支払いシステム。この期間中、私は分散アーキテクチャの概念について多くを学び、高負荷かつ高可用性のシステムを実行する際の課題を直接目の当たりにしました (システムは開発された時点では完成には程遠いものであり、それをオンラインで実行する際の課題は実際に存在します)。さらに大きな)。システムを構築すること自体は興味深い取り組みです。計画システムが 10x/100 を処理する方法
