10年以上運用保守の仕事をしてきましたが、まだまだ初心者だなと感じた瞬間は数知れず…。
昔、コンピュータサイエンスを専攻していた新卒の頃、求人サイトでたくさんの求人情報を閲覧していたのですが、研究開発エンジニア、運用保守エンジニア、テストエンジニアというまぶしい技術職に戸惑いました。 .
大学時代、私の専門課程はまあまあで、技術的なビジョンを持たず、どの技術的な方向性を追求すべきかについて明確なアイデアがありませんでした。
先輩が私にこう言うまでは、「運用保守をしなさい。運用保守をするのに毎日コードを書く必要はありません。Liunx をプレイできれば十分です。やるよりずっと簡単です。」
私は、「信じます...」を選択しました...
私はこの業界に 10 年以上携わっています。私は多くの苦しみ、多くの責任を負い、サーバーを停止させ、部門の人員削減も経験済みです 今、シンプルな開発より運用保守がやりたいと言われたら迷わずブロックします...
基本的な運用保守業務は非常に単純ですが、運用保守作業の最大の特徴は複雑であるということです
私の意見では、運用保守作業は最も複雑な技術的な仕事の 1 つであり、多くの技術的な詳細を処理する必要があります。さまざまなプラットフォームの統合と構成、およびさまざまな複雑な問題や障害の解決。したがって、運用および保守担当者は、変化する技術的ニーズおよびビジネス ニーズに対応するための幅広いスキルと知識を持っていることが求められます。
運用および保守では、多くの場合、複雑なプラットフォームの運用および保守作業に直面します。その理由は、企業が通常管理および監視する必要があるのは、単一のプラットフォームやシステムではなく、はるかに複雑であるためです。これらのシステムは、さまざまなベンダーから提供され、サーバー、ストレージ、ネットワーク、アプリケーションなど、さまざまなプロトコルやテクノロジを使用している可能性があります。
複雑な構成管理も運用保守作業の難しさのひとつです。構成管理には、システムのインストール、構成の更新、ソフトウェアのインストールと更新など、多数のタスクが含まれます。これらのタスクは、システム全体で調整して実行する必要があります。
大規模クラスターの管理も簡単ではありません。大企業は数千台のサーバーを管理する必要があり、これには強力なツールと自動化テクノロジーが必要です。運用スタッフは、構成、更新、監視、レポートを管理するための自動ツールを必要としています。
運用保守のセキュリティ問題も無視できません。運用および保守担当者は、企業の資産とデータを保護し、システムのセキュリティを確保する必要があります。これには、ファイアウォール、侵入検知システム、セキュリティ パッチ管理などが含まれる場合があります。
運用と保守には、豊富なトラブルシューティングの経験も必要です。運用保守業務において障害はよくある問題であり、システムに問題が発生した場合、運用保守担当者は迅速に障害箇所を特定し、サービスを復旧するための措置を講じる必要があります。
継続的な学習は、運用保守担当者にとって最も基本的な要件です。運用および保守のツールとテクノロジーの急速な進化は誇張されていますが、IT テクノロジーは常に発展しており、新しいテクノロジーやツールが常に登場しており、運用および保守担当者はテクノロジーの急速な進化に対応するために知識を常に学習し、更新する必要があります。
運用保守はリスクの高い職業です。サーバーを一度も停止したことがない運用保守の人生は完璧ではありませんか?
リスクの高い職種といえば、運用保守業務が挙げられますが、多くの大企業においても運用保守業務の手作業によるダウンタイム事故が多発しています。パシフィック石油会社サイバー攻撃 (2021 年): 2021 年 5 月、米国パシフィック石油会社はランサムウェア攻撃を受け、同社のネットワークとサーバーが誤動作してシャットダウンされました。報道によると、この事件は従業員が誤って悪意のあるリンクを開いたことが原因で発生したという。
GitLab の停止 (2017 年): 2017 年 1 月、コード ホスティング サービス プロバイダーの GitLab で重大なデータ損失インシデントが発生し、多くの顧客のデータが完全に削除されました。その後の GitLab の公式声明によると、これは従業員が実稼働データベース内のファイルを誤って削除したことが原因でした。
ウォルマートのサーバー障害 (2019 年): 2019 年 11 月、アメリカの小売大手ウォルマートのサーバーが 1 時間以内に複数回ダウンし、同社の Web サイト、アプリケーション、支払いシステムが正常に動作しなくなりました。このインシデントは、従業員が定期的にサーバーのメンテナンスを行っている際に犯したミスが原因で発生したと伝えられています。
Microsoft Azure クラウド サービスの停止 (2020 年): 2020 年 9 月に、Microsoft の Azure クラウド サービスが世界的な停止に見舞われ、多くの顧客のアプリケーションとサービスが適切に動作しなくなりました。その後、このインシデントはネットワーク構成エラーによるものであることが確認されました。
運営と保守は、自然災害など、さまざまな不可抗力に直面する可能性もあります。
フィリピン台風 (2013 年): 2013 年 11 月、フィリピンは最強の台風に遭遇しました。 1947年以来フィリピンを襲った台風。台風は6,000人以上の死者・行方不明者を出し、国のインフラに大損害を与えた。この災害により、多くの国際企業がフィリピンにあるデータセンターとサーバーの停止も引き起こされました。
米国ハリケーン (2012 年): 2012 年 10 月、米国東海岸は激しいハリケーンに遭遇し、大規模な停電、通信障害、洪水が発生しました。この災害により、Amazon、Google、Netflix などの一部の有名企業やサービスプロバイダーでもデータセンターとサーバーの停止が発生しました。
キャリア開発の方向性が不明確で、運用保守作業が現場で混乱に陥ることもよくあります...
ハードスキルの不足が最大の問題かもしれません運用と保守の担当者が直面します。テクノロジーが進化し続けるにつれて、運用とメンテナンスの作業では、変化する市場の需要に適応するために新しいスキルとツールを継続的に学習する必要があります。しかし、何年も運用と保守の仕事をしてきた人の中には、自分のスキルが市場の需要に遅れていることに気づき、混乱し圧倒されてしまうことがあります。
劣悪な環境は実際には運用保守によって引き起こされるものではありません。他の技術分野に比べて、運用保守分野のキャリア形成の道筋は比較的曖昧です。組織によっては、運用保守エンジニアは「物流部門」としてのみ認識されており、正当な評価や報酬が得られないなど、他の技術チームと同等の地位や待遇が得られていないことがあります。このことは、運転保守に対する否定的な感情を悪化させ、運転保守技術者のキャリア開発の見通しについてある程度不明確になる原因となっています。
空を見上げる暇もなく、ただうつむいて歩いています。運用保守業務の本質はシステムの安定性と信頼性を確保することであり、運用保守技術者は常に高い警戒心と集中力を維持する必要があります。これは、特にシステム障害や緊急事態に直面した場合に、非常にストレスの多い仕事につながる可能性があります。日々の忙しさにうんざりしており、将来のキャリア開発について考える時間がありません。
では、私たちは運用と保守のキャリアをより良く伸ばす方法についてよく考えているのでしょうか?
ブライアン フェザーストーン ハウによって書かれた本「ビジョン」では、キャリア開発の一般的な法則について説明されています。その中で言及されている原則が答えを与えてくれるかもしれません:
今後 45 年間のことを念頭に置く: 45 年など、より長い期間で計画を立てている場合は、現時点で 1 つの都市や 1 つのプールの損得を気にする必要はありません。そして、明確なキャリアプランがあれば、困難を乗り越えて粘り強く取り組むことが容易になります。
我々がやるべきことは、細分化された技術分野で究極を実現するために、運用保守技術の開発パスを明確にすることです
DevOpsへの変革、いつ起こるかわかりません、いわゆる「DevOpsは死んだ」という議論がテクノロジー界で流行し始めました。しかし、DevOps は決して開発に運用と保守を要求し、運用と保守に行き場をなくすというものではありません。
ただでさえ運用保守作業が大変なので、パニックを起こすのはやめてください。
実際の DevOps に必要なコンポーネントは、プログラマーが自分で処理したり、開発者に操作や操作を任せたりする必要がある散在するオープンソース ツールの束ではなく、内部 DevOps プラットフォームと内部プラットフォームを保守するための専用チームであるべきです。メンテナンスやライブも行っております。真の DevOps チームは、開発、運用、保守を緊密に統合し、責任を共有し、協力して IT パフォーマンスを向上させてビジネスを強化する必要があります。
運用保守から DevOps への変革では、運用保守担当者が継続的インテグレーション、継続的デリバリー、自動テスト、コンテナ化などの主要なツールとテクノロジーを習得する必要があります。同時に、DevOps チームはアジャイル開発、反復開発、継続的開発、デリバリーおよびその他の方法を導入する必要があります。完全な DevOps 文化を確立している企業では、運用と保守の DevOps 作業への移行は非常に優れた開発パスです。
AIOps への変革: 同様に、AIOps は常に、運用および保守の優れたキャリア開発パスでした。 AIOps は、IT 運用および保守担当者が、ログ分析やトラブルシューティングなど、日常的で退屈で価値の低い一部の操作を自動化するのに役立ち、より複雑な問題を解決するためにより多くの時間とエネルギーを解放できます。
同時に、運用および保守作業には、インフラストラクチャ管理、アプリケーション展開、監視、トラブルシューティングなど、多くの側面が含まれます。これらのタスクには、運用および保守担当者の専門的な知識と経験が必要です。
AIOps テクノロジーは IT 運用の効率と精度を向上させますが、人間の運用担当者の作業を完全に置き換えることはできません。代わりに、IT 運用チーム全体の効率と生産性を高めるために協力します。
SRE への変換: ソフトウェア開発スキルを継続的に学習し、自動化ツール、DevOps でのテスト、デプロイ、監視の実践をマスターします。クラウド コンピューティングとコンテナ テクノロジーを学ぶには、SRE はクラウド コンピューティング プラットフォームとコンテナ テクノロジーを理解し、AWS、Docker、Kubernetes などの基本的なクラウド サービスとコンテナ管理ツールを習得する必要があります。信頼性、自動化、実験文化などの中心概念など、組織内に SRE 文化を構築しながら、データ分析スキルを習得します。
以上が10年以上運用保守の仕事をしてきましたが、まだまだ初心者だなと感じた瞬間は数知れず…。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









人工知能 (AI) は多くの業界の状況を変え、企業の効率、意思決定、顧客エクスペリエンスの向上を可能にしました。 AI は進化し続け、より複雑になるため、企業はその開発と展開をサポートする適切なインフラストラクチャに投資することが重要です。このインフラストラクチャの重要な側面は、IT チームとデータ サイエンス チームのコラボレーションであり、どちらも AI イニシアチブの成功を確実にする上で重要な役割を果たします。人工知能の急速な発展により、コンピューティング能力、ストレージ、ネットワーク機能に対する需要が増大しています。この需要により、AI に必要な複雑でリソースを大量に消費するワークロードを処理するように設計されていない従来の IT インフラストラクチャに圧力がかかります。その結果、企業は現在、AI ワークロードをサポートできるシステムの構築を検討しています。

1. SpringBootActuator エンドポイントの概要 1.1 Actuator エンドポイントとは SpringBootActuator は、SpringBoot アプリケーションを監視および管理するために使用されるサブプロジェクトです。アプリケーションのステータス、動作ステータス、動作インジケーターを表示するために使用できる一連の組み込みエンドポイント (エンドポイント) を提供します。アクチュエータ エンドポイントは、HTTP、JMX、またはその他の形式で外部システムに公開できるため、運用および保守担当者がアプリケーションを監視、診断、管理することが容易になります。 1.2 エンドポイントの役割と機能 Actuator エンドポイントは主に次の機能を実装するために使用されます: データベース接続、キャッシュ、

昔、コンピュータサイエンスを専攻していた新卒の頃、求人サイトでたくさんの求人情報を見ていたのですが、研究開発エンジニア、運用保守エンジニア、テストエンジニア…というまぶしい技術職に戸惑いました。 、私の専門コースはまあまあで、技術的なビジョンを持っていなかったことは言うまでもなく、どの技術的な方向性を追求するかについて明確なアイデアがありませんでした。先輩に「運用保守をやれ。運用保守は毎日コードを書く必要はない。Liunx が遊べるようになればいい!開発よりずっと楽だよ!」と言われるまでは、私はその道を選びました。信じられない...私はこの業界に10年以上従事しており、多くの苦しみ、多くの責任を負い、サーバーを停止させ、部門の解雇を経験しました。今、誰かが開発より運用と保守の方が簡単だと言うなら、 、それならそうします

インターネットの急速な発展に伴い、エンタープライズレベルのアプリケーションの複雑さは日に日に増しています。この状況に対応して、マイクロサービス アーキテクチャが登場しました。そのモジュール性、独立した展開、および高い拡張性により、今日ではエンタープライズレベルのアプリケーション開発の最初の選択肢となっています。 Spring Cloud は優れたマイクロサービス アーキテクチャとして、実際のアプリケーションで大きな利点を示しています。この記事では、SpringCloud マイクロサービス アーキテクチャのデプロイと運用保守について紹介します。 1. SpringCloud マイクロサービス アーキテクチャ SpringCloud をデプロイする

連休前に、PG China コミュニティと協力して、D-SMART を使用して PG データベースを運用および保守する方法についてオンライン ライブ ブロードキャストを実施したところ、金融業界のクライアントの 1 人が私の紹介を聞いて電話をかけてきました。チャットするために。彼らはデータベース Xinchuang を選択し、いくつかの国内データベースを試しましたが、最終的に TDSQL を選択する予定です。そのとき少し驚いたのは、2020年から国内データベースを選定していたのですが、TDSQLを使った後の初期体験があまり良くなかったようです。その後のやり取りの結果、彼らは TDSQL の分散データベースを使い始めたばかりで、研究開発の要件が高すぎることがわかったので、全員が TDSQL の集中型 MYSQL インスタンスを選択したことを知りました。 。データベース クラウド全体

可観測性という用語はエンジニアリング分野に由来し、近年ソフトウェア開発分野でますます普及しています。簡単に言えば、可観測性とは、外部出力に基づいてシステムの内部状態を理解する能力です。 IBM は可観測性を次のように定義しています。 一般に、可観測性とは、複雑なシステムの内部状態または状態が、その外部出力の知識に基づいて理解できる程度を指します。システムの観察可能性が高ければ高いほど、追加のテストやコーディングを必要とせずに、パフォーマンス問題の根本原因を特定するプロセスがより速く、より正確になります。クラウド コンピューティングでは、可観測性は、アプリケーション システムをより効果的に監視、トラブルシューティング、デバッグするために、分散アプリケーション システムとその運用をサポートするインフラストラクチャからのデータを集約、関連付け、分析するソフトウェア ツールと実践を指し、それによって顧客エクスペリエンスを実現します。最適化とサービスレベル契約

インタビューや提出を通じて、運用とメンテナンスの分野のベテランが招待され、高度な合意を形成し、業界がより良く前進することを促進することを目的として、深い洞察を提供し、意見をぶつけ合うことができます。今回は、Tuyou Games の運営保守ディレクター、Zou Yi 氏をお招きします。鄒氏は、よく冗談めかして自分のことを世界トップ 500 万企業の運営保守代表者と呼んでいますが、心の中では次のように感じていることがわかります。中小企業の運用保守構築の考え方は大企業の考え方とは異なります。違いがあります。今日はいくつか質問があり、鄒氏に中小企業向けの研究と運用を統合するまでの道のりについて語ってもらいます。規模の企業。堅実でハイレベルな「運用・保守フォーラム」の第6回が始まります!質問プレビュー Tuyou はゲーム会社ですが、ゲームの運営とメンテナンスの特徴は何だと思いますか?直面している運用上の最大の課題は何ですか?これらの課題をどのように解決しましたか?ゲームの運営・保守担当者

運用保守のために Golang を学ばない理由: 1. Golang は主に、高パフォーマンスおよび同時パフォーマンス要件を持つアプリケーションの開発に使用されます; 2. 運用保守エンジニアが一般的に使用するツールとスクリプト言語は、すでに満たしていますほとんどの管理およびメンテナンス要件; 3. golang の学習には、一定のプログラミングの基礎と経験が必要; 4. 運用およびメンテナンス エンジニアの主な目標は、アプリケーションの開発ではなく、システムの安定性と高可用性を確保することです。
