목차
PPT≠ 현실" >PPT≠ 현실
결함 훈련 = 동작을 진행 중이신가요? " >결함 훈련 = 동작을 진행 중이신가요?
오래오래 살아요, 얘기만 할까요? " >오래오래 살아요, 얘기만 할까요?
밥 없이는 밥하기 힘들다" >밥 없이는 밥하기 힘들다
마지막으로" >마지막으로
운영 및 유지보수 안전 원활한 작동과 유지관리, 쇠솥

원활한 작동과 유지관리, 쇠솥

Jun 08, 2023 pm 09:24 PM
운영 및 유지보수 물질적 자원 인력

원활한 작동과 유지관리, 쇠솥

6월 5일 Vipshop은 2023년 3월 29일 오류 보고서를 발표했습니다. Nansha IDC 냉동 시스템 오류로 인해 Vipshop 온라인 몰이 서비스를 중단하여 수억 달러의 손실이 발생했습니다(소규모 운영 및 유지 관리로) 사람, 나는 떨린다).

Vipshop의 경우 온라인몰이 핵심 사업 진입점입니다. 실패는 피할 수 없지만, 실패가 오래 지속되면 용납할 수 없는 일입니다. 우리 같은 소규모 운영자의 눈에는 이 정도 규모의 회사에서는 이런 사고가 일어나서는 안 됩니다. 우리 모두는 그들의 PPT를 모방하고 배우면서 운영하고 유지하는 방법을 찾고 있습니다.

그런데 PPT는 너무 발전해서 오작동이 일어나는 것을 막을 수 없는 걸까요?

저는 개인적으로 몇 가지 추측을 해봅니다.

  1. PPT≠ 현실
  2. 결함 훈련 = 동작을 진행하고 있습니까?
  3. 오래 오래 사세요, 말만 하세요?
  4. 밥 없으면 밥하기 힘들다

PPT≠ 현실

요즈음 국내 각종 기술 컨퍼런스에서는 일부 유명 기업의 CTO와 기술 리더를 초청해 강연을 하는 것으로 보아 모든 기업이 매우 대단합니다. 강함 (적어도 PPT에는 이렇게 나와 있습니다.) 들을 때마다 갑자기 깨닫고 큰 이익을 얻게 될 것입니다. 저는 진심으로 이 회사들을 존경하고 그들의 뛰어난 사고력과 뛰어난 능력과 정말 멋진 팀.

그러나 PPT는 결국 보조 도구일 뿐 현재 상태를 대체할 수는 없습니다.

아름다운 PPT는 보고 싶은 사람의 몫입니다. 아름답지 않은 것은 혼자 견뎌야 합니다.

전에 GOPS에서 Vipshop의 공유를 본 적이 있는데, 이것을 상사에게 보고할 때 상사도 우리 회사의 기술이 정말 뛰어나고 우리가 정말 잘하고 있다고 느낄 것입니다. 우리는 모든 좋은 환상을 상사에게 바쳤습니다.

뭔가 잘못되면 안하면 누구한테 하겠나?

입에서 나간 것은 무엇이든 입으로 돌아옵니다.

결함 훈련 = 동작을 진행 중이신가요?

책 『SRE: Google Operations and Maintenance의 복호화』에서 결함 훈련은 넓은 공간을 차지합니다. 결함 훈련을 통해 시스템의 신뢰성과 내결함성을 향상시킬 수 있고, 팀은 시스템의 아키텍처와 작동 원리를 더 잘 이해할 수 있으며, 각 모듈의 상호 영향을 더 잘 이해할 수 있으며, 시스템 아키텍처의 허점과 허점을 더 잘 이해할 수 있습니다. 더 빨리 결함을 발견할 수 있습니다.

결함 훈련은 팀이 실제 결함을 최소화하고 발생할 수 있는 문제에 보다 효율적으로 대응할 수 있기 때문에 전체 안정성 보장의 핵심 링크라고 할 수 있습니다.

그런데 이게 현실인가요?

실제로 결함 훈련을 실시할 때에는 결함 지점을 미리 정하고, 구체적인 대책을 정리하여 출력해야 하며, 종합적인 계획을 지정하고, 각 개인의 직무 책임과 업무를 정확하게 기술해야 합니다.

이러한 준비 작업만으로도 많은 인력과 물적 자원이 필요합니다. 많은 팀과 많은 사람들이 단계와 조치를 간소화할 것입니다. 행운의 사고방식을 갖고 미래에 희망을 두십시오.

예를 들어 퍼블릭 클라우드에 기대를 걸고 퍼블릭 클라우드에 문제가 없다면 전체 시스템은 안정적이겠지만, 퍼블릭 클라우드≠는 구글 클라우드, 알리바바 클라우드, 텐센트 클라우드, 등등 모두 큰 사고를 당했지만, 그 대가를 치르는 것은 바로 이용자 자신입니다.

따라서 운영 및 유지 관리 팀이나 SRE 팀은 결함 훈련을 진지하게 받아들여야 합니다. 훈련을 위한 준비 작업을 수행할 뿐만 아니라 훈련 중 계획에 세심한 주의를 기울여 적시에 조치를 취하고 조치를 취해야 합니다. 문제가 발견되면 수정합니다.

훈련이 형식이 되게 하지 마십시오. 훈련을 KPI로 만들지 마십시오. 그렇지 않으면 귀하가 다음 최적화 목표가 될 것입니다.

오래오래 살아요, 얘기만 할까요?

3월 29일 Vipshop의 문제는 측면에서 반영될 수 있습니다. 장수하세요. 아마도 그냥 말일 수도 있습니다.

비즈니스가 발전함에 따라 고가용성에 대한 요구 사항이 점점 더 높아지고 있기 때문에 시스템 아키텍처는 계속 발전할 것입니다.

예를 들어, 동일한 컴퓨터실의 단일 머신 아키텍처에서 활성-대기 아키텍처로 업그레이드한 다음, 같은 도시의 다중 머신룸 아키텍처로 업그레이드하고, 마지막으로 두 곳에서 3센터 아키텍처 수준에 도달합니다. .

Vipshop이 같은 도시에 여러 개의 컴퓨터실을 구축했다면 같은 도시에 있는 가장 간단한 메인 시스템과 백업 시스템도 12시간 동안 다운되지 않을 것입니다.

원활한 작동과 유지관리, 쇠솥

같은 도시에서 듀얼 라이브를 한다면 말할 것도 없습니다.

원활한 작동과 유지관리, 쇠솥

그러나 저는 하나님의 관점에서 추측일 뿐입니다. 어쩌면 그 사람들도 일을 많이 하는데, 그냥 일을 많이 하는 척하고 있을 뿐입니다.

밥 없이는 밥하기 힘들다

결국 재정, 인적, 물적 자원의 문제로 귀결되는데, 예를 들어 도시 전역의 재난을 대비하는 비용입니다. SRE 담당자가 상부에 자금 신청을 보고할 때, 윗 리더들이 지원을 안 하면(아직 돈이 안 들어오니까 돈을 많이 써야 한다), 회복은 더보처럼 간단하지 않다. 모든 것이 헛될 것입니다.

리더는 비용을 통제해야 하고, 부하 직원은 일을 하기 위해 돈이 필요합니다. 비용이 부족하면 생계를 꾸릴 수 없게 되어 PPT는 아름답지만 현실은 끔찍한 상황으로 이어질 것입니다.

야망이 있어도 소용없습니다.

뭔가 잘못되면 천국에 제물로 바치겠습니다.

마지막으로

위 내용은 순전히 허구입니다. 유사점이 있으면 좋아요 부탁드립니다~

많은 회사에서 운영 및 유지 관리에 대한 목소리가 너무 낮아서 말도 안되게 낮습니다. 운영과 유지관리 일을 하거나 물건을 홍보하는 일은 한걸음도 옮기기가 어렵습니다.

그러나 문제가 발생하면 운영과 유지보수가 가장 먼저 밀려나기 때문에 항상 운영과 유지보수를 '희생양'으로 비난받아 왔습니다.

그렇다면 우리는 운영 및 유지관리 담당자로서 무엇을 해야 할까요?

  1. 외출 - 운영 및 유지 관리 팀에만 국한되지 말고 나가서 운영 및 유지 관리의 가치를 비즈니스 부서에 알리십시오.
  2. 내부로 이동 - 운영 및 유지 관리 지식 시스템은 복잡하고 끊임없이 변화하며 지식의 내부로 들어가 그 뒤에 숨은 원리를 깊이 이해하고 전문 지식을 활용하여 팀에 봉사해야 합니다.
  3. Go up - 운영 및 유지보수의 영향력을 높이고, 전문적인 역량과 긍정적인 태도를 통해 더 많은 신뢰와 지지를 얻고, 현 상태를 변화시키고, 위상을 향상시킵니다.

마지막으로 얘기하자면, 제작을 놀리지 마세요.

위 내용은 원활한 작동과 유지관리, 쇠솥의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다. 10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다. Jun 09, 2023 pm 09:53 PM

옛날에 제가 컴퓨터 과학을 전공하는 신입생이었을 때, 채용 웹사이트에서 많은 채용 공고를 찾아보던 중 R&D 엔지니어, 운영 및 유지 관리 엔지니어, 테스트 엔지니어 등 눈부신 기술 직위에 대해 혼란스러웠습니다. , 제 전문 과정은 그저 그랬고 기술적 비전도 없었으며 어떤 기술적 방향을 추구해야 할지 명확한 아이디어도 없었습니다. 한 선배가 나에게 "운영 및 유지 관리를 하세요. 운영 및 유지 관리를 위해 매일 코드를 작성할 필요가 없습니다. Liunx를 사용할 수 있으면 됩니다! 개발을 하는 것보다 훨씬 쉽습니다!"라고 말하기 전까지는 말이죠. 믿다... 10년 넘게 업계에 있으면서 고생도 많이 했고, 비난도 많이 받았고, 서버도 죽였고, 부서 해고도 경험했다. 지금 누가 나에게 개발보다 운영과 유지가 쉽다고 말한다면. , 그럼 그럴게요

Spring Boot Actuator Endpoint 공개: 애플리케이션을 쉽게 모니터링 Spring Boot Actuator Endpoint 공개: 애플리케이션을 쉽게 모니터링 Jun 09, 2023 pm 10:56 PM

1. SpringBootActuator 엔드포인트 소개 1.1 Actuator 엔드포인트란 무엇입니까? SpringBootActuator는 SpringBoot 애플리케이션을 모니터링하고 관리하는 데 사용되는 하위 프로젝트입니다. 애플리케이션의 상태, 작동 상태 및 작동 표시기를 보는 데 사용할 수 있는 일련의 내장 엔드포인트(Endpoint)를 제공합니다. 작동기 엔드포인트는 운영 및 유지보수 담당자가 애플리케이션을 모니터링, 진단 및 관리할 수 있도록 HTTP, JMX 또는 기타 형식으로 외부 시스템에 노출될 수 있습니다. 1.2 엔드포인트의 역할 및 기능 Actuator 엔드포인트는 주로 다음 기능을 구현하는 데 사용됩니다. 데이터베이스 연결, 캐싱을 포함한 애플리케이션의 상태 확인 제공,

Spring Cloud 마이크로서비스 아키텍처 배포 및 운영 Spring Cloud 마이크로서비스 아키텍처 배포 및 운영 Jun 23, 2023 am 08:19 AM

인터넷의 급속한 발전으로 인해 기업 수준의 애플리케이션은 날로 복잡해지고 있습니다. 이러한 상황에 대응하여 마이크로서비스 아키텍처가 탄생했습니다. 모듈성, 독립적 배포 및 높은 확장성을 통해 오늘날 엔터프라이즈 수준 애플리케이션 개발을 위한 첫 번째 선택이 되었습니다. 뛰어난 마이크로서비스 아키텍처인 Spring Cloud는 실제 애플리케이션에서 큰 이점을 보여왔습니다. 이 기사에서는 SpringCloud 마이크로서비스 아키텍처의 배포, 운영 및 유지 관리에 대해 소개합니다. 1. SpringCloud 마이크로서비스 아키텍처 배포 SpringCloud

PG 데이터베이스 운영 및 유지 관리 도구에는 어떤 기능이 포함되어야 합니까? PG 데이터베이스 운영 및 유지 관리 도구에는 어떤 기능이 포함되어야 합니까? Jun 08, 2023 pm 06:56 PM

연휴 전에 저는 PG China 커뮤니티와 협력하여 D-SMART를 사용하여 PG 데이터베이스를 운영하고 유지하는 방법에 대한 온라인 라이브 방송을 진행했습니다. 우연히 금융 업계의 한 고객이 제 소개를 듣고 전화를 했습니다. 채팅하기. 그들은 Xinchuang 데이터베이스를 선택하고 여러 국내 데이터베이스를 시도했으며 마침내 TDSQL을 선택하려고 합니다. 당시에는 조금 놀랐습니다. 2020년부터 국내 데이터베이스를 선택하고 있었는데, TDSQL을 사용한 후 초기 경험이 별로 좋지 않았던 것 같습니다. 나중에 대화를 통해 그들이 이제 막 TDSQL의 분산 데이터베이스를 사용하기 시작했다는 사실을 알게 되었고 연구 개발 요구 사항이 너무 높아서 모두 TDSQL의 중앙 집중식 MYSQL 인스턴스를 선택했습니다. 사용한 후에는 사용이 매우 쉽다는 것을 알게 되었습니다. . 전체 데이터베이스 클라우드

관찰 가능성이란 무엇입니까? 초보자가 알아야 할 모든 것 관찰 가능성이란 무엇입니까? 초보자가 알아야 할 모든 것 Jun 08, 2023 pm 02:42 PM

관찰 가능성이라는 용어는 엔지니어링 분야에서 유래되었으며 최근 몇 년 동안 소프트웨어 개발 분야에서 점점 더 대중화되고 있습니다. 간단히 말해서, 관찰 가능성은 외부 출력을 기반으로 시스템의 내부 상태를 이해하는 능력입니다. IBM은 관찰 가능성을 다음과 같이 정의합니다. 일반적으로 관찰 가능성은 외부 출력에 대한 지식을 기반으로 복잡한 시스템의 내부 상태 또는 조건을 이해할 수 있는 정도를 나타냅니다. 시스템의 관찰 가능성이 높을수록 추가 테스트나 코딩 없이도 성능 문제의 근본 원인을 찾는 프로세스가 더 빠르고 정확해질 수 있습니다. 클라우드 컴퓨팅에서 관찰 가능성은 애플리케이션 시스템을 보다 효과적으로 모니터링, 문제 해결, 디버깅하여 고객 경험을 달성하기 위해 분산 애플리케이션 시스템과 해당 운영을 지원하는 인프라의 데이터를 집계, 상관 관계 분석하고 분석하는 소프트웨어 도구 및 방식을 의미하기도 합니다. 최적화 및 서비스 수준 계약

Tuyou Zou Yi: 중소기업을 어떻게 운영하고 유지하나요? Tuyou Zou Yi: 중소기업을 어떻게 운영하고 유지하나요? Jun 09, 2023 pm 01:56 PM

인터뷰와 제출을 통해 운영 및 유지 관리 분야의 베테랑들이 심오한 통찰력을 제공하고 고급 합의를 형성하고 업계가 더 나은 발전을 이룰 수 있도록 함께 협력하도록 초대됩니다. 이번 호에는 Tuyou Games의 운영 및 유지 관리 이사인 Zou Yi를 초대합니다. Zou 씨는 종종 농담으로 자신을 세계 500만 대 기업의 운영 및 유지 관리 대표라고 부릅니다. 오늘은 중소기업의 운영 및 유지관리 건설 아이디어가 대기업의 아이디어와 다릅니다. 오늘은 Zou 씨에게 중소기업을 위한 연구와 운영을 통합하는 여정을 공유해 달라고 요청합니다. 규모의 회사. 현실적이고 수준 높은 '운영 및 유지보수 포럼' 제6호가 지금부터 시작됩니다! 질문 미리보기 투유는 게임 회사인데, 게임 운영과 유지 관리의 독특한 특징이 무엇이라고 생각하시나요? 직면하고 있는 가장 큰 운영 과제는 무엇입니까? 이러한 문제를 어떻게 해결하셨나요? 게임 운영 및 유지 관리 인력

운영 및 유지 관리를 위해 golang을 배워야 합니까? 운영 및 유지 관리를 위해 golang을 배워야 합니까? Jul 17, 2023 pm 01:27 PM

운영 및 유지 관리를 위해 golang을 배우지 마십시오. 1. Golang은 주로 고성능 및 동시 성능 요구 사항을 갖춘 애플리케이션을 개발하는 데 사용됩니다. 2. 운영 및 유지 관리 엔지니어가 일반적으로 사용하는 도구 및 스크립트 언어는 이미 충족할 수 있습니다. 대부분의 관리 및 유지 관리 요구 사항 3. golang을 학습하려면 특정 프로그래밍 기반과 경험이 필요합니다. 4. 운영 및 유지 관리 엔지니어의 주요 목표는 애플리케이션을 개발하는 것이 아니라 시스템의 안정성과 고가용성을 보장하는 것입니다.

Du Xiaoman 및 Chen Cunli: 20세의 '사령관'이 운영 및 유지 관리, 성능 및 성장에 대해 이야기합니다. Du Xiaoman 및 Chen Cunli: 20세의 '사령관'이 운영 및 유지 관리, 성능 및 성장에 대해 이야기합니다. Jun 09, 2023 am 09:56 AM

인터뷰와 제출을 통해 운영 및 유지 관리 분야의 베테랑을 초대하여 심오한 통찰력을 제공하고 서로 충돌하여 고급 합의를 형성하고 업계가 더 나은 발전을 이룰 수 있도록 장려합니다. 이번 호에는 Du Xiaoman 시스템 운영 및 유지 관리 부서의 총책임자인 Chen Cunli가 20년 경력의 대부분을 인터넷 분야에서 보냈습니다. Baidu 운영 및 유지 관리 부서에 근무하는 동안 그의 팀원들은 뛰어난 리더십 스타일로 인해 그를 "첸 사령관"이라고 불렀습니다. 오늘 우리는 "첸 사령관"을 초대하여 그의 견해에 대해 이야기했습니다. 현실적이고 수준 높은 '운영 및 유지보수 포럼' 제5호가 지금부터 시작됩니다! 질문 미리보기: 귀하는 매우 일찍 Baidu에 합류하였고 나중에 Du Xiaoman과 함께 독립했습니다. 우리는 귀하 주변에 오랫동안 귀하를 따르며 많은 사업 운영 및 유지 관리 테스트를 경험한 많은 직원이 있다는 것을 알고 있습니다. 관심 있는.

See all articles