운영 및 유지보수 안전 우물 출처: 운영 및 유지 관리 기하학

우물 출처: 운영 및 유지 관리 기하학

Jun 09, 2023 pm 04:50 PM
운영 및 유지보수

편집자 주: Jing 상사는 제가 2011년 Baidu에 합류했을 때 우리 팀의 상사였습니다. 그는 하드코어 베테랑입니다. 그는 업계의 모든 일반적인 질문을 독자들에게 물었습니다. 징보스는 자유롭고 여유로운 성격을 갖고 있으며, 그의 농담과 욕설은 모두 기록되어 있고, 그의 원칙은 이해하기 쉽습니다. 현실적이고 높은 수준의 "운영 및 유지 보수 포럼"의 첫 번째 호는 다음과 같습니다. 시작하겠습니다!

손님 소개

우물 출처: 운영 및 유지 관리 기하학

Jingyuan, 왼쪽부터 첫 번째, 전 Baidu 운영 및 유지 관리 설계자, 전 Xiaomi 운영 및 유지 관리 리더, 전 Meicai CIO

일부 운영 및 유지 관리 인력은 회사의 가치를 운영에 반영합니다. 유지 관리에 대해 아는 것이 거의 없는데 당시 회사에 운영 및 유지 관리의 가치를 어떻게 명확하게 설명하셨나요?

우선, 운영 및 유지 관리의 직무 책임(운영 및 유지 관리가 수행하는 작업 및 생산되는 항목)과 주요 지표(출력 결과 측정)를 회사에 명확하게 설명해야 합니다. 예를 들어 작업은 안정성을 중심으로 이루어집니다. , 안전성, 효율성 등, 어떤 작업이 수행되는지, 유지 관리 프로젝트, 주요 지표 달성을 적극적으로 홍보하는 방법.

주요 지표에는 서비스 가용성뿐만 아니라 서버 자원 준수율, 서비스 장애 데이터(장애 분류, 장애 응답 시간, 평균 장애 복구 시간, 장애 경보 적용 범위), 서비스 보안 지표, 서비스 리소스 가용성 시간 등이 포함됩니다. .

예를 들어, 완전한 모니터링 시스템 구축:

서버 리소스 사용량 모니터링, 재활용 또는 리소스 재할당을 위해 사용량이 표준 이하인 서버 찾기, 가상화, 컨테이너화 등을 통해 리소스 사용량 개선, 경보 임계값 정렬, P0, P1 표준화 , P2 및 P3 경보 수준, 모니터링 시스템은 경보 병합, 지능형 위치 제안, 활성 경보 집계 및 시간 위도 경보 분석을 제공합니다. 편리하고 빠른 알람 응답 및 오류 위치, 알람 개선 및 오류 응답 시간 및 오류 복구 시간과 같은 서비스 정렬 계획, 평균 오류 복구 시간 단축 및 오류 경보 적용 범위 개선

업계의 일부 사람들은 기초가 클라우드와 쿠버네티스의 증가로 인해 운영 및 유지 관리 직위가 점차 사라질 것이라고 생각하십니까?

수년 전 저희 운영 및 유지보수 팀의 슬로건은 NO Ops였고, 블로그도 noops.me였습니다.

운영 및 유지보수 직위가 점차 사라지거나 일부 직무가 사라진다는 이야기는 오래전부터 있었습니다. 시스템 운영 및 유지보수를 예로 들면, 이전 관리팀에는 서버 엔지니어, 커널 엔지니어, 네트워크 엔지니어, CDN 엔지니어, 전산실 운영 및 유지보수 엔지니어 등 20명의 팀이 필요했습니다. 이후 퍼블릭 클라우드가 도입되면서 팀에는 클라우드 리소스 관리자 1명, CDN 스케줄링 엔지니어 1명, 네트워크 엔지니어 1명, 커널 엔지니어 1명 등 4명만 남았습니다. 그들은 제3자가 제공하는 리소스와 서비스를 관리하고 예약하기만 하면 되었습니다. -파티 회사.

K8s와 클라우드의 인기와 R&D 코드 엔지니어링의 지속적인 성숙으로 인해 이 프로세스에 대한 운영 및 유지 관리의 참여가 점점 줄어들 것입니다. 배포 프레임워크가 성숙되면 운영 및 유지 관리 인력을 절약하고 배포 효율성을 높이기 위해 2차 및 3차 서비스 배포를 R&D 셀프 서비스에 맡겼습니다.

기술의 발전과 시대의 변화에 ​​따라 적시 조정과 계획이 중요해지는 것은 당연한 일입니다.

기업이 대규모로 클라우드로 마이그레이션하는 현재 환경에서 현재 인재 요구 사항을 더 잘 충족하기 위해 운영 및 유지 관리 담당자가 어떤 조정을 해야 한다고 생각하시나요?

클라우드 환경에서 운영 및 유지보수 엔지니어는 보다 비즈니스 지향적이고 아키텍처 지향적이어야 하며, 비즈니스 범위를 확장하고 비즈니스 안정성을 보장하는 핵심 인재가 되어야 합니다. 여전히 이전과 동일하고 모니터링 및 알람에만 중점을 두고 서비스 배포 변경만 담당한다면 반드시 제거될 것입니다.

한편, 전문화 방향으로 나아가 특정 분야(모니터링, 빅데이터, K8s, 데이터베이스 등)의 전문가가 되어 운영 및 유지보수 R&D 전문가가 될 수도 있습니다.

생활 조언, 더 많은 부업을 찾아보세요. 운영 및 유지 관리 작업은 삶의 작은 부분일 뿐입니다.

AIOps는 몇 년 동안 뜨거운 관심을 받았지만 최근에는 확실히 그 소문이 잠잠해졌습니다. 기업이 이 단계에서 AIOps를 구현해야 한다고 생각하십니까? 우리는 어떤 문제에 주의를 기울여야 할까요?

스마트 모니터링을 예로 들면, AI를 사용하여 결함을 예측하고 지능적으로 찾아내야 한다는 카피라이팅을 많이 봤습니다. 아직까지 믿을 만한 사례를 본 적이 없습니다. 서비스가 더 빠르게 변화하고 있는 인터넷 비즈니스 시스템에서, 과거 데이터를 통해 장애 예측이 실제로 가능하다면 종속성이 복잡하고 장애에 영향을 미치는 요소가 많습니다. 수천년간의 지진 데이터 축적은 큰 사회적 가치를 창출할 수 있습니다.

AIOps를 수행하기 위한 전제 조건은 AI를 실제로 이해하고 머신러닝과 신경망의 원리를 이해하는 것입니다. 인공지능만큼 지능도 많으며, AIOps 기능은 슬로건이 아닙니다.

chatGPT와 같은 AI 기능이 향후 운영 및 유지보수 업계의 문제를 해결할 수 있을 것이라고 생각하시나요?

예를 들어 결함 관리에서는 결함이 있는 장비, 데이터, 설명, 지식 기반, 과거 결함 데이터베이스 등을 기반으로 가능한 결함에 대한 보조 제안(suggestbot)이 제공됩니다

BTW, 이미 chatGPT를 재생할 수 있는 경우 , 이 기술을 더 많은 가치를 창출할 수 있는 다른 분야에 적용하고, 운영 및 유지 관리 분야에서 항상 낭비하지 마십시오...

비즈니스 프로그램 배포를 R&D에 맡겨야 할지, 운영 및 유지 관리를 해야 할지 많은 기업에서 끊임없이 논의하고 있습니다.

앞서 언급한 바와 같이 저희의 2차, 3차 서비스는 전적으로 R&D로 제공되고, 1차 서비스는 운영 및 유지보수, R&D가 차례로 제공되며 운영 및 유지보수에 변화를 알리는 것이 주요 목적입니다. 현재 서비스에서는. 운영 및 유지 관리 담당자는 회사 초기에 배포를 수행할 때 시스템을 더 잘 개발 및 배포하고 자신이 담당하는 서비스 아키텍처를 제어하기 위해 온라인 환경을 표준화하고 서비스 배포 방법을 표준화하는 데 더 중점을 둡니다.

시스템 배포를 통해 보안 문제 및 프로세스 문제를 완전히 해결할 수 있습니다. 운영과 유지관리 측면에서 가치도 없고 축적도 없는 이 일에 집착하지 마세요.

(운영 및 유지)업계에 가장 하고 싶은 말씀은 무엇인가요? 왜?

"물리학은 존재하지 않지만 우리가 생각하는 물리학은 없을 수도 있습니다." 운영 및 유지 관리 산업은 더 이상 존재하지 않을 수 있습니다. 얼마나 많은 운영 및 유지 관리 사람들의 꿈이 AIOps와 NOOps이므로 스스로 이 산업을 죽이거나 해야 합니다. , 또는 이 업계에서 죽임을 당하세요.

도구 선택 시 직접 개발할지, 오픈 소스를 사용할지, 상용 제품을 사용할지 어떻게 결정하시나요?

능력과 시간이 있다면 오픈 소스를 사용하고, 능력과 시간이 제한되어 있다면 상용 제품을 사용하세요. 돈이 있고 여유가 있고 자존심이 강하다면 독학을 시도해 볼 수 있습니다.

귀사도 멀티 클라우드 아키텍처를 갖추고 있나요? 멀티 클라우드 시나리오에서 클라우드 공급업체가 의존해야 할 기능은 무엇이며 사내에서 구축해야 할 기능은 무엇이라고 생각하시나요?

우리는 멀티 클라우드 아키텍처입니다. 전용선이나 데이터 전송 기능은 직접 구축해야 합니다. 모니터링 시스템, 데이터 백업 시스템, 배포 시스템, 핵심 마이크로서비스 구성 요소 등 멀티 클라우드 기반의 공용 기능도 자체적으로 구축하고 나머지는 클라우드 공급업체에 맡길 수도 있습니다.

가장 기억에 남는 실패는 무엇인가요? 그것은 당신에게 어떤 영감을 주나요?

수년간의 운영과 유지 관리 끝에 이상한 실패를 너무 많이 겪었고 근본 원인은 상상을 초월합니다. 실패는 피하기 어렵다고 할 수 있으며, 실패의 빈도, 영향 영역 및 영향 시간을 줄이려고 노력할 뿐입니다.

그래서 성능은 실패 횟수와 실패 수준이 아니라 실패의 영향, 실패 대응, 복구 시간 등입니다.

빠르게 발전하는 기초기술에 직면해, 업계에 갓 입문한 운영 및 유지관리 인력과 오랫동안 업계에 종사해 오신 분들을 위한 진로설계 조언이 있으신가요?

좀 극단적이네요~ 이제 막 업계에 입문하신 분들은 빨리 직업을 바꾸는 걸 추천드려요! 오랫동안 업계에 종사해 온 사람들에게는 기술 분야에서 경력을 바꾸는 것이 상대적으로 어렵고 운영 및 유지 관리에 깊은 인상을 남겼습니다. 운영 및 유지보수 인력이 다른 기술로 전환하는 경우를 많이 봤습니다. 대부분 운영 및 유지보수 R&D와 운영 및 유지보수 제품 관리자 직위를 찾는 것이 좋습니다.

기존 운영 및 유지관리와 SRE의 차이점은 무엇이라고 생각하시나요? 팀 변화의 배경에는 어떤 생각이 있었나요?

벌써 2023년이군요. 이 주제를 이야기하는 것은 인터넷 운영 및 유지 관리에 대한 NOC 모니터링 의무를 설정하는 것과 같습니다.

SRE 전환 여부, SRE 전환 방법, SRE의 변화를 5g 시대처럼 아직도 고민 중이라면 2g를 쓸지, 3g를 쓸지 고민 중이라면... 타임스.

갑자기 끝날 것 같은 느낌이 드시나요? 하하, 이것이 "운영 및 유지 보수 포럼"의 첫 번째 이슈입니다. 앞으로도 업계 리더들을 초대하여 다양한 의견이 있을수록 더 흥미롭고 더 많은 생각을 하게 될 것입니다. 마음을 열고 수백 가지 학파의 의견을 들어보세요. 다음에 또 만나요!

위 내용은 우물 출처: 운영 및 유지 관리 기하학의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다. 10년 넘게 운영 및 유지보수 업무를 하다 보니 아직 초보인 것 같은 순간이 셀 수 없이 많았습니다. Jun 09, 2023 pm 09:53 PM

옛날에 제가 컴퓨터 과학을 전공하는 신입생이었을 때, 채용 웹사이트에서 많은 채용 공고를 찾아보던 중 R&D 엔지니어, 운영 및 유지 관리 엔지니어, 테스트 엔지니어 등 눈부신 기술 직위에 대해 혼란스러웠습니다. , 제 전문 과정은 그저 그랬고 기술적 비전도 없었으며 어떤 기술적 방향을 추구해야 할지 명확한 아이디어도 없었습니다. 한 선배가 나에게 "운영 및 유지 관리를 하세요. 운영 및 유지 관리를 위해 매일 코드를 작성할 필요가 없습니다. Liunx를 사용할 수 있으면 됩니다! 개발을 하는 것보다 훨씬 쉽습니다!"라고 말하기 전까지는 말이죠. 믿다... 10년 넘게 업계에 있으면서 고생도 많이 했고, 비난도 많이 받았고, 서버도 죽였고, 부서 해고도 경험했다. 지금 누가 나에게 개발보다 운영과 유지가 쉽다고 말한다면. , 그럼 그럴게요

Spring Boot Actuator Endpoint 공개: 애플리케이션을 쉽게 모니터링 Spring Boot Actuator Endpoint 공개: 애플리케이션을 쉽게 모니터링 Jun 09, 2023 pm 10:56 PM

1. SpringBootActuator 엔드포인트 소개 1.1 Actuator 엔드포인트란 무엇입니까? SpringBootActuator는 SpringBoot 애플리케이션을 모니터링하고 관리하는 데 사용되는 하위 프로젝트입니다. 애플리케이션의 상태, 작동 상태 및 작동 표시기를 보는 데 사용할 수 있는 일련의 내장 엔드포인트(Endpoint)를 제공합니다. 작동기 엔드포인트는 운영 및 유지보수 담당자가 애플리케이션을 모니터링, 진단 및 관리할 수 있도록 HTTP, JMX 또는 기타 형식으로 외부 시스템에 노출될 수 있습니다. 1.2 엔드포인트의 역할 및 기능 Actuator 엔드포인트는 주로 다음 기능을 구현하는 데 사용됩니다. 데이터베이스 연결, 캐싱을 포함한 애플리케이션의 상태 확인 제공,

Spring Cloud 마이크로서비스 아키텍처 배포 및 운영 Spring Cloud 마이크로서비스 아키텍처 배포 및 운영 Jun 23, 2023 am 08:19 AM

인터넷의 급속한 발전으로 인해 기업 수준의 애플리케이션은 날로 복잡해지고 있습니다. 이러한 상황에 대응하여 마이크로서비스 아키텍처가 탄생했습니다. 모듈성, 독립적 배포 및 높은 확장성을 통해 오늘날 엔터프라이즈 수준 애플리케이션 개발을 위한 첫 번째 선택이 되었습니다. 뛰어난 마이크로서비스 아키텍처인 Spring Cloud는 실제 애플리케이션에서 큰 이점을 보여왔습니다. 이 기사에서는 SpringCloud 마이크로서비스 아키텍처의 배포, 운영 및 유지 관리에 대해 소개합니다. 1. SpringCloud 마이크로서비스 아키텍처 배포 SpringCloud

PG 데이터베이스 운영 및 유지 관리 도구에는 어떤 기능이 포함되어야 합니까? PG 데이터베이스 운영 및 유지 관리 도구에는 어떤 기능이 포함되어야 합니까? Jun 08, 2023 pm 06:56 PM

연휴 전에 저는 PG China 커뮤니티와 협력하여 D-SMART를 사용하여 PG 데이터베이스를 운영하고 유지하는 방법에 대한 온라인 라이브 방송을 진행했습니다. 우연히 금융 업계의 한 고객이 제 소개를 듣고 전화를 했습니다. 채팅하기. 그들은 Xinchuang 데이터베이스를 선택하고 여러 국내 데이터베이스를 시도했으며 마침내 TDSQL을 선택하려고 합니다. 당시에는 조금 놀랐습니다. 2020년부터 국내 데이터베이스를 선택하고 있었는데, TDSQL을 사용한 후 초기 경험이 별로 좋지 않았던 것 같습니다. 나중에 대화를 통해 그들이 이제 막 TDSQL의 분산 데이터베이스를 사용하기 시작했다는 사실을 알게 되었고 연구 개발 요구 사항이 너무 높아서 모두 TDSQL의 중앙 집중식 MYSQL 인스턴스를 선택했습니다. 사용한 후에는 사용이 매우 쉽다는 것을 알게 되었습니다. . 전체 데이터베이스 클라우드

관찰 가능성이란 무엇입니까? 초보자가 알아야 할 모든 것 관찰 가능성이란 무엇입니까? 초보자가 알아야 할 모든 것 Jun 08, 2023 pm 02:42 PM

관찰 가능성이라는 용어는 엔지니어링 분야에서 유래되었으며 최근 몇 년 동안 소프트웨어 개발 분야에서 점점 더 대중화되고 있습니다. 간단히 말해서, 관찰 가능성은 외부 출력을 기반으로 시스템의 내부 상태를 이해하는 능력입니다. IBM은 관찰 가능성을 다음과 같이 정의합니다. 일반적으로 관찰 가능성은 외부 출력에 대한 지식을 기반으로 복잡한 시스템의 내부 상태 또는 조건을 이해할 수 있는 정도를 나타냅니다. 시스템의 관찰 가능성이 높을수록 추가 테스트나 코딩 없이도 성능 문제의 근본 원인을 찾는 프로세스가 더 빠르고 정확해질 수 있습니다. 클라우드 컴퓨팅에서 관찰 가능성은 애플리케이션 시스템을 보다 효과적으로 모니터링, 문제 해결, 디버깅하여 고객 경험을 달성하기 위해 분산 애플리케이션 시스템과 해당 운영을 지원하는 인프라의 데이터를 집계, 상관 관계 분석하고 분석하는 소프트웨어 도구 및 방식을 의미하기도 합니다. 최적화 및 서비스 수준 계약

Tuyou Zou Yi: 중소기업을 어떻게 운영하고 유지하나요? Tuyou Zou Yi: 중소기업을 어떻게 운영하고 유지하나요? Jun 09, 2023 pm 01:56 PM

인터뷰와 제출을 통해 운영 및 유지 관리 분야의 베테랑들이 심오한 통찰력을 제공하고 고급 합의를 형성하고 업계가 더 나은 발전을 이룰 수 있도록 함께 협력하도록 초대됩니다. 이번 호에는 Tuyou Games의 운영 및 유지 관리 이사인 Zou Yi를 초대합니다. Zou 씨는 종종 농담으로 자신을 세계 500만 대 기업의 운영 및 유지 관리 대표라고 부릅니다. 오늘은 중소기업의 운영 및 유지관리 건설 아이디어가 대기업의 아이디어와 다릅니다. 오늘은 Zou 씨에게 중소기업을 위한 연구와 운영을 통합하는 여정을 공유해 달라고 요청합니다. 규모의 회사. 현실적이고 수준 높은 '운영 및 유지보수 포럼' 제6호가 지금부터 시작됩니다! 질문 미리보기 투유는 게임 회사인데, 게임 운영과 유지 관리의 독특한 특징이 무엇이라고 생각하시나요? 직면하고 있는 가장 큰 운영 과제는 무엇입니까? 이러한 문제를 어떻게 해결하셨나요? 게임 운영 및 유지 관리 인력

운영 및 유지 관리를 위해 golang을 배워야 합니까? 운영 및 유지 관리를 위해 golang을 배워야 합니까? Jul 17, 2023 pm 01:27 PM

운영 및 유지 관리를 위해 golang을 배우지 마십시오. 1. Golang은 주로 고성능 및 동시 성능 요구 사항을 갖춘 애플리케이션을 개발하는 데 사용됩니다. 2. 운영 및 유지 관리 엔지니어가 일반적으로 사용하는 도구 및 스크립트 언어는 이미 충족할 수 있습니다. 대부분의 관리 및 유지 관리 요구 사항 3. golang을 학습하려면 특정 프로그래밍 기반과 경험이 필요합니다. 4. 운영 및 유지 관리 엔지니어의 주요 목표는 애플리케이션을 개발하는 것이 아니라 시스템의 안정성과 고가용성을 보장하는 것입니다.

Du Xiaoman 및 Chen Cunli: 20세의 '사령관'이 운영 및 유지 관리, 성능 및 성장에 대해 이야기합니다. Du Xiaoman 및 Chen Cunli: 20세의 '사령관'이 운영 및 유지 관리, 성능 및 성장에 대해 이야기합니다. Jun 09, 2023 am 09:56 AM

인터뷰와 제출을 통해 운영 및 유지 관리 분야의 베테랑을 초대하여 심오한 통찰력을 제공하고 서로 충돌하여 고급 합의를 형성하고 업계가 더 나은 발전을 이룰 수 있도록 장려합니다. 이번 호에는 Du Xiaoman 시스템 운영 및 유지 관리 부서의 총책임자인 Chen Cunli가 20년 경력의 대부분을 인터넷 분야에서 보냈습니다. Baidu 운영 및 유지 관리 부서에 근무하는 동안 그의 팀원들은 뛰어난 리더십 스타일로 인해 그를 "첸 사령관"이라고 불렀습니다. 오늘 우리는 "첸 사령관"을 초대하여 그의 견해에 대해 이야기했습니다. 현실적이고 수준 높은 '운영 및 유지보수 포럼' 제5호가 지금부터 시작됩니다! 질문 미리보기: 귀하는 매우 일찍 Baidu에 합류하였고 나중에 Du Xiaoman과 함께 독립했습니다. 우리는 귀하 주변에 오랫동안 귀하를 따르며 많은 사업 운영 및 유지 관리 테스트를 경험한 많은 직원이 있다는 것을 알고 있습니다. 관심 있는.

See all articles