> 기술 주변기기 > 일체 포함 > AI 워크로드를 수용하기 위해 데이터 센터를 최적화하는 4가지 방법

AI 워크로드를 수용하기 위해 데이터 센터를 최적화하는 4가지 방법

PHPz
풀어 주다: 2023-12-14 16:51:51
앞으로
1221명이 탐색했습니다.

AI 워크로드를 수용하기 위해 데이터 센터를 최적화하는 4가지 방법

AI는 데이터 센터 고용 시장을 변화시키고 데이터 센터 모니터링 및 사고 대응 운영을 개선하는 등 다양한 방식으로 데이터 센터를 변화시킬 것으로 예상됩니다.

그러나 인공지능이 데이터센터에 미칠 가장 큰 영향은 데이터센터의 작동 방식을 바꾸는 것입니다. 최신 인공 지능 기술을 최대한 활용하려는 기업에서는 데이터 센터에 포함된 인프라와 관리 방식이 바뀌어야 합니다

데이터 센터의 AI 발전은 기대할 만한 일련의 주요 변화를 가져올 것입니다 그러나 정확한 영향은 아직 확인되지 않았습니다.

데이터 센터에 대한 AI의 고유한 요구

AI가 데이터 센터에 미치는 영향을 평가하려면 먼저 AI 워크로드가 데이터의 다른 유형의 워크로드와 어떻게 비교되는지 이해해야 합니다.

인공 지능(AI) 워크로드는 다양한 형태로 제공되고 요구 사항이 다르지만 대부분 다음과 같은 고유한 요구 사항이 있습니다.

  • 특히 모델 교육을 수행할 때 상당한 컴퓨팅 리소스가 필요합니다.
  • 베어메탈 하드웨어, 특히 GPU 리소스에 액세스할 수 있는 서버에서 실행하면 이점을 얻을 수 있습니다.
  • 자원 소비율은 크게 변동될 수 있습니다. 훈련 단계에서 AI 워크로드에는 많은 양의 리소스가 필요하지만 훈련이 완료된 후 모델을 다시 훈련할 때까지 대부분의 경우 리소스 소비가 크게 줄어듭니다.
  • 실시간으로 결정을 내리고 결과를 제공하려면 대기 시간이 매우 짧은 네트워크가 필요합니다.

물론 이러한 요구 사항을 충족할 수 있는 다른 유형의 워크로드도 있습니다. 예를 들어, 인공 지능 애플리케이션 및 서비스 실행이 베어메탈 서버의 이점을 누릴 수 있는 유일한 사용 사례는 아닙니다. 그러나 일반적으로 AI 소프트웨어에는 다른 유형의 워크로드보다 위의 리소스가 더 많이 필요합니다.

AI용 데이터 센터 업그레이드

AI 워크로드에 맞게 시설을 최적화하려면 많은 데이터 센터 운영자가 AI의 고유한 요구 사항을 충족하도록 변경해야 합니다. 이와 관련하여 주요 데이터 센터 업그레이드는 다음과 같습니다.

  1. 베어메탈 서버 재설계 또는 교체

가상 머신은 지난 10년 동안 워크로드를 호스팅하기 위해 선택한 인프라 리소스였습니다. 그러나 AI 애플리케이션 및 서비스에 대한 베어 메탈 하드웨어에 대한 수요가 증가함에 따라 점점 더 많은 데이터 센터 운영자가 베어 메탈 제품 확장의 중요성을 깨닫게 될 것입니다

어떤 면에서는 이는 실제로 데이터 센터 운영을 단순화합니다. 베어메탈에서 워크로드를 실행하는 경우 하이퍼바이저와 VM 조정자가 혼합되어 있지 않기 때문에 호스팅 스택이 덜 복잡해집니다.

반면, 베어메탈 인프라 호스팅 워크로드를 확장하려면 데이터 센터의 호스팅 서버 및 랙에 대한 업데이트 및 업그레이드가 필요할 수 있습니다. 전통적으로 데이터 센터에 서버를 설정하는 가장 간단한 방법은 강력한 베어메탈 머신을 프로비저닝하고 이를 워크로드 요구 사항에 따라 원하는 수의 가상 머신에 할당하는 것이었습니다. 그러나 워크로드를 베어 메탈에서 직접 실행해야 하는 경우 워크로드를 격리하기 위해 더 많은 서버가 필요할 수 있습니다. 즉, 데이터 센터는 고성능 서버를 더 작은 서버로 교체하고 그에 따라 서버 랙을 업데이트해야 합니다

  1. GPU 공유- 지원 서버

AI 애플리케이션의 일상적인 작업에는 반드시 GPU 지원이 필요한 것은 아니지만, AI 워크로드에 대한 훈련에는 GPU 서버를 사용하는 것이 도움이 될 수 있습니다. 따라서 많은 기업에서는 GPU 지원 인프라에 대한 임시 액세스만 필요합니다.

공유 GPU 인프라에 대한 기업의 요구 사항을 충족하려면 데이터 센터 운영자는 관련 제품 제공을 고려해야 합니다. 일부 기업에서는 경우에 따라 GPU 장착 서버만 필요하므로 데이터 센터 운영자는 서비스형 GPU를 통해 일시적으로 GPU 리소스에 대한 액세스를 제공할 수 있으므로 AI 워크로드가 필요한 기업을 더 효과적으로 유치할 수 있습니다.

  1. 향상된 네트워크 솔루션

대부분의 엔터프라이즈급 데이터 센터는 이미 고성능 네트워크 인프라에 액세스할 수 있으며 데이터를 외부 시설로 신속하게 이동할 수 있는 상호 연결 서비스를 제공합니다. 그러나 인공 지능의 힘을 완전히 실현하려면 데이터 센터 네트워크 제품이 더욱 강력해야 할 수도 있습니다.

인공 지능 워크로드를 처리하는 기업은 두 가지 핵심 기능을 갖추어야 합니다. 첫째, 신속하게 처리할 수 있는 고대역폭 네트워크 연결이 필요합니다. 대량의 데이터를 전송하는 것은 분산 인프라에서 AI 모델을 훈련할 때 특히 중요합니다. 둘째, 네트워크는 실시간 실행을 달성하려는 AI 애플리케이션 및 서비스에 매우 중요한 낮은 대기 시간을 제공해야 합니다.

  1. 더 큰 데이터 센터 유연성

AI 워크로드의 리소스 요구 사항이 크게 변동하기 때문에 데이터 센터는 지원할 수 있는 인프라의 양 측면에서 더 유연할 수 있습니다. AI는 또한 기업이 서버를 직접 설치하는 대신 다른 데이터 센터에 서버를 필요에 따라 배포할 수 있도록 하는 서비스에 대한 수요를 증가시킬 수 있습니다. 주문형 인프라는 리소스 수요의 변동을 설명하는 좋은 방법이기 때문입니다.

이를 위해 AI에 최적화하려는 데이터 센터 운영자는 시설을 보다 유연하게 만드는 제품을 고려해야 합니다. 고객이 자체 인프라를 구축할 수 있는 랙 공간 이상의 것을 포함하는 단기 계약과 서비스의 조합은 AI 워크로드를 배포해야 하는 조직에 매력적일 수 있습니다.

결론

AI 혁명은 여전히 ​​진행 중이며, AI가 데이터 센터 운영 방식이나 데이터 센터 내에 구축된 인프라 유형을 어떻게 변화시킬지 정확히 아는 것은 아직 이르다. 그러나 상대적으로 확실한 것은 GPU 지원 서버 및 보다 유연한 솔루션과 같은 변화가 AI 중심 세계에서 중요해질 수 있다는 것입니다. 이 파이를 원하는 데이터 센터 운영자는 AI 워크로드의 고유한 요구 사항을 충족하도록 시설을 업데이트해야 합니다.

위 내용은 AI 워크로드를 수용하기 위해 데이터 센터를 최적화하는 4가지 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿