헤드라인 빅데이터 처리를 위한 고성능 컴퓨팅을 위한 4단계

빅데이터 처리를 위한 고성능 컴퓨팅을 위한 4단계

Mar 10, 2018 am 09:48 AM
데이터 처리 용적 고성능

기업이 빅 데이터를 처리하기 위해 고성능 컴퓨팅을 채택해야 하는 경우 온프레미스에 운영을 배포하는 것이 가장 효과적일 수 있습니다. 고성능 컴퓨팅과 Hadoop의 차이점을 포함하여 기업이 알아야 할 사항은 다음과 같습니다.

빅데이터 분야에서 모든 기업에 고성능 컴퓨팅(HPC)이 필요한 것은 아니지만, 빅데이터를 활용하는 거의 모든 기업이 하둡(Hadoop) 방식의 분석 컴퓨팅을 채택하고 있습니다.

빅데이터 처리를 위한 고성능 컴퓨팅을 위한 4단계

Hadoop 분석 작업은 고성능 컴퓨팅(HPC) 장치에서 실행할 수 있지만 그 반대의 경우는 불가능하므로 HPC와 Hadoop의 차이점을 구별하기 어렵습니다. HPC 및 Hadoop 분석은 모두 병렬 데이터 처리를 사용하지만 Hadoop 및 분석 환경에서는 데이터가 하드웨어에 저장되고 해당 하드웨어의 여러 노드에 분산됩니다. 고성능 컴퓨팅(HPC)에서는 데이터 파일 크기가 훨씬 크고 데이터가 중앙에 저장됩니다. 고성능 컴퓨팅(HPC)은 파일 크기가 크고 InfiniBand와 같은 더 비싼 네트워크 통신이 필요하기 때문에 높은 처리량과 낮은 대기 시간이 필요합니다.

기업 CIO의 목적은 분명합니다. 기업이 HPC를 피하고 분석 목적으로만 Hadoop을 사용할 수 있다면 그렇게 할 수 있습니다. 이 접근 방식은 비용이 저렴하고 직원이 운영하기 쉬우며 다른 회사(예: 타사 공급업체)가 실행할 수 있는 클라우드에서도 실행할 수 있습니다.

안타깝게도 처리를 위해 고성능 컴퓨팅(HPC)이 필요한 생명 과학, 기상학, 제약, 광업, 의료, 정부, 학계의 모든 기업 및 기관에서는 Hadoop을 채택하는 것이 불가능합니다. 파일 크기가 크고 처리 요구 사항이 매우 엄격하기 때문에 데이터 센터나 클라우드 컴퓨팅을 사용하는 것은 좋은 솔루션이 아닙니다.

간단히 말하면 HPC(고성능 컴퓨팅)는 데이터 센터 내에서 실행되는 빅 데이터 플랫폼의 완벽한 예입니다. 이 때문에 기업에서는 막대한 투자를 한 하드웨어가 필요한 작업을 수행하는지 확인하는 것이 어려운 일이 됩니다.

빅 데이터 Hadoop 및 HPC 플랫폼 제공업체인 PSCC Labs의 최고 전략 책임자인 Alex Lesser는 다음과 같이 말했습니다. “이는 빅 데이터를 처리하기 위해 HPC를 사용해야 하는 많은 기업이 직면한 과제입니다. IT 인프라와 이미 익숙한 상용 하드웨어를 사용하므로 이러한 사고 방식을 채택하고 자체적으로 Hadoop 분석 컴퓨팅 환경을 구축하는 것은 자연스러운 일이지만 고성능 컴퓨팅(HPC)의 경우 응답은 종종 다음과 같습니다. 공급업체가 처리합니다."

고성능 컴퓨팅(HPC) 도입을 고려하는 회사는 다음 네 가지 단계를 수행해야 합니다.

1. 고성능 컴퓨팅(HPC)에 대한 고위 경영진의 지원 보장

최고 경영진 및 이사회 기업이 반드시 컴퓨팅 분야의 고성능 전문가가 될 필요는 없지만, 그들의 이해와 지원 없이는 결코 가능하지 않습니다. 이러한 관리자는 모두 고성능 컴퓨팅(HPC)에 대해 충분히 이해하고 있어야 하며 기업을 위해 이루어질 수 있는 대규모 하드웨어, 소프트웨어 및 교육 투자를 명확하게 지원할 수 있어야 합니다. 즉, 두 가지 측면에 대해 교육을 받아야 합니다. (1) HPC가 무엇이며 왜 일반 분석과 다르며 특수 하드웨어 및 소프트웨어가 필요한지. (2) 기업이 비즈니스 목표를 달성하기 위해 레거시 분석 대신 HPC를 사용해야 하는 이유. 이러한 교육 노력은 모두 CIO(최고 정보 책임자) 또는 CDO(최고 개발 책임자)의 책임이어야 합니다.

Lesser는 "HPC 도입에 가장 적극적으로 나서는 기업은 자신이 진짜라고 믿는 기술 기업이며, 아마존의 소매 사업으로 시작해 지금은 엄청난 수익원이 된 아마존 AWS 클라우드 서비스를 언급하고 있는 것"이라고 말했다. ."

2. 사용자 정의가 가능한 사전 구성된 하드웨어 플랫폼 고려

PSSC Labs와 같은 회사는 사전 패키지 및 사전 구성된 HPC 하드웨어를 제공합니다. Lesser는 "우리는 HPC 모범 사례를 기반으로 한 기본 패키지를 보유하고 있으며 고객과 협력하여 컴퓨팅 요구 사항에 따라 해당 기본 패키지를 사용자 정의합니다"라고 말하면서 거의 모든 데이터 센터에는 일부 사용자 정의가 필요하다고 지적했습니다.

3. 수익 이해

모든 IT 투자와 마찬가지로 HPC는 비용 효율적이어야 하며 비즈니스는 경영진과 이사회의 마음 속에 명확하게 표현된 투자 수익(ROI)을 달성할 수 있어야 합니다. "좋은 예는 항공기 설계입니다"라고 Lesser는 말했습니다. “고성능 컴퓨팅(HPC)은 막대한 투자이지만, 기업이 HPC를 사용하여 설계를 시뮬레이션하고 99.9999999%의 정확도를 얻을 수 있으며 더 이상 물리적인 풍동을 임대할 필요가 없다는 사실을 알게 되면 투자금을 빨리 회수할 수 있습니다.”

4. 자체 IT 직원 교육

HPC 컴퓨팅은 기업의 IT 직원에게 쉬운 전환이 아니지만 기업이 온프레미스 작업을 실행하려는 경우 팀이 자급자족할 수 있도록 배치해야 합니다.

처음에는 기업이 시작하려면 외부 컨설턴트를 고용해야 할 수도 있습니다. 그러나 컨설팅 업무의 목표는 항상 두 가지입니다. 즉, (1) HPC 애플리케이션을 계속 실행하고 (2) 직원이 운영을 맡을 수 있도록 지식을 직원에게 전달해야 합니다. 기업은 이에 만족해서는 안 된다.

HPC 팀의 핵심에는 고성능 컴퓨팅에 필요한 매우 복잡한 알고리즘을 개발하여 기업의 질문에 답할 수 있는 데이터 과학자가 필요합니다. 또한 강력한 C+ 또는 Fortran 기술과 병렬 처리 환경에서 강력한 시스템에서 작업할 수 있는 능력을 갖춘 프로그래머나 네트워크 통신 전문가가 필요합니다.

"결론은 기업이 2주에 한두 번 작업을 실행하는 경우 클라우드로 이동하여 HPC를 호스팅해야 한다는 것입니다." Lesser는 "그러나 기업이 HPC 리소스를 사용하고 다음과 같은 작업을 실행하는 경우에는 제약 회사나 생명 공학 회사, 회사에서 하루에 여러 번 이를 실행할 수 있다면 클라우드에서 실행하는 것은 돈 낭비가 될 것이므로 자체 운영을 자체적으로 운영하는 것을 고려해야 합니다.”

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Pandas는 SQL 데이터베이스에서 데이터를 쉽게 읽습니다. Pandas는 SQL 데이터베이스에서 데이터를 쉽게 읽습니다. Jan 09, 2024 pm 10:45 PM

데이터 처리 도구: Pandas는 SQL 데이터베이스에서 데이터를 읽고 특정 코드 예제가 필요합니다. 데이터 양이 계속 증가하고 복잡성이 증가함에 따라 데이터 처리는 현대 사회에서 중요한 부분이 되었습니다. 데이터 처리 프로세스에서 Pandas는 많은 데이터 분석가와 과학자가 선호하는 도구 중 하나가 되었습니다. 이 문서에서는 Pandas 라이브러리를 사용하여 SQL 데이터베이스에서 데이터를 읽는 방법을 소개하고 몇 가지 특정 코드 예제를 제공합니다. Pandas는 Python을 기반으로 한 강력한 데이터 처리 및 분석 도구입니다.

PHP 및 WebSocket: 고성능 실시간 애플리케이션 구축 PHP 및 WebSocket: 고성능 실시간 애플리케이션 구축 Dec 17, 2023 pm 12:58 PM

PHP 및 WebSocket: 고성능 실시간 애플리케이션 구축 인터넷이 발전하고 사용자 요구가 증가함에 따라 실시간 애플리케이션이 점점 더 보편화되고 있습니다. 기존 HTTP 프로토콜에는 실시간 데이터를 처리할 때 최신 데이터를 얻기 위해 빈번한 폴링이나 긴 폴링이 필요한 등 몇 가지 제한 사항이 있습니다. 이 문제를 해결하기 위해 WebSocket이 탄생했습니다. WebSocket은 양방향 통신 기능을 제공하는 고급 통신 프로토콜로, 브라우저와 서버 간에 실시간 전송 및 수신이 가능합니다.

지리정보학 전공자는 어떤 컴퓨터를 선택해야 할까요? 지리정보학 전공자는 어떤 컴퓨터를 선택해야 할까요? Jan 13, 2024 am 08:00 AM

지리정보학을 전공하는 학생들에게 적합한 컴퓨터 추천 1. 권장사항 2. 지리정보학을 전공하는 학생들은 대용량의 지리 데이터를 처리하고 복잡한 지리정보 분석을 수행해야 하므로 강력한 성능을 갖춘 컴퓨터가 필요합니다. 높은 구성을 갖춘 컴퓨터는 더 빠른 처리 속도와 더 큰 저장 공간을 제공할 수 있으며 전문적인 요구 사항을 더 잘 충족할 수 있습니다. 3. 데이터 처리 및 분석의 효율성을 향상시킬 수 있는 고성능 프로세서와 대용량 메모리가 장착된 컴퓨터를 선택하는 것이 좋습니다. 또한 더 큰 저장 공간과 고해상도 디스플레이를 갖춘 컴퓨터를 선택하면 지리 데이터와 결과를 더 잘 표시할 수 있습니다. 또한, 지리정보학을 전공하는 학생들은 지리정보시스템(GIS) 소프트웨어를 개발하고 프로그래밍해야 할 수도 있다는 점을 고려하여 그래픽 처리 지원이 더 나은 컴퓨터를 선택하세요.

C++ 고성능 프로그래밍 팁: 대규모 데이터 처리를 위한 코드 최적화 C++ 고성능 프로그래밍 팁: 대규모 데이터 처리를 위한 코드 최적화 Nov 27, 2023 am 08:29 AM

C++는 개발자에게 유연성과 확장성을 제공하는 고성능 프로그래밍 언어입니다. 특히 대규모 데이터 처리 시나리오에서는 C++의 효율성과 빠른 컴퓨팅 속도가 매우 중요합니다. 이 기사에서는 대규모 데이터 처리 요구 사항에 대처하기 위해 C++ 코드를 최적화하는 몇 가지 기술을 소개합니다. 기존 배열 대신 STL 컨테이너 사용 C++ 프로그래밍에서 배열은 일반적으로 사용되는 데이터 구조 중 하나입니다. 그러나 대규모 데이터 처리에서는 벡터, 데크, 리스트, 세트 등과 같은 STL 컨테이너를 사용하는 것이 더 효율적일 수 있습니다.

Golang은 데이터 처리 효율성을 어떻게 향상시키나요? Golang은 데이터 처리 효율성을 어떻게 향상시키나요? May 08, 2024 pm 06:03 PM

Golang은 동시성, 효율적인 메모리 관리, 기본 데이터 구조 및 풍부한 타사 라이브러리를 통해 데이터 처리 효율성을 향상시킵니다. 구체적인 장점은 다음과 같습니다. 병렬 처리: 코루틴은 동시에 여러 작업 실행을 지원합니다. 효율적인 메모리 관리: 가비지 수집 메커니즘이 자동으로 메모리를 관리합니다. 효율적인 데이터 구조: 슬라이스, 맵, 채널과 같은 데이터 구조는 데이터에 빠르게 액세스하고 처리합니다. 타사 라이브러리: fasthttp 및 x/text와 같은 다양한 데이터 처리 라이브러리를 포함합니다.

Redis를 사용하여 Laravel 애플리케이션의 데이터 처리 효율성 향상 Redis를 사용하여 Laravel 애플리케이션의 데이터 처리 효율성 향상 Mar 06, 2024 pm 03:45 PM

Redis를 사용하여 Laravel 애플리케이션의 데이터 처리 효율성을 향상하세요. 인터넷 애플리케이션의 지속적인 개발로 인해 데이터 처리 효율성은 개발자의 초점 중 하나가 되었습니다. Laravel 프레임워크를 기반으로 애플리케이션을 개발할 때 Redis를 사용하여 데이터 처리 효율성을 향상하고 데이터에 대한 빠른 액세스 및 캐싱을 달성할 수 있습니다. 이 글에서는 Laravel 애플리케이션에서 데이터 처리를 위해 Redis를 사용하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. Redis 소개 Redis는 고성능 메모리 데이터입니다.

Laravel과 CodeIgniter의 데이터 처리 기능은 어떻게 비교됩니까? Laravel과 CodeIgniter의 데이터 처리 기능은 어떻게 비교됩니까? Jun 01, 2024 pm 01:34 PM

Laravel과 CodeIgniter의 데이터 처리 기능을 비교해 보세요. ORM: Laravel은 클래스-객체 관계형 매핑을 제공하는 EloquentORM을 사용하는 반면, CodeIgniter는 데이터베이스 모델을 PHP 클래스의 하위 클래스로 표현하기 위해 ActiveRecord를 사용합니다. 쿼리 빌더: Laravel에는 유연한 체인 쿼리 API가 있는 반면, CodeIgniter의 쿼리 빌더는 더 간단하고 배열 기반입니다. 데이터 검증: Laravel은 사용자 정의 검증 규칙을 지원하는 Validator 클래스를 제공하는 반면, CodeIgniter는 내장된 검증 기능이 적고 사용자 정의 규칙을 수동으로 코딩해야 합니다. 실제 사례: 사용자 등록 예시에서는 Lar를 보여줍니다.

Golang과 Python 크롤러 비교: 크롤링 방지, 데이터 처리 및 프레임워크 선택의 차이점 분석 Golang과 Python 크롤러 비교: 크롤링 방지, 데이터 처리 및 프레임워크 선택의 차이점 분석 Jan 20, 2024 am 09:45 AM

Golang 크롤러와 Python 크롤러의 유사점과 차이점에 대한 심층 탐구: 크롤링 방지 응답, 데이터 처리 및 프레임워크 선택 서론: 최근 몇 년 동안 인터넷의 급속한 발전으로 네트워크의 데이터 양이 폭발적으로 증가했습니다. 성장. 인터넷 데이터를 얻기 위한 기술적 수단으로서 크롤러는 개발자들의 관심을 끌었습니다. 두 가지 주류 언어인 Golang과 Python은 각각 고유한 장점과 특징을 가지고 있습니다. 이 기사에서는 크롤링 방지 응답 및 데이터 처리를 포함하여 Golang 크롤러와 Python 크롤러의 유사점과 차이점을 자세히 살펴보겠습니다.