Rumah tajuk utama 用于大数据处理的高性能计算采用的4个步骤

用于大数据处理的高性能计算采用的4个步骤

Mar 10, 2018 am 09:48 AM
Pemprosesan data praktikal prestasi tinggi

如果企业需要采用处理其大数据的高性能计算,则在内部部署运营可能效果最佳。以下是企业需要了解的内容,其中包括高性能计算和Hadoop的不同之处。

在大数据领域,并非每家公司都需要高性能计算(HPC),但几乎所有使用大数据的企业都采用了Hadoop式分析计算。

1.jpg

HPC和Hadoop之间的区别很难区分,因为可以在高性能计算(HPC)设备上运行Hadoop分析作业,但反之亦然。 HPC和Hadoop分析都使用并行数据处理,但在Hadoop 和分析环境中,数据存储在硬件上,并分布在该硬件的多个节点上。在高性能计算(HPC)中,数据文件的大小要大得多,数据存储集中。高性能计算(HPC)由于其文件体积庞大,还需要更昂贵的网络通信(如InfiniBand),因此需要高吞吐量和低延迟。

企业首席信息官的目的很明确:如果企业可以避免使用HPC并只将Hadoop用于分析,可以执行此操作。这种方式成本更低,更易于员工操作,甚至可以在云端运行,其他公司(如第三方供应商)可以运行它。

不幸的是,对于需要高性能计算(HPC)进行处理的生命科学、气象、制药、采矿、医疗、政府、学术的企业和机构来说,全部采用Hadoop是不可能的。由于文件规模较大,处理需求极其严格,采用数据中心或与采用云计算都不是很好的方案。

简而言之,高性能计算(HPC)是一个在数据中心内部运行的大数据平台的完美示例。正因为如此,企业如何确保其投资巨大的硬件完成需要的工作成为了一个挑战。

大数据Hadoop和HPC平台提供商PSCC Labs首席战略官Alex Lesser表示:“这是必须使用HPC来处理其大数据的许多公司面临的挑战。大多数这些公司都有支持传统IT基础设施,他们很自然地采用了这种思路,自己构建Hadoop分析计算环境,因为这使用了他们已经熟悉的商用硬件,但是对于高性能计算(HPC)来说,其响应通常是让供应商来处理。”

考虑采用高性能计算(HPC)的公司需要采取以下四个步骤:

1.确保企业高层对高性能计算(HPC)的支持

企业的高层管理人员和董事会成员不一定要求是高性能计算领域的专家,但绝不能没有他们的理解和支持。这些管理人员都应该对高性能计算(HPC)有足够的了解,以及可以为企业明确支持可能制定的大规模硬件、软件和培训投资。这意味着他们必须在两个方面受到教育:(1)HPC是什么,为什么它与普通分析不同,需要采用特殊的硬件和软件。(2)为什么企业需要使用HPC而不是原有的分析来实现其业务目标。这两项教育工作都应由首席信息官(CIO)或首席开发官(CDO)负责。

Lesser表示:“采用HPC的最积极的公司是那些相信他们真正的科技公司,他们指的是亚马逊AWS云服务,最初只是亚马逊公司的零售业务,现在已成为一个庞大的利润中心。”

2.考虑一个可以自定义的预配置硬件平台

PSSC Labs等公司提供预打包和预配置的HPC硬件。“我们有一个基于HPC最佳实践的基本软件包,可以与客户一起根据客户的计算需求定制这个基础软件包。”Lesser说,他指出几乎每个数据中心都必须进行一些定制。

3.了解回报

与任何IT投资一样,HPC必须符合成本效益,并且企业应该能够获得投资回报(ROI),这一点在管理层和董事会的头脑中已经阐明。“一个很好的例子是飞机设计。”Lesser说。 “高性能计算(HPC)的投资规模很大,但是当公司发现它可以使用HPC进行设计模拟并获得5个9的准确性,并且不再需要租用物理风洞时,就会很快收回了HPC投资。”

4.培训自己的IT员工

HPC计算对企业的IT员工来说不是一个简单的过渡,但是如果企业要运行内部部署操作,则应该让团队定位以实现自给自足。

最初,企业可能需要聘请外部咨询人员才能开始工作。但咨询任务的目标应始终是双重目标:(1)让HPC应用程序继续运行,(2)将知识传授给员工,以便他们能够接管操作。企业不应该满足于此。

HPC团队的核心是需要一名数据科学家,他能够开发高性能计算所需的高度复杂的算法来回答企业的问题。它还需要一名精通C +或Fortran技能,并能够在并行处理环境中工作的强大系统的程序员,或者是网络通信专家。

“最重要的是,如果企业每两周要运行一次或两次工作,就应该到云端来承载其HPC。”Lesser说,“但是如果企业正在使用HPC资源和运行作业,如制药公司或生物学公司可能每天多次运行,那么在云端运行就会浪费资金,应该考虑运行自己的内部操作。”

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Panda dengan mudah membaca data daripada pangkalan data SQL Panda dengan mudah membaca data daripada pangkalan data SQL Jan 09, 2024 pm 10:45 PM

Alat pemprosesan data: Pandas membaca data daripada pangkalan data SQL dan memerlukan contoh kod khusus Memandangkan jumlah data terus berkembang dan kerumitannya meningkat, pemprosesan data telah menjadi bahagian penting dalam masyarakat moden. Dalam proses pemprosesan data, Pandas telah menjadi salah satu alat pilihan untuk ramai penganalisis dan saintis data. Artikel ini akan memperkenalkan cara menggunakan pustaka Pandas untuk membaca data daripada pangkalan data SQL dan menyediakan beberapa contoh kod khusus. Pandas ialah alat pemprosesan dan analisis data yang berkuasa berdasarkan Python

Petua Pengaturcaraan Berprestasi Tinggi C++: Mengoptimumkan Kod untuk Pemprosesan Data Berskala Besar Petua Pengaturcaraan Berprestasi Tinggi C++: Mengoptimumkan Kod untuk Pemprosesan Data Berskala Besar Nov 27, 2023 am 08:29 AM

C++ ialah bahasa pengaturcaraan berprestasi tinggi yang menyediakan pembangun dengan fleksibiliti dan skalabiliti. Terutamanya dalam senario pemprosesan data berskala besar, kecekapan dan kelajuan pengkomputeran pantas C++ adalah sangat penting. Artikel ini akan memperkenalkan beberapa teknik untuk mengoptimumkan kod C++ untuk menampung keperluan pemprosesan data berskala besar. Menggunakan bekas STL dan bukannya tatasusunan tradisional Dalam pengaturcaraan C++, tatasusunan ialah salah satu struktur data yang biasa digunakan. Walau bagaimanapun, dalam pemprosesan data berskala besar, menggunakan bekas STL, seperti vektor, deque, senarai dan set, dsb., boleh menjadi lebih

PHP dan WebSocket: Membina aplikasi masa nyata berprestasi tinggi PHP dan WebSocket: Membina aplikasi masa nyata berprestasi tinggi Dec 17, 2023 pm 12:58 PM

PHP dan WebSocket: Membina aplikasi masa nyata berprestasi tinggi Apabila Internet berkembang dan keperluan pengguna meningkat, aplikasi masa nyata menjadi semakin biasa. Protokol HTTP tradisional mempunyai beberapa had semasa memproses data masa nyata, seperti keperluan untuk mengundi yang kerap atau mengundi panjang untuk mendapatkan data terkini. Untuk menyelesaikan masalah ini, WebSocket wujud. WebSocket ialah protokol komunikasi lanjutan yang menyediakan keupayaan komunikasi dua hala, membenarkan penghantaran dan penerimaan masa nyata antara penyemak imbas dan pelayan.

Komputer manakah yang harus dipilih oleh jurusan Sains Maklumat Geografi? Komputer manakah yang harus dipilih oleh jurusan Sains Maklumat Geografi? Jan 13, 2024 am 08:00 AM

Komputer yang disyorkan sesuai untuk pelajar jurusan sains maklumat geografi 1. Cadangan 2. Pelajar jurusan sains maklumat geografi perlu memproses sejumlah besar data geografi dan menjalankan analisis maklumat geografi yang kompleks, jadi mereka memerlukan komputer dengan prestasi yang kukuh. Komputer dengan konfigurasi tinggi boleh memberikan kelajuan pemprosesan yang lebih pantas dan ruang storan yang lebih besar, dan boleh memenuhi keperluan profesional dengan lebih baik. 3. Adalah disyorkan untuk memilih komputer yang dilengkapi dengan pemproses berprestasi tinggi dan memori berkapasiti besar, yang boleh meningkatkan kecekapan pemprosesan dan analisis data. Di samping itu, memilih komputer dengan ruang storan yang lebih besar dan paparan resolusi tinggi boleh memaparkan data dan hasil geografi dengan lebih baik. Di samping itu, memandangkan pelajar jurusan sains maklumat geografi mungkin perlu membangunkan dan memprogram perisian sistem maklumat geografi (GIS), pilih komputer dengan sokongan pemprosesan grafik yang lebih baik.

Bagaimanakah Golang meningkatkan kecekapan pemprosesan data? Bagaimanakah Golang meningkatkan kecekapan pemprosesan data? May 08, 2024 pm 06:03 PM

Golang meningkatkan kecekapan pemprosesan data melalui konkurensi, pengurusan memori yang cekap, struktur data asli dan perpustakaan pihak ketiga yang kaya. Kelebihan khusus termasuk: Pemprosesan selari: Coroutine menyokong pelaksanaan berbilang tugas pada masa yang sama. Pengurusan memori yang cekap: Mekanisme kutipan sampah secara automatik menguruskan memori. Struktur data yang cekap: Struktur data seperti kepingan, peta dan saluran mengakses dan memproses data dengan pantas. Perpustakaan pihak ketiga: meliputi pelbagai perpustakaan pemprosesan data seperti fasthttp dan x/text.

Gunakan Redis untuk meningkatkan kecekapan pemprosesan data aplikasi Laravel Gunakan Redis untuk meningkatkan kecekapan pemprosesan data aplikasi Laravel Mar 06, 2024 pm 03:45 PM

Gunakan Redis untuk meningkatkan kecekapan pemprosesan data aplikasi Laravel Dengan pembangunan berterusan aplikasi Internet, kecekapan pemprosesan data telah menjadi salah satu fokus pembangun. Apabila membangunkan aplikasi berdasarkan rangka kerja Laravel, kami boleh menggunakan Redis untuk meningkatkan kecekapan pemprosesan data dan mencapai capaian pantas dan caching data. Artikel ini akan memperkenalkan cara menggunakan Redis untuk pemprosesan data dalam aplikasi Laravel dan memberikan contoh kod khusus. 1. Pengenalan kepada Redis Redis ialah data dalam memori berprestasi tinggi

Bagaimanakah keupayaan pemprosesan data dalam Laravel dan CodeIgniter dibandingkan? Bagaimanakah keupayaan pemprosesan data dalam Laravel dan CodeIgniter dibandingkan? Jun 01, 2024 pm 01:34 PM

Bandingkan keupayaan pemprosesan data Laravel dan CodeIgniter: ORM: Laravel menggunakan EloquentORM, yang menyediakan pemetaan hubungan kelas-objek, manakala CodeIgniter menggunakan ActiveRecord untuk mewakili model pangkalan data sebagai subkelas kelas PHP. Pembina pertanyaan: Laravel mempunyai API pertanyaan berantai yang fleksibel, manakala pembina pertanyaan CodeIgniter lebih ringkas dan berasaskan tatasusunan. Pengesahan data: Laravel menyediakan kelas Pengesah yang menyokong peraturan pengesahan tersuai, manakala CodeIgniter mempunyai kurang fungsi pengesahan terbina dalam dan memerlukan pengekodan manual peraturan tersuai. Kes praktikal: Contoh pendaftaran pengguna menunjukkan Lar

Membandingkan perangkak Golang dan Python: analisis perbezaan dalam anti-rangkak, pemprosesan data dan pemilihan rangka kerja Membandingkan perangkak Golang dan Python: analisis perbezaan dalam anti-rangkak, pemprosesan data dan pemilihan rangka kerja Jan 20, 2024 am 09:45 AM

Penerokaan mendalam tentang persamaan dan perbezaan antara perangkak Golang dan perangkak Python: tindak balas anti-merangkak, pemprosesan data dan pemilihan rangka kerja Pengenalan: Dalam beberapa tahun kebelakangan ini, dengan perkembangan pesat Internet, jumlah data pada rangkaian telah menunjukkan eksplosif. pertumbuhan. Sebagai cara teknikal untuk mendapatkan data Internet, perangkak telah menarik perhatian pembangun. Dua bahasa arus perdana iaitu Golang dan Python masing-masing mempunyai kelebihan dan ciri tersendiri. Artikel ini akan menyelidiki persamaan dan perbezaan antara perangkak Golang dan perangkak Python, termasuk respons anti-merangkak dan pemprosesan data.