헤드라인 빅데이터 아키텍처의 몇 가지 핵심 기술

빅데이터 아키텍처의 몇 가지 핵심 기술

Mar 10, 2018 am 09:41 AM
열쇠 빅데이터 기술

엔터프라이즈 IT 인프라 플랫폼을 재구축하는 것은 복잡한 작업입니다. 플랫폼 변경은 주요 비즈니스 동인의 변화에 ​​의해 촉발되는 경우가 많으며, 이것이 바로 현재 일어나고 있는 일입니다. 간단히 말해서, 거의 30년 동안 엔터프라이즈 IT 기술을 지배해 온 플랫폼은 더 이상 비즈니스를 발전시키는 데 필요한 워크로드 수요를 충족할 수 없습니다.

빅데이터 아키텍처의 몇 가지 핵심 기술

디지털 혁신의 핵심은 비즈니스에서 가장 가치 있는 것이 된 데이터입니다. 조직은 호환되지 않는 형식, 기존 데이터베이스의 한계, 여러 소스의 데이터를 유연하게 결합할 수 없음으로 인해 소비하는 데이터로 인해 오랫동안 어려움을 겪어 왔습니다. 새로운 기술의 출현은 이 모든 것을 변화시킬 것을 약속합니다.

소프트웨어 배포 모델을 개선하는 것은 데이터 사용에 대한 장벽을 제거하는 주요 측면입니다. "데이터 민첩성"이 향상되려면 더욱 유연한 데이터베이스와 확장성이 뛰어난 실시간 스트리밍 플랫폼이 필요합니다. 실제로 기업에 유연한 실시간 "데이터 패브릭"을 제공하기 위해 결합할 수 있는 기본 기술이 7개 이상 있습니다.

대체되는 기술과 달리 이 7가지 소프트웨어 혁신은 많은 사용자의 요구와 다양한 사용 사례를 충족하도록 확장할 수 있습니다. 기업의 경우 더 빠르고 정보에 기반한 결정을 내리고 더 나은 고객 경험을 창출할 수 있습니다.

1. NoSQL 데이터베이스

RDBMS는 거의 30년 동안 데이터베이스 시장을 장악해 왔습니다. 그러나 데이터 볼륨의 지속적인 증가와 데이터 처리 속도의 가속화로 인해 기존 관계형 데이터베이스는 단점을 드러냈습니다. NoSQL 데이터베이스는 속도와 확장 능력으로 인해 그 자리를 대신하고 있습니다. 문서 데이터베이스의 경우 소프트웨어 엔지니어링 관점에서 더 간단한 모델을 제공합니다. 이 단순한 개발 모델은 시장 출시 시간을 단축하고 기업이 고객 및 내부 사용자 요구 사항에 보다 신속하게 대응할 수 있도록 도와줍니다.

2. 라이브 스트리밍 플랫폼

고객에게 실시간으로 응답하는 것은 고객 경험에 매우 중요합니다. 소비자 대면 산업이 지난 10년 동안 엄청난 혼란을 겪었다는 것은 놀라운 일이 아닙니다. 이는 실시간으로 사용자에게 반응하는 기업의 능력과 관련이 있습니다. 실시간 모델로 전환하려면 이벤트 스트리밍이 필요합니다.

메시지 기반 앱은 수년간 사용되어 왔습니다. 그러나 오늘날의 스트리밍 플랫폼은 그 어느 때보다 훨씬 더 크고 저렴합니다. 최근 스트리밍 기술의 발전으로 비즈니스를 최적화할 수 있는 다양한 새로운 방법이 열렸습니다. 이벤트 스트리밍은 소프트웨어 개발 및 테스트 팀에 실시간 피드백 루프를 제공함으로써 기업이 제품 품질을 개선하고 새로운 소프트웨어를 더 빠르게 개발하는 데 도움이 될 수 있습니다.

3. Docker 및 컨테이너

컨테이너는 개발자와 운영자는 물론 조직 자체에도 큰 이점을 제공합니다. 인프라 격리에 대한 전통적인 접근 방식은 각 워크로드에 별도의 고정 리소스 블록(물리적 서버든 가상 머신이든)을 할당하는 정적 파티셔닝입니다. 정적 파티셔닝을 사용하면 문제 해결이 더 쉬워지지만 실제로 활용도가 낮은 하드웨어로 인해 비용이 많이 듭니다. 예를 들어, 평균적인 웹 서버는 사용 가능한 총 컴퓨팅 성능의 10%만을 사용합니다.

컨테이너 기술의 가장 큰 장점은 새로운 격리 방법을 만들 수 있다는 것입니다. 컨테이너를 가장 잘 아는 사람들은 Ansible, Puppet 또는 Chef와 같은 도구를 사용하여 동일한 이점을 얻을 수 있다고 믿을 수 있지만 실제로 이러한 기술은 매우 상호 보완적입니다. 또한 기업이 아무리 노력해도 이러한 자동화 도구는 다양한 인프라와 하드웨어 설정 간에 워크로드를 자유롭게 이동하는 데 필요한 격리를 달성하지 못합니다. 동일한 컨테이너는 온프레미스 데이터 센터의 베어메탈 하드웨어나 퍼블릭 클라우드의 가상 머신에서 아무런 변경 없이 실행될 수 있습니다. 이것이 진정한 워크로드 이동성입니다.

4. 컨테이너 저장소

컨테이너 저장소는 민첩성에 매우 중요합니다. 컨테이너 이미지를 구축하기 위한 DevOps 프로세스와 이를 저장하기 위한 휴지통이 없으면 각 컨테이너를 실행하기 전에 모든 머신에 구축해야 합니다. 리포지토리를 사용하면 리포지토리를 읽는 머신에서 컨테이너 이미지를 시작할 수 있습니다. 여러 데이터 센터에서 처리할 때 이는 더욱 복잡해집니다. 한 데이터 센터에 컨테이너 이미지를 구축한 경우 이미지를 다른 데이터 센터로 어떻게 이동합니까? 이상적으로는 통합 데이터 플랫폼을 활용하여 기업이 데이터 센터 간에 저장소를 미러링할 수 있는 능력을 갖게 됩니다.

여기서 중요한 세부 사항은 온프레미스와 클라우드 컴퓨팅 간의 미러링 기능이 기업 데이터 센터 간의 미러링 기능과 크게 다를 수 있다는 것입니다. 융합 데이터 플랫폼은 조직에서 데이터 센터 인프라 또는 클라우드 컴퓨팅 인프라를 사용하는지 여부에 관계없이 이러한 기능을 제공함으로써 기업의 이 문제를 해결합니다.

5. 컨테이너 오케스트레이션

각 컨테이너에는 정적 하드웨어 파티션이 아닌 자체 개인 운영 체제가 있는 것으로 보입니다. 가상 머신과 달리 컨테이너에는 컴퓨팅과 메모리의 정적 분할이 필요하지 않습니다. 이를 통해 관리자는 대용량 메모리에 대한 걱정 없이 서버에서 많은 수의 컨테이너를 시작할 수 있습니다. Kubernetes와 같은 컨테이너 오케스트레이션 도구를 사용하면 컨테이너를 시작하고 이동하고 환경 내 다른 곳에서 다시 시작하는 것이 매우 쉬워집니다.

새로운 인프라 구성 요소가 배치된 후 MapR-DB 또는 MongoDB와 같은 문서 데이터베이스, MapR-ES 또는 Apache Kafka(Kubernetes와 같은 오케스트레이션 도구)와 같은 이벤트 스트리밍 플랫폼 및 Docker 컨테이너 구축을 위한 DevOps 프로세스를 구현한 후 소프트웨어를 배포하려면 이러한 컨테이너에 어떤 구성 요소를 배포해야 하는지에 대한 질문을 이해해야 합니다.

6. 마이크로서비스

역사적으로 마이크로서비스의 개념은 새로운 것이 아닙니다. 오늘날 차이점은 활성화 기술(NoSQL 데이터베이스, 이벤트 스트리밍, 컨테이너 오케스트레이션)이 수천 개의 마이크로서비스 생성에 따라 확장될 수 있다는 것입니다. 데이터 스토리지, 이벤트 스트리밍 및 아키텍처 오케스트레이션에 대한 이러한 새로운 접근 방식이 없다면 대규모 마이크로서비스 배포는 불가능합니다. 대량의 데이터, 이벤트, 컨테이너 인스턴스를 관리하는 데 필요한 인프라는 필요한 수준으로 확장되지 않습니다.

마이크로서비스의 핵심은 민첩성 제공입니다. 마이크로서비스는 일반적으로 하나의 기능 또는 작은 기능 세트로 구성됩니다. 기능적 작업 단위가 더 작고 집중적일수록 서비스를 생성, 테스트 및 배포하기가 더 쉽습니다. 이러한 서비스는 분리되어야 합니다. 그렇지 않으면 기업은 민첩성을 갖춘 마이크로서비스의 가능성을 잃게 됩니다. 마이크로서비스는 다른 서비스에 의존할 수 있지만 일반적으로 로드 밸런싱된 REST API 또는 이벤트 스트리밍을 통해 이루어집니다. 이벤트 스트리밍을 사용하면 기업은 요청 및 응답 주제를 사용하여 이벤트 기록을 쉽게 추적할 수 있습니다. 이 접근 방식은 전체 요청 흐름과 요청의 모든 데이터를 언제든지 재생할 수 있으므로 문제 해결에 상당한 이점이 있습니다.

마이크로서비스는 작은 작업을 캡슐화하고 서로 분리되어 있기 때문에 시간이 지남에 따라 아무런 장벽 없이 서비스를 교체하거나 업그레이드할 수 있습니다. 레거시 모드에서 RPC와 같은 긴밀한 결합에 의존하려면 모든 연결을 닫았다가 다시 설정해야 했습니다. 로드 밸런싱은 수동 구성으로 인해 오류가 발생하기 쉽기 때문에 이를 구현하는 데 큰 문제가 됩니다.

7. 서비스로서의 기능

마이크로서비스가 업계를 지배하는 것처럼 서버리스 컴퓨팅, 더 정확하게는 FaaS(Functions as a Service)라고 부르는 기술의 등장도 보게 될 것입니다. FaaS는 경량 프레임워크 덕분에 코드를 경량 프레임워크로 래핑하고, 컨테이너에 구축하고, 요청 시(일종의 트리거 기반) 실행한 다음, 자동으로 로드 밸런싱할 수 있는 방식으로 마이크로서비스를 생성합니다. FaaS의 장점은 개발자가 거의 전적으로 해당 기능에 집중할 수 있다는 것입니다. 따라서 FaaS는 마이크로서비스 접근 방식의 논리적 결론처럼 보입니다.

이벤트 트리거는 FaaS의 핵심 구성 요소입니다. 이것이 없으면 작업을 수행해야 할 때만 함수를 호출하고 리소스를 소비할 수 있습니다. 기능의 자동 호출은 FaaS를 정말 가치있게 만듭니다. 누군가가 사용자 프로필을 읽을 때마다 보안 팀에 알리기 위해 실행해야 하는 기능인 감사 이벤트가 있다고 상상해 보십시오. 보다 구체적으로 특정 유형의 레코드만 필터링할 수 있습니다. 선택 사항일 수도 있지만 결국 완전히 사용자 정의 가능한 비즈니스 기능입니다. FaaS와 같은 배포 모델을 사용하면 이러한 워크플로를 달성하는 것이 매우 간단하다는 점을 기억하는 것이 중요합니다.

이벤트 함께 퍼팅

서비스를 트리거하는 이면의 마법은 실제로 이벤트 스트림의 이벤트입니다. 특정 유형의 이벤트는 다른 이벤트보다 더 자주 트리거로 사용되지만 비즈니스에서 트리거가 되기를 원하는 모든 이벤트는 트리거가 될 수 있습니다. 트리거 이벤트는 문서 업데이트, 새 문서에서 OCR 프로세스를 실행한 다음 OCR 프로세스의 텍스트를 NoSQL 데이터베이스에 추가하는 것일 수 있습니다. 좀 더 흥미롭게 생각해보면, 이미지가 업로드될 때마다 머신러닝 프레임워크를 통해 이미지 인식과 채점을 할 수 있다. 여기에는 근본적인 제한이 없습니다. 트리거 이벤트가 정의되면 일부 이벤트가 발생하고 이벤트가 함수를 트리거하고 함수가 작업을 완료합니다.

FaaS는 마이크로서비스 채택의 다음 단계가 될 것입니다. 그러나 FaaS에 접근할 때 고려해야 할 주요 요소 중 하나가 바로 공급업체 종속성입니다. FaaS는 개발자에게 좋은 특정 스토리지 메커니즘, 특정 하드웨어 인프라 및 오케스트레이션을 숨깁니다. 그러나 이러한 추상화로 인해 호스팅된 FaaS 제품은 IT 업계에서 이제까지 볼 수 없었던 공급업체 종속에 대한 가장 큰 기회 중 하나를 나타냅니다. 이러한 API는 표준화되지 않았기 때문에 퍼블릭 클라우드의 FaaS 제품에서 마이그레이션하는 것은 완료된 작업의 거의 100%를 잃지 않고는 거의 불가능합니다. 융합된 데이터 플랫폼의 이벤트를 활용하여 FaaS를 보다 구조화된 방식으로 접근하면 클라우드 제공업체 간 이동이 더 쉬워질 것입니다.

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Stable Diffusion 3 논문이 드디어 공개되고, 아키텍처의 세부 사항이 공개되어 Sora를 재현하는 데 도움이 될까요? Stable Diffusion 3 논문이 드디어 공개되고, 아키텍처의 세부 사항이 공개되어 Sora를 재현하는 데 도움이 될까요? Mar 06, 2024 pm 05:34 PM

StableDiffusion3의 논문이 드디어 나왔습니다! 이 모델은 2주 전에 출시되었으며 Sora와 동일한 DiT(DiffusionTransformer) 아키텍처를 사용합니다. 출시되자마자 큰 화제를 불러일으켰습니다. 이전 버전과 비교하여 StableDiffusion3에서 생성된 이미지의 품질이 크게 향상되었습니다. 이제 다중 테마 프롬프트를 지원하고 텍스트 쓰기 효과도 향상되었으며 더 이상 잘못된 문자가 표시되지 않습니다. StabilityAI는 StableDiffusion3이 800M에서 8B 범위의 매개변수 크기를 가진 일련의 모델임을 지적했습니다. 이 매개변수 범위는 모델이 많은 휴대용 장치에서 직접 실행될 수 있어 AI 사용이 크게 줄어든다는 것을 의미합니다.

PHP의 빅데이터 구조 처리 능력 PHP의 빅데이터 구조 처리 능력 May 08, 2024 am 10:24 AM

빅 데이터 구조 처리 기술: 청킹(Chunking): 데이터 세트를 분할하고 청크로 처리하여 메모리 소비를 줄입니다. 생성기: 전체 데이터 세트를 로드하지 않고 데이터 항목을 하나씩 생성하므로 무제한 데이터 세트에 적합합니다. 스트리밍: 파일을 읽거나 결과를 한 줄씩 쿼리하므로 대용량 파일이나 원격 데이터에 적합합니다. 외부 저장소: 매우 큰 데이터 세트의 경우 데이터를 데이터베이스 또는 NoSQL에 저장합니다.

DualBEV: BEVFormer 및 BEVDet4D를 크게 능가하는 책을 펼치세요! DualBEV: BEVFormer 및 BEVDet4D를 크게 능가하는 책을 펼치세요! Mar 21, 2024 pm 05:21 PM

본 논문에서는 자율 주행에서 다양한 시야각(예: 원근 및 조감도)에서 객체를 정확하게 감지하는 문제, 특히 원근(PV) 공간에서 조감(BEV) 공간으로 기능을 효과적으로 변환하는 방법을 탐구합니다. VT(Visual Transformation) 모듈을 통해 구현됩니다. 기존 방법은 크게 2D에서 3D로, 3D에서 2D로 변환하는 두 가지 전략으로 나뉩니다. 2D에서 3D로의 방법은 깊이 확률을 예측하여 조밀한 2D 특징을 개선하지만, 특히 먼 영역에서는 깊이 예측의 본질적인 불확실성으로 인해 부정확성이 발생할 수 있습니다. 3D에서 2D로의 방법은 일반적으로 3D 쿼리를 사용하여 2D 기능을 샘플링하고 Transformer를 통해 3D와 2D 기능 간의 대응에 대한 주의 가중치를 학습하므로 계산 및 배포 시간이 늘어납니다.

2024년 AEC/O 산업의 5가지 주요 개발 동향 2024년 AEC/O 산업의 5가지 주요 개발 동향 Apr 19, 2024 pm 02:50 PM

AEC/O(Architecture, Engineering & Construction/Operation)는 건설 산업 분야에서 건축 설계, 엔지니어링 설계, 시공 및 운영을 제공하는 종합 서비스를 말합니다. 2024년 AEC/O 산업은 기술 발전으로 인해 변화하는 도전에 직면하게 될 것입니다. 올해는 첨단 기술이 집약되어 ​​설계, 시공, 운영의 패러다임 전환을 예고하는 해가 될 것으로 예상됩니다. 이러한 변화에 대응하여 업계에서는 빠르게 변화하는 세계의 요구 사항에 적응하기 위해 작업 프로세스를 재정의하고 우선 순위를 조정하며 협업을 강화하고 있습니다. AEC/O 산업의 다음 5가지 주요 트렌드는 2024년 핵심 주제가 될 것이며, 더욱 통합되고 대응력이 뛰어나며 지속 가능한 미래로 나아갈 것을 권장합니다. 통합 공급망, 스마트 제조

58 초상화 플랫폼 구축에 알고리즘 적용 58 초상화 플랫폼 구축에 알고리즘 적용 May 09, 2024 am 09:01 AM

1. 58초상화 플랫폼 구축 배경 먼저, 58초상화 플랫폼 구축 배경에 대해 말씀드리겠습니다. 1. 기존 프로파일링 플랫폼의 전통적인 사고로는 더 이상 충분하지 않습니다. 사용자 프로파일링 플랫폼을 구축하려면 여러 비즈니스 라인의 데이터를 통합하여 정확한 사용자 초상화를 구축하는 데이터 웨어하우스 모델링 기능이 필요합니다. 그리고 알고리즘 측면의 기능을 제공해야 하며, 마지막으로 사용자 프로필 데이터를 효율적으로 저장, 쿼리 및 공유하고 프로필 서비스를 제공할 수 있는 데이터 플랫폼 기능도 있어야 합니다. 자체 구축한 비즈니스 프로파일링 플랫폼과 중간 사무실 프로파일링 플랫폼의 주요 차이점은 자체 구축한 프로파일링 플랫폼이 단일 비즈니스 라인에 서비스를 제공하고 필요에 따라 사용자 정의할 수 있다는 것입니다. 모델링하고 보다 일반적인 기능을 제공합니다. 2.58 Zhongtai 초상화 구성 배경의 사용자 초상화

검토! 심층 모델 융합(LLM/기본 모델/연합 학습/미세 조정 등) 검토! 심층 모델 융합(LLM/기본 모델/연합 학습/미세 조정 등) Apr 18, 2024 pm 09:43 PM

9월 23일, 국립방위기술대학교, JD.com 및 베이징 공과대학이 "DeepModelFusion:ASurvey"라는 논문을 발표했습니다. 딥 모델 융합/병합은 여러 딥 러닝 모델의 매개변수나 예측을 단일 모델로 결합하는 새로운 기술입니다. 이는 더 나은 성능을 위해 개별 모델의 편향과 오류를 보상하기 위해 다양한 모델의 기능을 결합합니다. 대규모 딥 러닝 모델(예: LLM 및 기본 모델)에 대한 딥 모델 융합은 높은 계산 비용, 고차원 매개변수 공간, 서로 다른 이종 모델 간의 간섭 등을 포함한 몇 가지 문제에 직면합니다. 이 기사에서는 기존 심층 모델 융합 방법을 네 가지 범주로 나눕니다. (1) 더 나은 초기 모델 융합을 얻기 위해 손실 감소 경로를 통해 가중치 공간의 솔루션을 연결하는 "패턴 연결"

단순한 3D 가우스 그 이상입니다! 최첨단 3D 재구성 기술의 최신 개요 단순한 3D 가우스 그 이상입니다! 최첨단 3D 재구성 기술의 최신 개요 Jun 02, 2024 pm 06:57 PM

위에 작성됨 & 저자의 개인적인 이해는 이미지 기반 3D 재구성은 입력 이미지 세트에서 객체나 장면의 3D 모양을 추론하는 어려운 작업이라는 것입니다. 학습 기반 방법은 3차원 형상을 직접 추정할 수 있는 능력으로 주목을 받았습니다. 이 리뷰 논문은 새로운, 보이지 않는 뷰 생성을 포함한 최첨단 3D 재구성 기술에 중점을 두고 있습니다. 입력 유형, 모델 구조, 출력 표현 및 훈련 전략을 포함하여 가우스 스플래시 방법의 최근 개발에 대한 개요가 제공됩니다. 해결되지 않은 과제와 앞으로의 방향에 대해서도 논의한다. 해당 분야의 급속한 발전과 3D 재구성 방법을 향상할 수 있는 수많은 기회를 고려할 때 알고리즘을 철저히 조사하는 것이 중요해 보입니다. 따라서 이 연구는 가우스 산란의 최근 발전에 대한 포괄적인 개요를 제공합니다. (엄지손가락을 위로 스와이프하세요.

Go 언어에서 빅데이터 프레임워크가 부족한 이유와 해결 방법에 대한 토론 Go 언어에서 빅데이터 프레임워크가 부족한 이유와 해결 방법에 대한 토론 Mar 29, 2024 pm 12:24 PM

오늘날 빅데이터 시대에 데이터 처리 및 분석은 다양한 산업 발전에 중요한 지원 요소가 되었습니다. 개발 효율성이 높고 성능이 뛰어난 프로그래밍 언어로서 Go 언어는 점차 빅데이터 분야에서 주목을 받고 있습니다. 그러나 Go 언어는 Java, Python 등 다른 언어에 비해 빅데이터 프레임워크에 대한 지원이 상대적으로 부족하여 일부 개발자에게 어려움을 초래했습니다. 이 글에서는 Go 언어에서 빅데이터 프레임워크가 부족한 주된 이유를 살펴보고, 그에 따른 솔루션을 제안하고, 구체적인 코드 예제를 통해 이를 설명하겠습니다. 1. 언어로 이동