Hive2MySQL初步架构_MySQL-MySQL 튜토리얼-php.cn

系统简介

模块简介

집

데이터 베이스

MySQL 튜토리얼

Hive2MySQL初步架构_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 01:07 PM

系统简介

本系统负责将Hive处理后的数据导出到MySQL服务器上，采用 主/从 架构。zeus2将待导出的数据信息放到zookeeper上，Zookeeper将该信息发送给master。master通过JobWatcher接收待处理的表信息，将这些信息转换为任务，并分发给client处理。当client处理完成时，会更新MySQL上数据处理表，表示该部分任务已经处理完成

模块简介

master

简介
为服务，会一直运行。包含接收zookeeper上传来的待导出数据的元信息、任务导出、任务超时处理、任务执行完成后的元数据更新、告警等功能
流程
1. 启动master服务
2. 通过JobWatcher线程获取待处理的任务，并更新到队列MasterContext.finishedTZ中
3. MasterContext中加入一个线程，扫描队列MasterContext.finishedTZ，如果有任务，则开始解析任务并进行任务分发
4. 任务分发的时候，将分发任务加入到executor，执行完成的时候，得到返回码，并根据返回码，进行相应的处理
5. MasterContext中加入一个线程，用于监控超时的client，如果超时，则将该client加入到超时列表中，以后不进行分发
关键点
1. MySQL节点的选择
- 需求
  为了后续计算的方便，需要将能存储在一个MySQL服务器上的数据全部导出到一个节点上，例如上个月站点 A 导出到 MySQL1 上，这个月，还得将站点 A 的数据导出到节点 MySQL1 上。
- 解决方案
  导出时，为了保证每次数据都导出到一个节点上去，需要维持一张site和host间对应的关系表。而部分站点的数据非常大，会超过MySQL服务器的单表阈值，这样部分站点的数据需要分发到不同的节点上去。site和节点之间的关系不是一一对应的。而大站点只是用户中的一部分，还存在一些小站点，一个MySQL服务器可能存放数个站点的数据。为了应对这些挑战，我们将站点分为三种SITE_LEVEL：SMALL_SITE、BIG_SITE、HUG_SITE，并分别采用不同的导出策略。
  SMALL_SITE 网站的数据量较小，一个站点只存放在一个MySQL服务器上去。所有的数据都会导出到一台MYSQL服务器上去。当数据超过MYSQL服务器单表限制的时候，会将数据导出到负载最小的MySQL服务器上去。某site很长时间以来一直使用我们的服务器时，可能会出现这种情况。
  BIG_SITE 导出的策略和SMALL_SITE一样，但是获取MySQL服务器的方法和SMALL_SITE不一样，BIG_SITE按照轮询的方式将HIVE上的数据导出到MYSQL中去，即今天的数据导出到 MYSQL1 上，明天的数据可能导出到MySQL2上。而SMALL_SITE的数据均导出到一台MYSQL服务器上。
  HUG_SITE 将站点每天的访问信息分发到不同的MYSQL服务器上去
注解
1. HDFS路径
  /user/hive/warehouse/ptmind_data.db/${tableName}_${tableType}/sitetz=${timezone}/partdt=${date}/partsid=${sid}
  如 /user/hive/warehouse/ptmind_data.db/sum_page_visits_stats_olap_d/sitetz=E0800/partdt=2014-06-02/partsid=56fbce4e
2. tableType
  明细表的类型为x,其他表暂时只支持天d
```
private String getTabType(String tableName) {if (tableName.equals(Constant.TB_1)) { return x;}else { return d;}}
```
로그인 후 복사

client

简介
1. 部署在MySQL服务器上
2. 执行HDFS2MySQL的导出任务
流程
1. 通过clientBootstrap监控消息
2. 当监控到任务时，执行HDFS2MySQL的导出任务
  2.1 通过shell脚本，从HDFS上下载数据
  2.2 将元数据更新到MySQL服务器中
  2.3 删除本地文件
  2.4 根据表中插入行的数目判断数据是否导出成功
  2.5 将执行情况返回给master
3. 定时向master发送心跳信息
注解

存储的本地路径： /tmp/ptbalancer/data/${tableName}_${tableType}_${date}_${当前时间戳}

节点间通信

中间件 netty

master ServerBootstrap

client ClientBootstrap

传输数据 PB

相比XML，PB有更好的传输效率、压缩率更高、解析速度更快

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7520

Cakephp 튜토리얼

1378

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

InnoDB 전체 텍스트 검색 기능을 설명하십시오. Apr 02, 2025 pm 06:09 PM

InnoDB의 전체 텍스트 검색 기능은 매우 강력하여 데이터베이스 쿼리 효율성과 대량의 텍스트 데이터를 처리 할 수있는 능력을 크게 향상시킬 수 있습니다. 1) InnoDB는 기본 및 고급 검색 쿼리를 지원하는 역 색인화를 통해 전체 텍스트 검색을 구현합니다. 2) 매치 및 키워드를 사용하여 검색, 부울 모드 및 문구 검색을 지원합니다. 3) 최적화 방법에는 워드 세분화 기술 사용, 인덱스의 주기적 재건 및 캐시 크기 조정, 성능과 정확도를 향상시키는 것이 포함됩니다.

Alter Table 문을 사용하여 MySQL에서 테이블을 어떻게 변경합니까? Mar 19, 2025 pm 03:51 PM

이 기사는 MySQL의 Alter Table 문을 사용하여 열 추가/드롭 테이블/열 변경 및 열 데이터 유형 변경을 포함하여 테이블을 수정하는 것에 대해 설명합니다.

MySQL 연결에 대한 SSL/TLS 암호화를 어떻게 구성합니까? Mar 18, 2025 pm 12:01 PM

기사는 인증서 생성 및 확인을 포함하여 MySQL에 대한 SSL/TLS 암호화 구성에 대해 설명합니다. 주요 문제는 자체 서명 인증서의 보안 영향을 사용하는 것입니다. [문자 수 : 159]

MySQL에서 인덱스를 사용하는 것보다 전체 테이블 스캔이 더 빠를 수 있습니까? Apr 09, 2025 am 12:05 AM

전체 테이블 스캔은 MySQL에서 인덱스를 사용하는 것보다 빠를 수 있습니다. 특정 사례는 다음과 같습니다. 1) 데이터 볼륨은 작습니다. 2) 쿼리가 많은 양의 데이터를 반환 할 때; 3) 인덱스 열이 매우 선택적이지 않은 경우; 4) 복잡한 쿼리시. 쿼리 계획을 분석하고 인덱스 최적화, 과도한 인덱스를 피하고 정기적으로 테이블을 유지 관리하면 실제 응용 프로그램에서 최상의 선택을 할 수 있습니다.

인기있는 MySQL GUI 도구는 무엇입니까 (예 : MySQL Workbench, Phpmyadmin)? Mar 21, 2025 pm 06:28 PM

기사는 MySQL Workbench 및 Phpmyadmin과 같은 인기있는 MySQL GUI 도구에 대해 논의하여 초보자 및 고급 사용자를위한 기능과 적합성을 비교합니다. [159 자].

MySQL에서 큰 데이터 세트를 어떻게 처리합니까? Mar 21, 2025 pm 12:15 PM

기사는 MySQL에서 파티셔닝, 샤딩, 인덱싱 및 쿼리 최적화를 포함하여 대규모 데이터 세트를 처리하기위한 전략에 대해 설명합니다.

InnoDB에서 클러스터 된 인덱스와 비 클러스터 된 인덱스 (2 차 지수)의 차이. Apr 02, 2025 pm 06:25 PM

클러스터 인덱스와 비 클러스터 인덱스의 차이점은 1. 클러스터 된 인덱스는 인덱스 구조에 데이터 행을 저장하며, 이는 기본 키 및 범위별로 쿼리에 적합합니다. 2. 클러스터되지 않은 인덱스는 인덱스 키 값과 포인터를 데이터 행으로 저장하며 비 예산 키 열 쿼리에 적합합니다.

Windows 7에 MySQL을 설치할 수 있습니까? Apr 08, 2025 pm 03:21 PM

예, MySQL은 Windows 7에 설치 될 수 있으며 Microsoft는 Windows 7 지원을 중단했지만 MySQL은 여전히 호환됩니다. 그러나 설치 프로세스 중에 다음 지점이 표시되어야합니다. Windows 용 MySQL 설치 프로그램을 다운로드하십시오. MySQL의 적절한 버전 (커뮤니티 또는 기업)을 선택하십시오. 설치 프로세스 중에 적절한 설치 디렉토리 및 문자를 선택하십시오. 루트 사용자 비밀번호를 설정하고 올바르게 유지하십시오. 테스트를 위해 데이터베이스에 연결하십시오. Windows 7의 호환성 및 보안 문제에 주목하고 지원되는 운영 체제로 업그레이드하는 것이 좋습니다.

See all articles

Hive2MySQL初步架构_MySQL

系统简介

模块简介

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제