데이터 베이스 MySQL 튜토리얼 如何在Hadoop中控制map的个数

如何在Hadoop中控制map的个数

Jun 07, 2016 pm 04:34 PM
hadoop map 숫자 제어

转载自:如何在hadoop中控制map的个数hadoop提供了一个设置map个数的参数mapred.map.tasks,我们可以通过这个参数来控制map的个数。但是通过这种方式设置map的个数,并不是每次都有效的。原因是mapred.map.tasks只是一个hadoop的参考数值,最终map的个数,还

转载自:如何在hadoop中控制map的个数 hadoop提供了一个设置map个数的参数mapred.map.tasks,我们可以通过这个参数来控制map的个数。但是通过这种方式设置map的个数,并不是每次都有效的。原因是mapred.map.tasks只是一个hadoop的参考数值,最终map的个数,还取决于其他的因素。 为了方便介绍,先来看几个名词: block_size : hdfs的文件块大小,默认为64M,可以通过参数dfs.block.size设置 total_size : 输入文件整体的大小 input_file_num : 输入文件的个数 (1)默认map个数 如果不进行任何设置,默认的map个数是和blcok_size相关的。 default_num = total_size / block_size; (2)期望大小 可以通过参数mapred.map.tasks来设置程序员期望的map个数,但是这个个数只有在大于default_num的时候,才会生效。 goal_num = mapred.map.tasks; (3)设置处理的文件大小 可以通过mapred.min.split.size 设置每个task处理的文件大小,但是这个大小只有在大于block_size的时候才会生效。 split_size = max(mapred.min.split.size, block_size); split_num = total_size / split_size; (4)计算的map个数 compute_map_num = min(split_num, max(default_num, goal_num)) 除了这些配置以外,mapreduce还要遵循一些原则。 mapreduce的每一个map处理的数据是不能跨越文件的,也就是说max_map_num 原文地址:如何在Hadoop中控制map的个数, 感谢原作者分享。
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

springboot는 yml 파일의 목록, 배열, 지도 컬렉션 및 개체를 어떻게 읽나요? springboot는 yml 파일의 목록, 배열, 지도 컬렉션 및 개체를 어떻게 읽나요? May 11, 2023 am 10:46 AM

application.yml은 목록 컬렉션을 정의합니다. 첫 번째 방법은 @ConfigurationProperties 주석을 사용하여 목록 컬렉션 유형:code:status:-200-300-400-500의 모든 값을 얻는 것입니다. 여기서 주목해야 할 점은 목록 Collection을 정의하고 먼저 구성 클래스 Bean을 정의한 다음 @ConfigurationProperties 주석을 사용하여 목록 컬렉션 값을 얻는다는 것입니다. @Component는 엔티티 클래스를 Spring 관리 @ConfigurationPropertie에 넘겨줍니다.

PHP를 이용한 카메라 제어 : 접속부터 촬영까지 전 과정 분석 PHP를 이용한 카메라 제어 : 접속부터 촬영까지 전 과정 분석 Jul 30, 2023 pm 03:21 PM

PHP를 사용하여 카메라 제어: 연결부터 촬영까지 전체 프로세스를 분석합니다. 화상 통화, 감시 시스템 등 카메라 애플리케이션이 점점 더 널리 보급되고 있습니다. 웹 애플리케이션에서는 PHP를 통해 카메라를 제어하고 작동해야 하는 경우가 많습니다. 이 기사에서는 PHP를 사용하여 카메라 연결부터 촬영까지 전체 과정을 구현하는 방법을 소개합니다. 카메라의 연결 상태를 확인하세요. 카메라 작동을 시작하기 전에 먼저 카메라의 연결 상태를 확인해야 합니다. PHP는 카메라 작동을 위한 확장 라이브러리 비디오를 제공합니다. 다음 코드를 전달할 수 있습니다

Java에서 만료 시간 맵을 설정하는 방법 Java에서 만료 시간 맵을 설정하는 방법 May 04, 2023 am 10:13 AM

1. 기술적 배경 실제 프로젝트 개발에서는 시스템의 가용성과 견고성을 향상시키기 위해 캐싱 미들웨어(예: redis, MemCache 등)를 자주 사용합니다. 하지만 프로젝트가 상대적으로 단순하다면 캐싱을 사용하기 위해 시스템의 복잡성을 높이기 위해 Redis와 같은 미들웨어를 특별히 도입할 필요가 없는 경우가 많습니다. 그렇다면 Java 자체에는 유용한 경량 캐싱 구성 요소가 있습니까? 물론 대답은 '그렇다'이며, 방법은 여러 가지가 있습니다. 일반적인 솔루션에는 ExpiringMap, LoadingCache 및 HashMap 기반 패키징이 포함됩니다. 2. 오래된 삭제 전략, 핫스팟 데이터 워밍업 등 캐시의 공통 기능을 구현하기 위한 기술적 효과 3. ExpiringMap3.

Java 오류: Hadoop 오류, 처리 및 방지 방법 Java 오류: Hadoop 오류, 처리 및 방지 방법 Jun 24, 2023 pm 01:06 PM

Java 오류: Hadoop 오류, 처리 및 방지 방법 Hadoop을 사용하여 빅 데이터를 처리할 때 작업 실행에 영향을 미치고 데이터 처리 실패를 유발할 수 있는 Java 예외 오류가 자주 발생합니다. 이 기사에서는 몇 가지 일반적인 Hadoop 오류를 소개하고 이를 처리하고 방지하는 방법을 제공합니다. Java.lang.OutOfMemoryErrorOutOfMemoryError는 Java 가상 머신의 메모리 부족으로 인해 발생하는 오류입니다. 하둡이 있을 때

미디어 볼륨 조절 팝업을 [영구적으로] 비활성화하는 방법 미디어 볼륨 조절 팝업을 [영구적으로] 비활성화하는 방법 May 24, 2023 pm 10:50 PM

해당 단축키를 이용해 볼륨 레벨을 미세 조정하면 화면에 미디어 볼륨 조절 팝업이 나타납니다. 이는 짜증스러울 수 있으므로 미디어 볼륨 제어 팝업을 영구적으로 비활성화하는 다양한 방법을 알아보려면 계속 읽어보세요. 미디어 볼륨 조절 팝업을 비활성화하는 방법은 무엇입니까? 1. 구글 크롬 작업 표시줄의 윈도우 아이콘을 클릭하고, 상단 검색창에 chrome을 입력한 후, 해당 검색 결과를 선택하면 구글 크롬이 실행됩니다. 주소 표시줄에 다음을 입력하거나 복사하여 붙여넣고 키를 누릅니다. 상단 검색 상자에 chrome://flags 유형 미디어 키를 입력하고 하드웨어 미디어 키 처리 드롭다운 목록에서 비활성화를 선택합니다. 이제 Google Chrome 앱을 종료하고 다시 시작하세요. Google

Java에서 객체를 맵으로 변환하는 방법 - BeanMap을 사용하여 Java에서 객체를 맵으로 변환하는 방법 - BeanMap을 사용하여 May 08, 2023 pm 03:49 PM

javabeans와 map을 변환하는 방법에는 여러 가지가 있습니다. 1. ObjectMapper를 통해 Bean을 json으로 변환한 다음 json을 map으로 변환합니다. 그러나 이 방법은 테스트 후에 10,000개의 Bean이 루프로 변환되었습니다. 12초 걸립니다! ! ! 2. Java Reflection을 통해 Bean 클래스의 속성과 값을 얻은 다음 이를 맵에 해당하는 키-값 쌍으로 변환하는 방법이 두 번째로 좋지만 조금 더 번거롭습니다. 3. 클래스의 net.sf.cglib.beans.BeanMap 메소드를 통해 이 메소드는 매우 효율적입니다. 두 번째 메소드와 차이점은 캐시를 사용하기 때문에 첫 번째 Bean을 생성할 때 초기화해야 한다는 것입니다. 시간.

Nginx 서버에서 맵 모듈을 구성하고 사용하는 방법 Nginx 서버에서 맵 모듈을 구성하고 사용하는 방법 May 21, 2023 pm 05:14 PM

맵 명령은 ngx_http_map_module 모듈에서 제공됩니다. 기본적으로 nginx는 인위적으로 --without-http_map_module을 사용하지 않는 한 이 모듈을 로드합니다. ngx_http_map_module 모듈은 값이 다른 변수의 값과 연관된 변수를 생성할 수 있습니다. 여러 값을 여러 다른 값으로 분류하거나 동시에 매핑하고 변수에 저장하는 것을 허용합니다. 맵 지시어는 변수를 생성하는 데 사용되지만 변수가 허용되는 경우에만 뷰 매핑 작업을 수행합니다. 변수를 참조하지 않는 요청을 처리하는 경우 이 모듈에는 성능 단점이 없습니다. 1.ngx_http_map_module 모듈 명령어 설명 맵 구문

Go 언어 맵의 성능 최적화 Go 언어 맵의 성능 최적화 Mar 23, 2024 pm 12:06 PM

Go 언어 맵의 성능 최적화 Go 언어에서 맵은 키-값 쌍 모음을 저장하는 데 사용되는 매우 일반적으로 사용되는 데이터 구조입니다. 그러나 대량의 데이터를 처리하는 경우 지도 성능이 저하될 수 있습니다. 지도의 성능을 향상시키기 위해 몇 가지 최적화 조치를 취하여 지도 작업의 시간 복잡성을 줄여 프로그램의 실행 효율성을 향상시킬 수 있습니다. 1. 맵 용량을 사전 할당합니다. 맵 생성 시 용량을 사전 할당하여 맵 확장 횟수를 줄이고 프로그램 성능을 향상시킬 수 있습니다. 일반적으로 우리는

See all articles