Apache Atlas는 Hadoop 생태계의 메타데이터 거버넌스 문제를 해결하기 위해 Hadoop 커뮤니티에서 생성된 오픈 소스 프로젝트로, Hadoop 클러스터 코어에 대한 데이터 분류, 중앙 집중식 정책 엔진, 데이터 계보, 보안 및 수명 주기 관리를 포함한 메타데이터 거버넌스를 제공합니다. 역량.
Apache Atlas는 Apache Foundation의 인큐베이션 프로젝트이며 Hadoop 생태계의 데이터 거버넌스 및 메타데이터 프레임워크입니다. Atlas는 확장성과 확장성이 우수하고 Hadoop 생태계에 대한 기업의 다양한 요구를 충족할 수 있으며 기업의 데이터 생태계와 통합될 수 있는 핵심 기본 거버넌스 서비스 세트입니다.
Apache Atlas의 아키텍처는 아래 그림에 나와 있습니다.
핵심 기능
Apache Atlas는 Hadoop 메타데이터 관리를 위해 다음 기능을 제공합니다.
1 데이터 분류
● 메타데이터 가져오기 또는 정의 비즈니스 지향적 분류 주석
● 데이터 세트와 기본 요소 간의 관계 정의, 주석 달기 및 자동 캡처
● 메타데이터를 타사 시스템으로 내보내기
2 중앙 집중식 감사
● 모든 애플리케이션, 프로세스 및 보안 액세스와의 관계 캡처 데이터 상호 작용을 위한 정보
● 실행, 단계, 활동 및 기타 작업에 대한 정보 캡처
3. 검색 및 계보
● 데이터 분류 및 감사 정보 탐색을 위한 사전 정의된 탐색 경로
● 텍스트 기반 검색 기능 관련 데이터 및 감사 이벤트를 정확하게 찾습니다.
● 데이터 세트 계보를 시각적으로 탐색하면 사용자가 운영, 보안 및 데이터 출처와 관련된 정보를 자세히 알아볼 수 있습니다.
4. 보안 및 정책 엔진
● 데이터를 기반으로 한 합리적인 런타임 규정 준수 정책 분류 스키마, 속성 및 역할
● 데이터 파생을 방지하기 위한 분류-예측 기반의 고급 정책 정의
● 셀 속성 및 값을 기반으로 한 행/열 수준 마스킹
위 내용은 아파치 아틀라스는 무엇을 의미하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!