Databricks Lakehouse AI : 생성 AI
에 대한 데이터 중심 접근법
데이터 및 AI 솔루션의 리더 인 Databricks는 데이터 계층에 직접 통합 된 세계 최초의 AI 플랫폼 인 Lakehouse AI를 공개했습니다. Databricks Data AI Summit 2023에서 전시 된이 혁신적인 플랫폼은 Lakehouse 아키텍처의 힘을 활용하여 생성 AI 애플리케이션의 개발 및 배포를 간소화합니다. 이 튜토리얼은 Lakehouse AI, 주요 기능 및 현대 머신 러닝 라이프 사이클에서의 역할을 탐구합니다.
Lakehouse Architecture 이해
Lakehouse AI로 다이빙하기 전에 Lakehouse Architecture를 명확히하겠습니다. 데이터 호수의 확장 성과 비용 효율성을 데이터웨어 하우스의 구조화 된 관리 기능과 결합합니다.
Data Lake : 는 원시 데이터를 기본 형식으로 저장하여 유연성을 제공하지만 잠재적으로 조직과 거버넌스가 부족합니다. 그것을 조직화되지 않은 대규모 데이터 저장소로 생각하십시오.
데이터웨어 하우스 : 분석 및보고를 위해 최적화 된 구조화되고 처리 된 데이터를 저장합니다. 잘 조직 된 라이브러리와 같습니다. 쿼리에 쉽게 액세스 할 수 있습니다
-
Lakehouse Architecture는 이러한 격차를 해소하여 데이터 호수의 유연성과 데이터웨어 하우스의 거버넌스를 제공합니다.
Lakehouse ai는 무엇입니까?
Lakehouse AI는 AI와 기계 학습을 Lakehouse Architecture에 직접 통합합니다. 이를 통해 데이터 마이그레이션이없는 Data Lake의 방대한 리소스를 사용하여 AI 모델의 개발, 교육 및 배포가 가능합니다. 주요 이점에는 직접 데이터 액세스, 단순화 된 아키텍처 및 실시간 통찰력이 포함됩니다.
Lakehouse ai
의 핵심 구성 요소
몇 가지 핵심 구성 요소 Power Lakehouse AI :
벡터 검색 :
기존 키워드 기반 검색을 넘어 벡터 임베딩을 사용하여 대규모 데이터 세트를 통해 시맨틱 검색을 활성화합니다.
-
큐 레이션 된 모델 : 미리 훈련 된 모델 (MPT-7B, FALCON-7B 및 안정적인 확산)은 Databricks Marketplace에서 사용할 수 있으며 통합 및 다양한 AI 작업에 최적화되었습니다.
automl : - 머신 러닝 모델 개발 프로세스를 자동화하여 다양한 수준의 전문 지식을 가진 사용자가 액세스 할 수 있습니다. 이제 생성 AI 모델을위한 미세 조정이 포함되어 있습니다
레이크 하우스 모니터링 : 데이터 품질 및 모델 성능을 모니터링하여 사전 문제 관리에 대한 통찰력과 경고를 제공합니다.
Unity Catalog를 가진 통합 거버넌스
Databricks Unity Catalog는 데이터, 모델 및 AI 자산에 걸쳐 통합 거버넌스를 제공하여 액세스 제어, 협업, 모니터링 및 작업을 간소화합니다. 중앙 거버넌스 포털은 플랫폼의 거버넌스 상태에 대한 포괄적 인 견해를 제공합니다.
-
엔드 투 엔드 머신 러닝 개발
Lakehouse AI는 전체 머신 러닝 라이프 사이클을 간소화합니다 :
데이터 준비 및 기능 엔지니어링 : 효율적인 데이터 관리 및 기능 일관성을위한 데이터 사역 ML 런타임 및 기능 저장지 레버리지.
모델 엔지니어링 : Databricks 환경 내에서 다양한 프레임 워크를 사용하여 선별 된 모델을 활용하거나 사용자 정의 모델을 사용하십시오.
모델 평가 및 실험 :
실험 추적, 재현성 및 공유에 mlflow를 사용하십시오.
모델 배포 및 mlops : 는 쉽게 통합 및 실시간 예측을 위해 모델 서빙을 사용하여 편안한 엔드 포인트로 모델을 배포합니다.
-
모니터링 및 평가 :
지속적인 성능 추적, 드리프트 감지 및 디버깅을 위해 Lakehouse 모니터링 및 추론 테이블 사용.

결론
Databricks Lakehouse AI는 생성 AI 응용 프로그램을 구축하고 배포하기위한 강력하고 효율적인 플랫폼을 제공합니다. 포괄적 인 도구 및 기능 제품군과 결합 된 데이터 중심 접근 방식은 전체 기계 학습 라이프 사이클을 단순화하여 조직이 데이터의 잠재력을 최대한 활용할 수 있도록합니다.
.위 내용은 데이터 과학자를위한 Databricks Lakehouse AI에 대한 포괄적 인 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!