> 기술 주변기기 > IT산업 > 사본 명령을 사용하여 데이터를 적색 편이로 가져옵니다

사본 명령을 사용하여 데이터를 적색 편이로 가져옵니다

Lisa Kudrow
풀어 주다: 2025-02-16 12:55:09
원래의
237명이 탐색했습니다.

효율적인 데이터 가져 오기에 redshift의 사본 명령을 사용하는 이 안내서는 매우 효율적인

명령을 사용하여 대형 데이터 세트를 Amazon Redshift로 가져 오는 것을 보여줍니다. 공개적으로 사용 가능한 "감정 분석을위한 Twitter Data"데이터 세트 (Sentiment140)를 예로 사용하겠습니다. 참고 : Redshift, PostgreSQL, MySQL 및 Microsoft SQL Server (Mac, Linux 및 Windows에서 사용 가능)와 호환되는 멀티 플랫폼 데이터베이스 클라이언트 인 TeamSQL은 연결 프로세스를 용이하게 할 수 있습니다. TeamSQL을 무료로 다운로드 할 수 있습니다. 훈련 데이터 zip 파일

주요 고려 사항 :

COPY 복사 대 삽입 : 명령은 병렬 처리 기능으로 인해 대규모 데이터 가져 오기에 대해 훨씬 빠릅니다. 데이터 출처 : 데이터는 S3에 있어야합니다. CSV 형식이 권장됩니다. 압축 (예 : GZIP)은 전달 시간을 줄입니다 오류 처리 : 시스템 테이블을 사용하여 가져 오기 문제를 진단하십시오. 옵션은 제한된 수의 오류가 발생 했음에도 불구하고 명령이 진행할 수 있도록합니다.

레드 시프트 환경 설정 :

이 예에서는 다음과 같은 사양으로 적색 편이 클러스터를 가정합니다. <: :> 클러스터 유형 : 단일 노드 <: :> 노드 유형 : dc1.large Zone : US-East-1a

  • 데이터베이스를 만듭니다 : COPY
  • 스키마를 만듭니다 :
  • 데이터 구조를 이해하십시오 : stl_load_errors CSV 파일 (Training.1600000.Processed.Noemoticon)에는 다음과 같습니다
      (int) : 0 (음수), 2 (중립), 4 (양수) (bigint) : 트윗 ID (Varchar) : 트윗 날짜 (varchar) : query (또는 "no_query") (varchar) : 사용자 ID
    • (Varchar) : 트윗 텍스트 polarity
    • 테이블을 만듭니다 : id
    • date_of_tweet S3에 업로드 :
    • query
    • 다운로드 된 파일을 압축 해제하십시오.
    • gzip을 사용하여 압축 (예 : ) 압축 파일 ()을 S3 버킷에 업로드하십시오. 또는 업로드를 위해 AWS CLI를 사용하십시오. user_id
    • TeamSQL과 연결 : tweet
      TeamSQL을 설치하고 구성하십시오 클러스터 세부 사항과
    1. 데이터베이스를 지정하여 적색 편이 연결을 만듭니다. <.> 연결을 테스트하십시오.
    2. (선택 사항) TeamSQL에서 스키마와 테이블을 재현하십시오 :
    TeamSQL 내에서 스키마 및 테이블 작성을 선호하는 경우 TeamSQL 인터페이스 내에서 2 단계와 4 단계를 반복하십시오.
    CREATE DATABASE sentiment;
    로그인 후 복사
    로그인 후 복사
      <<>
    1. <<> <🎜 🎜> <<> 사본 명령으로 데이터 가져 오기 : <🎜 🎜>
    2. TeamSQL 에서이 명령을 실행하여 자리 표시자를 실제 값으로 대체합니다.
      <<>
    • <🎜 🎜> <<> 명령 매개 변수 :
    • <🎜 🎜>
    • <🎜 🎜> <<> : CSV 파일 형식을 지정합니다 <🎜 🎜> <<> : gzip 압축을 나타냅니다. <🎜 🎜> <🎜 🎜> <<> : 유효하지 않은 UTF-8 문자를 처리합니다. 이 및 training.1600000.processed.noemoticon.csv와 같은 다른 옵션에 대한 자세한 내용은 Redshift 문서를 참조하십시오. gzip training.1600000.processed.noemoticon.csv
    • <<> 가져 오기를 확인하십시오
    • training.1600000.processed.noemoticon.csv.gz <<>
    • <🎜 🎜> <<> 문제 해결 :
    <🎜 🎜>
      가져 오기 오류에 대해서는 <🎜 🎜>를 점검하십시오
      CREATE DATABASE sentiment;
      로그인 후 복사
      로그인 후 복사
      이 포괄적 인 가이드는 명령을 사용하여 대형 데이터 세트를 적색 편이로 가져 오는 상세한 연습을 제공합니다. 최신 정보 및 고급 옵션에 대한 공식 Redshift 문서를 참조하십시오.

위 내용은 사본 명령을 사용하여 데이터를 적색 편이로 가져옵니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿