대형 모델은 시계열 예측에도 매우 강력합니다! 중국 팀은 LLM의 새로운 기능을 활성화하고 기존 모델을 뛰어넘는 SOTA를 달성합니다.
대규모 언어 모델의 잠재력이 자극됩니다. -
대규모 언어 모델을 훈련하지 않고도 모든 기존 시계열 모델을 능가하는 고정밀 시계열 예측을 달성할 수 있습니다.
Monash University, Ant 및 IBM Research는 여러 양식에 걸쳐 시퀀스 데이터를 처리하는 대규모 언어 모델의 기능을 성공적으로 촉진하는 일반 프레임워크를 공동으로 개발했습니다. 프레임워크는 중요한 기술 혁신이 되었습니다.
시계열 예측은 도시, 에너지, 교통, 원격 감지 등과 같은 일반적인 복잡한 시스템의 의사 결정에 유용합니다.
이후 대형 모델은 시계열/시공간 데이터 마이닝 방법에 혁명을 일으킬 것으로 예상됩니다.
일반 대형 언어 모델 재프로그래밍 프레임워크
연구팀은 별도의 훈련 없이 일반 시계열 예측을 위해 대형 언어 모델을 쉽게 사용할 수 있는 일반 프레임워크를 제안했습니다.
주로 두 가지 핵심 기술을 제안합니다: 타이밍 입력 재프로그래밍; 프롬프트 접두사.
Time-LLM은 먼저 텍스트 프로토타입(Text Prototypes)을 사용하여 입력 시간 데이터를 다시 프로그래밍하고 자연어 표현을 사용하여 시간 데이터의 의미 정보를 표현함으로써 서로 다른 두 가지 데이터 양식을 정렬하므로 대규모 언어 모델이 필요하지 않습니다. 다른 데이터 형식 뒤에 있는 정보를 이해하기 위한 수정. 동시에, 대규모 언어 모델에는 다양한 데이터 형식 뒤에 있는 정보를 이해하기 위해 특정 교육 데이터 세트가 필요하지 않습니다. 이 방법은 모델의 정확도를 향상시킬 뿐만 아니라 데이터 전처리 과정을 단순화합니다.
입력된 시계열 데이터를 더 잘 처리하고 해당 작업을 분석하기 위해 저자는 PaP(Prompt-as-Prefix) 패러다임을 제안했습니다. 이 패러다임은 시간 데이터를 표현하기 전에 추가 상황 정보와 작업 지침을 추가하여 시간 작업에 대한 LLM의 처리 기능을 완전히 활성화합니다. 이 방법은 타이밍 작업에 대한 보다 정교한 분석을 달성할 수 있으며, 타이밍 데이터 테이블 앞에 추가적인 상황 정보와 작업 지침을 추가하여 타이밍 작업에 대한 LLM의 처리 기능을 완전히 활성화할 수 있습니다.
주요 기여 사항은 다음과 같습니다.
- 백본 언어 모델을 수정하지 않고 타이밍 분석을 위해 대규모 언어 모델을 다시 프로그래밍하는 새로운 개념을 제안했습니다.
- 입력 시간 데이터를 보다 자연스러운 텍스트 프로토타입 표현으로 재프로그래밍하고 도메인 전문 지식 및 작업 설명과 같은 선언적 단서로 입력 컨텍스트를 향상시키는 것으로 구성된 일반 언어 모델 재프로그래밍 프레임워크인 Time-LLM을 제안하여 LLM을 안내합니다. 효과적인 교차 도메인 추론을 위해.
- 주류 예측 작업의 성능은 특히 소수 샘플 및 제로 샘플 시나리오에서 기존 최고의 모델의 성능을 지속적으로 초과합니다. 또한 Time-LLM은 뛰어난 모델 재프로그래밍 효율성을 유지하면서 더 높은 성능을 달성할 수 있습니다. 시계열 및 기타 순차 데이터에 대해 LLM의 아직 활용되지 않은 잠재력을 크게 활용하세요.
이 프레임워크를 구체적으로 살펴보면, 먼저 입력된 시계열 데이터를 RevIN으로 정규화한 후 여러 패치로 나누어 잠재 공간에 매핑합니다.
시계열 데이터와 텍스트 데이터는 표현 방식에 상당한 차이가 있으며, 서로 다른 양상에 속합니다.
시계열은 직접 편집할 수도 없고 자연어로 손실 없이 설명할 수도 없습니다. 따라서 시간적 입력 특성을 자연어 텍스트 도메인에 맞춰 정렬해야 합니다.
서로 다른 양식을 정렬하는 일반적인 방법은 교차 주의(cross-attention)이지만 LLM의 고유 어휘는 매우 방대하므로 시간적 특징을 모든 단어에 효과적으로 직접 정렬하는 것이 불가능하며 모든 단어가 시간과 관련이 있는 것은 아닙니다. 시퀀스는 의미론적 관계를 정렬했습니다.
이 문제를 해결하기 위해 본 작업에서는 어휘의 선형 결합을 수행하여 텍스트 프로토타입을 얻습니다. 텍스트 프로토타입의 수는 원래 어휘보다 훨씬 적으며, 이 조합을 사용하여 시계열 데이터의 변화하는 특성을 나타낼 수 있습니다. .
특정 타이밍 작업에서 LLM의 기능을 완전히 활성화하기 위해 이 작업은 신속한 접두사 패러다임을 제안합니다.
간단히 말하면, 시계열 데이터 세트의 일부 사전 정보가 접두어 프롬프트로 자연어 형태로 LLM에 공급되고, 여기에 정렬된 시계열 특징이 접합되어 예측 효과를 향상시킬 수 있습니까? ?
실제로 저자는 효과적인 프롬프트를 구축하기 위한 세 가지 주요 구성 요소를 확인했습니다.
데이터 세트 컨텍스트(2) LLM이 다양한 다운스트림 작업에 적응할 수 있도록 함, (3) 추세, 지연과 같은 통계 설명; 등을 통해 LLM은 시계열 데이터의 특성을 더 잘 이해할 수 있습니다.
팀은 장기 예측 분야에서 8개의 기존 공개 데이터 세트에 대해 포괄적인 테스트를 수행했습니다.
결과적으로 Time-LLM은 벤치마크 비교에서 해당 분야의 이전 최고 결과를 크게 초과했습니다. 예를 들어 GPT-2를 직접 사용하는 GPT4TS와 비교하면 Time-LLM이 크게 개선되어 이 방법의 효율성을 나타냅니다. .
또한 제로샷 시나리오에서도 강력한 예측 능력을 보여줍니다.
본 프로젝트는 앤트그룹 지능형 엔진 사업부 AI 혁신 R&D 부서인 NextEvo의 지원을 받습니다.
관심 있는 친구들은 아래 링크를 클릭해 논문에 대해 자세히 알아보세요~
논문 링크https://arxiv.org/abs/2310.01728.
위 내용은 대형 모델은 시계열 예측에도 매우 강력합니다! 중국 팀은 LLM의 새로운 기능을 활성화하고 기존 모델을 뛰어넘는 SOTA를 달성합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











이 기사에서는 데비안 시스템에서 Apache의 로그 형식을 사용자 정의하는 방법에 대해 설명합니다. 다음 단계는 구성 프로세스를 안내합니다. 1 단계 : Apache 구성 파일 액세스 Debian 시스템의 기본 Apache 구성 파일은 일반적으로 /etc/apache2/apache2.conf 또는 /etc/apache2/httpd.conf에 있습니다. 다음 명령을 사용하여 루트 권한으로 구성 파일을 엽니 다.

Tomcat 로그는 메모리 누출 문제를 진단하는 열쇠입니다. Tomcat 로그를 분석하면 메모리 사용 및 가비지 수집 (GC) 동작에 대한 통찰력을 얻을 수 있으며 메모리 누출을 효과적으로 찾아서 해결할 수 있습니다. 다음은 Tomcat 로그를 사용하여 메모리 누출 문제를 해결하는 방법입니다. 1. GC 로그 분석 먼저 자세한 GC 로깅을 활성화하십시오. 다음 JVM 옵션을 Tomcat 시작 매개 변수에 추가하십시오. -xx : printgcdetails-xx : printgcdatestamps-xloggc : gc. 분석 gc.log

Debian Systems에서 readDIR 함수는 디렉토리 내용을 읽는 데 사용되지만 반환하는 순서는 사전 정의되지 않습니다. 디렉토리에 파일을 정렬하려면 먼저 모든 파일을 읽은 다음 QSORT 기능을 사용하여 정렬해야합니다. 다음 코드는 데비안 시스템에서 readdir 및 qsort를 사용하여 디렉토리 파일을 정렬하는 방법을 보여줍니다.#포함#포함#포함#포함#포함 // QsortIntCompare (constvoid*a, constVoid*b) {returnStrcmp (*(*)

Debian Systems에서 ReadDir 시스템 호출은 디렉토리 내용을 읽는 데 사용됩니다. 성능이 좋지 않은 경우 다음과 같은 최적화 전략을 시도해보십시오. 디렉토리 파일 수를 단순화하십시오. 대규모 디렉토리를 가능한 한 여러 소규모 디렉토리로 나누어 읽기마다 처리 된 항목 수를 줄입니다. 디렉토리 컨텐츠 캐싱 활성화 : 캐시 메커니즘을 구축하고 정기적으로 캐시를 업데이트하거나 디렉토리 컨텐츠가 변경 될 때 캐시를 업데이트하며 readDir로 자주 호출을 줄입니다. 메모리 캐시 (예 : Memcached 또는 Redis) 또는 로컬 캐시 (예 : 파일 또는 데이터베이스)를 고려할 수 있습니다. 효율적인 데이터 구조 채택 : 디렉토리 트래버스를 직접 구현하는 경우 디렉토리 정보를 저장하고 액세스하기 위해보다 효율적인 데이터 구조 (예 : 선형 검색 대신 해시 테이블)를 선택하십시오.

이 안내서는 데비안 시스템에서 syslog를 사용하는 방법을 배우도록 안내합니다. Syslog는 로깅 시스템 및 응용 프로그램 로그 메시지를위한 Linux 시스템의 핵심 서비스입니다. 관리자가 시스템 활동을 모니터링하고 분석하여 문제를 신속하게 식별하고 해결하는 데 도움이됩니다. 1. syslog에 대한 기본 지식 syslog의 핵심 기능에는 다음이 포함됩니다. 로그 메시지 중앙 수집 및 관리; 다중 로그 출력 형식 및 대상 위치 (예 : 파일 또는 네트워크) 지원; 실시간 로그보기 및 필터링 기능 제공. 2. Syslog 설치 및 구성 (RSYSLOG 사용) Debian 시스템은 기본적으로 RSYSLOG를 사용합니다. 다음 명령으로 설치할 수 있습니다 : sudoaptupdatesud

이 기사에서는 데비안 시스템에서 iptables 또는 UFW를 사용하여 방화벽 규칙을 구성하고 Syslog를 사용하여 방화벽 활동을 기록하는 방법에 대해 설명합니다. 방법 1 : iptablesiptables 사용은 데비안 시스템의 강력한 명령 줄 방화벽 도구입니다. 기존 규칙보기 : 다음 명령을 사용하여 현재 iptables 규칙을보십시오. Sudoiptables-L-N-V 특정 IP 액세스 허용 : 예를 들어, IP 주소 192.168.1.100 허용 포트 80 : Sudoiptables-eActip-ptcp-d- 포트80-S192.16

데비안 시스템에서 Nginx의 액세스 로그 및 오류 로그의 기본 스토리지 위치는 다음과 같습니다. 액세스 로그 (AccessLog) :/var/log/nginx/access.log 오류 로그 (ErrorLog) :/var/log/nginx/error.log 위 경로는 표준 Debiannginx 설치의 기본 구성입니다. 설치 프로세스 중에 로그 파일 스토리지 위치를 수정 한 경우 Nginx 구성 파일 (일반적으로 /etc/nginx/nginx.conf 또는/etc/nginx/sites-available/directory)을 확인하십시오. 구성 파일에서

Debian Mail 서버에 SSL 인증서를 설치하는 단계는 다음과 같습니다. 1. OpenSSL 툴킷을 먼저 설치하십시오. 먼저 OpenSSL 툴킷이 이미 시스템에 설치되어 있는지 확인하십시오. 설치되지 않은 경우 다음 명령을 사용하여 설치할 수 있습니다. 개인 키 및 인증서 요청 생성 다음에 다음, OpenSSL을 사용하여 2048 비트 RSA 개인 키 및 인증서 요청 (CSR)을 생성합니다.
