기술 주변기기 일체 포함 여러 ChatGPT API를 사용하여 Tsinghua UltraChat 다단계 대화 구현

여러 ChatGPT API를 사용하여 Tsinghua UltraChat 다단계 대화 구현

Apr 22, 2023 pm 08:37 PM
ai 오픈 소스

ChatGPT 출시 이후 이 기간 동안 대화 모델의 인기는 더욱 높아졌습니다. 우리는 이러한 모델의 놀라운 성능에 감탄하는 동시에 그 뒤에 숨은 엄청난 컴퓨팅 성능과 대규모 데이터 지원도 추측해야 합니다.

데이터에 관해서는 고품질 데이터가 중요합니다. 이러한 이유로 OpenAI는 데이터 및 주석 작업에 많은 노력을 기울였습니다. 여러 연구에 따르면 ChatGPT는 인간보다 더 신뢰할 수 있는 데이터 주석자입니다. 오픈 소스 커뮤니티가 ChatGPT와 같은 강력한 언어 모델에서 대량의 대화 데이터를 얻을 수 있다면 더 나은 성능으로 대화 모델을 훈련할 수 있습니다. 이는 Alpaca 모델 제품군(Alpaca, Vicuna, Koala)에 의해 입증되었습니다. 예를 들어 Vicuna는 ShareGPT에서 수집한 사용자 공유 데이터를 사용하여 LLaMA 모델에 대한 지침을 미세 조정하여 ChatGPT의 9단계 성공을 복제했습니다. 점점 더 많은 증거에 따르면 데이터는 강력한 언어 모델을 훈련하기 위한 주요 생산성이라는 사실이 입증되었습니다.

ShareGPT는 사용자가 흥미를 느끼는 ChatGPT 답변을 업로드하는 ChatGPT 데이터 공유 웹사이트입니다. ShareGPT의 데이터는 공개되어 있지만 사소하며 연구자들이 직접 수집하고 정리해야 합니다. 고품질의 광범위한 데이터 세트가 있는 경우 오픈 소스 커뮤니티는 대화 모델 개발에 드는 노력의 절반으로 두 배의 결과를 얻을 수 있습니다.

이를 바탕으로 최근 UltraChat이라는 프로젝트에서 초고품질 대화 데이터 세트를 체계적으로 구축했습니다. 프로젝트 작성자는 두 개의 독립적인 ChatGPT Turbo API를 사용하여 대화를 수행하여 여러 라운드의 대화 데이터를 생성하려고 했습니다.

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

  • 프로젝트 주소: https://github.com/thunlp/UltraChat
  • 데이터 세트 주소: http://39.101.77.220/
  • 데이터세트 상호작용 주소: https://atlas.nomic.ai/map/0ce65783-c3a9-40b5-895d-384933f50081/a7b46301-022f-45d8-bbf4-98107eabdbac

구체적으로, 이 프로젝트는 오픈 소스를 구축하는 것을 목표로 합니다. 연구자가 보편적인 대화 기능을 갖춘 강력한 언어 모델을 개발하는 데 편리한 Turbo API 기반의 확장 가능한 다단계 대화 데이터입니다. 또한, 개인 정보 보호 및 기타 요소를 고려하여 프로젝트에서는 인터넷상의 데이터를 직접 프롬프트로 사용하지 않습니다. 생성된 데이터의 품질을 보장하기 위해 연구원들은 생성 프로세스에서 두 개의 독립적인 ChatGPT Turbo API를 사용했습니다. 여기서 한 모델은 사용자의 역할을 수행하여 질문이나 지침을 생성하고 다른 모델은 피드백을 생성합니다.

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

ChatGPT를 직접 사용하여 일부 시드 대화와 질문을 기반으로 자유롭게 생성하면 단일 주제, 반복되는 내용 등의 문제가 쉽게 발생하여 데이터 자체의 다양성을 보장하기 어렵습니다. 이를 위해 UltraChat은 대화 데이터가 다루는 주제와 작업 유형을 체계적으로 분류하고 설계했으며, 사용자 모델과 응답 모델에 대한 세부적인 프롬프트 엔지니어링도 수행했습니다.

  • 세계에 대한 질문( 세계에 대한 질문): 대화의 이 부분은 현실 세계의 개념, 실체 및 객체에 대한 광범위한 질문에서 비롯됩니다. 다루는 주제는 기술, 예술, 금융 및 기타 분야를 다룹니다.
  • Writing and Creation: 대화 데이터 중 이 부분은 AI에게 처음부터 완전한 텍스트 자료를 생성하도록 지시하는 데 중점을 두고 있으며, 이를 기반으로 후속 질문이나 추가 지침을 통해 글쓰기와 내용을 개선합니다. 서면 자료 유형에는 기사, 블로그, 시, 이야기, 연극, 이메일 등이 포함됩니다.
  • 기존 데이터의 재작성 지원(작성 및 생성): 이 대화 데이터는 기존 데이터를 기반으로 생성되며 지침에는 재작성, 계속, 번역, 귀납, 추론 등이 포함되지만 이에 국한되지 않으며 다루는 주제는 다음과 같습니다. 또한 매우 다양합니다.

이 세 가지 데이터 부분은 AI 모델에 대한 대부분의 사용자 요구 사항을 다룹니다. 동시에 이 세 가지 유형의 데이터는 서로 다른 과제에 직면하고 서로 다른 구성 방법이 필요합니다.

예를 들어, 첫 번째 데이터 부분의 주요 과제는 총 수십만 건의 대화에서 인간 사회의 상식을 최대한 광범위하게 다루는 방법입니다. 이를 위해 연구자들은 자동으로 생성된 주제와 Wikidata에서 파생된 항목은 필터링되고 구조화됩니다.

두 번째 및 세 번째 부분의 과제는 주로 대화의 궁극적인 목표(자료 생성 또는 자료를 다음과 같이 다시 작성)에서 벗어나지 않으면서 후속 대화에서 사용자 지침을 시뮬레이션하고 사용자 모델 생성을 최대한 다양하게 만드는 방법에서 비롯됩니다. 필수) 이러한 이유로 연구원들은 사용자 모델의 입력 프롬프트를 완전히 설계하고 실험했습니다. 구축이 완료된 후 저자들은 환각 문제를 약화시키기 위해 데이터를 후처리하기도 했습니다.

현재 프로젝트는 데이터 양이 124만 개에 이르는 처음 두 부분의 데이터를 공개했는데, 이는 오픈 소스 커뮤니티에서 가장 큰 관련 데이터 세트가 될 것입니다. 콘텐츠에는 현실 세계에서의 풍부하고 다채로운 대화가 담겨 있으며, 데이터의 마지막 부분은 향후 공개될 예정입니다.

세계 문제 데이터는 아래 그림과 같이 30개의 대표적이고 다양한 메타 주제에서 나옵니다.

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了


  • 위의 메타 주제를 기반으로 프로젝트는 1100개 이상의 하위 주제를 생성했습니다. 주제 데이터 구성을 위해
  • 각 하위 주제에 대해 최대 10개의 특정 질문을 생성합니다.
  • 그런 다음 Turbo API를 사용하여 10개의 질문 각각에 대해 새로운 관련 질문을 생성합니다. 위에서 설명한 대로 두 모델을 반복적으로 사용하여 3~7개의 대화 라운드를 생성합니다.
  • 또한 이 프로젝트는 Wikidata에서 가장 일반적으로 사용되는 10,000개의 개체를 수집했습니다. ChatGPT API를 사용하여 각 메타 질문에 대해 5개의 메타 질문을 생성하고 10개의 보다 구체적인 질문과 20개의 관련 있지만 일반적인 질문을 생성했습니다. 질문은 특정 질문 200,000개, 일반 질문 250,000개, 메타 질문 50,000개를 샘플링했으며 각 질문마다 3~7개의 대화 라운드가 생성되었습니다.

다음으로 구체적인 예를 살펴보겠습니다.

UltraChat 플랫폼에서 데이터 검색 효과를 테스트했습니다. 예를 들어 "music"을 입력하면 시스템은 음악 관련 ChatGPT 대화 데이터 10,000세트를 자동으로 검색하며, 각 세트는 다단계 대화입니다. 调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

키워드 "math"를 입력하면 검색됩니다. 결과는 3346개의 다단계 대화 그룹을 보여줍니다. 调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

현재 UltraChat은 의료, 교육, 스포츠, 환경 보호 및 기타 주제를 포함한 다양한 정보 분야를 다루고 있습니다. 동시에 저자는 오픈 소스 LLaMa-7B 모델을 사용하여 UltraChat에서 감독된 지시 미세 조정을 수행하려고 시도했으며 단 10,000단계의 학습 후에 매우 인상적인 효과가 있음을 발견했습니다. 몇 가지 예는 다음과 같습니다. 调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了세계 지식: 별도로 나열됨 중국과 미국의 좋은 대학 10곳이 있습니다

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了질문을 상상해보세요: 우주 여행이 가능해지면 어떤 결과가 나올 수 있을까요?

음절법: 고래는 물고기인가요?

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

가설 질문: Jackie Chan이 Bruce Lee보다 낫다는 것을 증명하세요.

调用多个ChatGPT API相互对话,清华开源的多轮对话数据UltraChat来了

전반적으로 UltraChat은 다른 채팅과 결합할 수 있는 고품질의 광범위한 ChatGPT 대화 데이터 세트입니다. 오픈 소스 대화 모델의 품질을 크게 향상시킵니다. 현재 UltraChat은 영어 버전만 출시하고 있지만 앞으로는 중국어 버전의 데이터도 출시할 예정입니다. 관심 있는 독자들은 살펴보시기 바랍니다.

위 내용은 여러 ChatGPT API를 사용하여 Tsinghua UltraChat 다단계 대화 구현의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

C에서 Chrono 라이브러리를 사용하는 방법? C에서 Chrono 라이브러리를 사용하는 방법? Apr 28, 2025 pm 10:18 PM

C에서 Chrono 라이브러리를 사용하면 시간과 시간 간격을보다 정확하게 제어 할 수 있습니다. 이 도서관의 매력을 탐구합시다. C의 크로노 라이브러리는 표준 라이브러리의 일부로 시간과 시간 간격을 다루는 현대적인 방법을 제공합니다. 시간과 C 시간으로 고통받는 프로그래머에게는 Chrono가 의심 할 여지없이 혜택입니다. 코드의 가독성과 유지 가능성을 향상시킬뿐만 아니라 더 높은 정확도와 유연성을 제공합니다. 기본부터 시작합시다. Chrono 라이브러리에는 주로 다음 주요 구성 요소가 포함됩니다. std :: Chrono :: System_Clock : 현재 시간을 얻는 데 사용되는 시스템 클럭을 나타냅니다. STD :: 크론

C에서 DMA 운영을 이해하는 방법? C에서 DMA 운영을 이해하는 방법? Apr 28, 2025 pm 10:09 PM

C의 DMA는 직접 메모리 액세스 기술인 DirectMemoryAccess를 말하며 하드웨어 장치는 CPU 개입없이 데이터를 메모리로 직접 전송할 수 있습니다. 1) DMA 운영은 하드웨어 장치 및 드라이버에 크게 의존하며 구현 방법은 시스템마다 다릅니다. 2) 메모리에 직접 액세스하면 보안 위험이 발생할 수 있으며 코드의 정확성과 보안이 보장되어야합니다. 3) DMA는 성능을 향상시킬 수 있지만 부적절하게 사용하면 시스템 성능이 저하 될 수 있습니다. 실습과 학습을 통해 우리는 DMA 사용 기술을 습득하고 고속 데이터 전송 및 실시간 신호 처리와 같은 시나리오에서 효과를 극대화 할 수 있습니다.

C에서 높은 DPI 디스플레이를 처리하는 방법? C에서 높은 DPI 디스플레이를 처리하는 방법? Apr 28, 2025 pm 09:57 PM

C에서 높은 DPI 디스플레이를 처리 할 수 ​​있습니다. 1) DPI 및 스케일링을 이해하고 운영 체제 API를 사용하여 DPI 정보를 얻고 그래픽 출력을 조정하십시오. 2) 크로스 플랫폼 호환성을 처리하고 SDL 또는 QT와 같은 크로스 플랫폼 그래픽 라이브러리를 사용하십시오. 3) 성능 최적화를 수행하고 캐시, 하드웨어 가속 및 세부 사항 수준의 동적 조정을 통해 성능 향상; 4) 흐릿한 텍스트 및 인터페이스 요소와 같은 일반적인 문제를 해결하고 DPI 스케일링을 올바르게 적용하여 해결합니다.

C의 실시간 운영 체제 프로그래밍이란 무엇입니까? C의 실시간 운영 체제 프로그래밍이란 무엇입니까? Apr 28, 2025 pm 10:15 PM

C는 실시간 운영 체제 (RTO) 프로그래밍에서 잘 수행하여 효율적인 실행 효율성과 정확한 시간 관리를 제공합니다. 1) c 하드웨어 리소스의 직접 작동 및 효율적인 메모리 관리를 통해 RTO의 요구를 충족시킵니다. 2) 객체 지향 기능을 사용하여 C는 유연한 작업 스케줄링 시스템을 설계 할 수 있습니다. 3) C는 효율적인 인터럽트 처리를 지원하지만 실시간을 보장하려면 동적 메모리 할당 및 예외 처리를 피해야합니다. 4) 템플릿 프로그래밍 및 인라인 함수는 성능 최적화에 도움이됩니다. 5) 실제 응용 분야에서 C는 효율적인 로깅 시스템을 구현하는 데 사용될 수 있습니다.

C에서 스레드 성능을 측정하는 방법? C에서 스레드 성능을 측정하는 방법? Apr 28, 2025 pm 10:21 PM

C에서 스레드 성능을 측정하면 표준 라이브러리에서 타이밍 도구, 성능 분석 도구 및 사용자 정의 타이머를 사용할 수 있습니다. 1. 라이브러리를 사용하여 실행 시간을 측정하십시오. 2. 성능 분석을 위해 GPROF를 사용하십시오. 단계에는 컴파일 중에 -pg 옵션 추가, GMON.out 파일을 생성하기 위해 프로그램을 실행하며 성능 보고서를 생성하는 것이 포함됩니다. 3. Valgrind의 Callgrind 모듈을 사용하여보다 자세한 분석을 수행하십시오. 단계에는 Callgrind.out 파일을 생성하고 Kcachegrind를 사용하여 결과를보기위한 프로그램 실행이 포함됩니다. 4. 사용자 정의 타이머는 특정 코드 세그먼트의 실행 시간을 유연하게 측정 할 수 있습니다. 이 방법은 스레드 성능을 완전히 이해하고 코드를 최적화하는 데 도움이됩니다.

정량적 거래 순위 2025 디지털 통화 정량 거래 앱에 대한 상위 10 개 권장 사항 정량적 거래 순위 2025 디지털 통화 정량 거래 앱에 대한 상위 10 개 권장 사항 Apr 30, 2025 pm 07:24 PM

교환의 내장 양자화 도구에는 다음이 포함됩니다. 1. Binance : Binance 선물 정량 모듈, 낮은 취급 수수료 및 AI 지원 거래를 지원합니다. 2. OKX (OUYI) : 다중 계정 관리 및 지능형 주문 라우팅을 지원하고 기관 수준의 위험 관리를 제공합니다. 독립적 인 정량적 전략 플랫폼에는 다음이 포함됩니다. 4. Quadency : 맞춤형 위험 임계 값을 지원하는 전문 수준 알고리즘 전략 라이브러리. 5. Pionex : 내장 16 사전 설정 전략, 낮은 거래 수수료. 수직 도메인 도구에는 다음이 포함됩니다. 6. Cryptohopper : 클라우드 기반 정량 플랫폼, 150 개의 기술 지표를 지원합니다. 7. BITSGAP :

MySQL 테이블에 필드를 추가 및 삭제하는 단계 MySQL 테이블에 필드를 추가 및 삭제하는 단계 Apr 29, 2025 pm 04:15 PM

MySQL에서는 altertabletable_nameaddcolumnnew_columnvarchar (255) 이후에 필드를 추가하여 altertabletable_namedropcolumncolumn_to_drop을 사용하여 필드를 삭제합니다. 필드를 추가 할 때는 쿼리 성능 및 데이터 구조를 최적화하기위한 위치를 지정해야합니다. 필드를 삭제하기 전에 작업이 돌이킬 수 없는지 확인해야합니다. 온라인 DDL, 백업 데이터, 테스트 환경 및 저하 기간을 사용하여 테이블 구조 수정은 성능 최적화 및 모범 사례입니다.

C에서 문자열 스트림을 사용하는 방법? C에서 문자열 스트림을 사용하는 방법? Apr 28, 2025 pm 09:12 PM

C에서 문자열 스트림을 사용하기위한 주요 단계와 예방 조치는 다음과 같습니다. 1. 출력 문자열 스트림을 생성하고 정수를 문자열로 변환하는 것과 같은 데이터를 변환합니다. 2. 벡터를 문자열로 변환하는 것과 같은 복잡한 데이터 구조의 직렬화에 적용하십시오. 3. 성능 문제에주의를 기울이고 많은 양의 데이터를 처리 할 때 문자열 스트림을 자주 사용하지 마십시오. std :: string의 Append 메소드를 사용하는 것을 고려할 수 있습니다. 4. 메모리 관리에주의를 기울이고 스트림 스트림 객체의 자주 생성과 파괴를 피하십시오. std :: stringstream을 재사용하거나 사용할 수 있습니다.

See all articles