목차
Detailed Controller" >Detailed Controller
실험 부분
기술 주변기기 일체 포함 Tian Yuandong 팀은 'Long Story Generator' DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

Tian Yuandong 팀은 'Long Story Generator' DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

Apr 11, 2023 pm 09:22 PM
발전기

얼마 전 Tian Yuandong 박사팀은 EMNLP2022에서 대규모 언어 모델을 기반으로 한 스토리 생성기 Re3(Recursive Reprompting and Revision) 프레임워크를 출시했습니다. 최대 7,500 단어의 스토리를 생성할 수 있습니다.

최근 Re3의 저작팀은 계층적 개요를 사용하여 스토리를 더 자세히 설명하고 미세 조정된 OPT를 사용하는 긴 스토리 생성 프레임워크DOC(Detailed Outline Control)의 두 번째 버전을 출시했습니다. - 350m 모델은 생성된 콘텐츠를 보다 일관되게 연속적으로 수행합니다. 이에 비해 인간 평가에서는 DOC가 이전 세대 Re3보다 쓰기 능력이 더 뛰어난 것으로 평가했습니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

페이퍼 링크: https://arxiv.org/abs/2212.10077

페이퍼 링크: https://github.com/yangkevin2/doc-story- Generation

DOC는 두 가지 보완 구성 요소로 구성됩니다.

1. 상세한 아웃라이너창의적인 작업을 주요 초안 프로세스와 구분하는 보다 상세하고 계층적으로 구조화된 개요를 만듭니다.

2. 컨트롤러는 개요 세부 사항과 일치하도록 스토리 단락을 제어하여 더 자세한 개요가 생성 프로세스에서 여전히 역할을 할 수 있도록 보장합니다.

자동으로 생성된 스토리에 대한 인간 평가에서 DOC는 플롯 일관성에서 22.5%의 절대 이득, 개요 관련성에서 28.2% 증가, 관심도에서 20.7% 증가를 달성했는데, 이는 이전 Re3 기준보다 훨씬 더 나은 수치입니다. 인간 평가자들은 대화형 제작 환경에서 DOC를 제어하기가 더 쉽다고 믿습니다.

이 기사의 첫 번째 저자인 Kevin Yang은 University of California, Berkeley의 4학년 박사과정 학생입니다. 그의 주요 연구 관심 분야는 구조화된 제어 방법을 사용하는 등 구조화된 환경에서 제어 가능한 자연어 텍스트 생성입니다. 긴 형식의 텍스트를 개선하기 위한 생성입니다.

두 번째 저자인 Dr. Tian Yuandong은 메타 인공 지능 연구소의 연구원이자 선임 관리자입니다. 그의 연구 관심 분야는 심층 강화 학습과 게임에서의 응용, 딥 러닝 모델의 이론적 분석입니다. 그는 2005년과 2008년 상하이자오퉁대학교에서 학사 및 석사학위를 취득했고, 2013년에는 미국 카네기멜론대학교 로봇공학연구소에서 박사학위를 취득했다.

DOC Framework

자연어 기술의 지속적인 발전으로 대규모 언어 모델에 의한 짧은 텍스트의 이해가 점차 병목 현상에 가까워지고 있으며 사람들은 점차 수천 개의 텍스트를 생성하는 등 긴 텍스트를 생성하는 데 관심을 갖게 되었습니다. 한 번에 말.

짧은 텍스트 생성 작업에 비해 긴 텍스트에는 더 많은 내용과 제한 사항이 포함되어 있습니다. 모델은 전반적인 일관성과 장기적인 사실적 일관성을 유지하고 사용자 출력의 전제 또는 계획과의 관련성을 유지해야 합니다.

Re3와 같은 스토리 생성 시스템은 인간에 비해 장거리 플롯 일관성을 보장할 수 없는 점, 글로벌 불일치, 설정된 계획에서 벗어난 스토리 콘텐츠 등 여러 측면에서 여전히 단점을 가지고 있습니다.

이 격차를 해소하기 위해 DOC(상세 개요 제어) 프레임워크는 Re3의 높은 수준의 계획-초안-수정 구조를 재사용하는 동시에 두 가지 보완적인 접근 방식을 통해 장기적인 일관성을 향상시킵니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

상세 아웃라이너

먼저, 상세 아웃라이너는 짧은 초기 개요를 보다 상세하고 계층적인 개요로 다듬습니다. 이 디자인의 이유는 인간 작성자가 반복적으로 다듬고 확장하기 전에 긴 문서의 초안을 작성할 수 있기 때문입니다. 짧은 초기 개요.

작가는 새로운 줄거리를 즉흥적으로 작성하기보다는 초안 작성 과정에서 더 자세한 지침을 제공하기 위해 확장된 개요를 사용하여 상위 개요 단계에서 일관되고 중요한 줄거리를 계획할 수 있습니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

초안 작성 단계에서 연구원들은 Re3 재작성 단계의 개요 관련성과 텍스트 일관성 재정렬을 재사용하여 현재 개요 프로젝트가 기사 단락을 완료한 시기를 감지하고 점수 임계값에 따라 조기 중단을 달성했습니다. .

개요에는 완전한 설정과 관련 문자가 있으며 각 개요 항목은 문맥의 관련성과 일관성을 위해 신중하게 심사됩니다.

구조화된 프롬프트에서 모델은 현재 설정, 설정 변경 사항을 강조 표시하고 개요에서 감지된 역할을 기반으로 역할 설명을 검색합니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

이에 반해 Re3는 드래프트 과정에서 세그먼트별로 관련 캐릭터를 동적으로 선택하고 설정 정보를 추적하지 않아 스토리 설정에 예상치 못한 변화가 발생할 수 있습니다.

Detailed Controller

두 번째 세부 컨트롤러인 컴포넌트는 해당 개요 항목을 기준으로 단락 생성을 제어하여 세부 개요에 대한 충실도를 유지합니다.

상세한 개요는 중첩되는 소프트 제약 조건을 많이 부과하기 때문에 세부 컨트롤러는 충분한 제어 강도를 발휘해야 함과 동시에 유연한 자연어 입력에 적응하고 최신 기술을 사용할 때 생성되어야 합니다. 예술적인 대규모 언어 모델.

그래서 연구진은 세부 컨트롤러를 OPT350m 기반 컨트롤러로 구현하고, 요약 내용을 단락 접두사에 맞춰 정렬하는 대조 훈련 프로그램을 설계했습니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

가장 중요한 것은, 연구원들이 생성된 단락이 처음부터 주제와 관련될 뿐만 아니라 전체에 걸쳐 용이하도록 많은 유창한 하드 네거티브를 구성했다는 것입니다.

실험 부분

실험에서 모델에 대한 입력은 보통 30~60 단어의 짧은 영어 전제이고 출력은 완전한 이야기입니다.

"좋은 스토리"의 정의는커녕 "스토리"의 정의가 아직 명확하지 않고 품질이 주로 수동 평가 지표에 의존하기 때문에 연구원들은 더 많은 규칙 제약을 부과하지 않았습니다.

주로 평가에서 세 가지 지표를 사용하며 이는 완전한 스토리보다는 단락 비교에 더 적합합니다.

1 일관성, 플롯이 일관적이라고 판단하는 단락의 비율

2 관련성, 해당 개요 항목을 충족한다고 판단되는 단락의 비율

3. 흥미로움, 흥미롭다고 판단되는 단락의 비율.

비교된 기본 모델에는 Re3, ROLLING-OPT 및 ROLLING-GPT가 포함됩니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

실험 결과에서 볼 수 있듯이 Re3와 비교하여 주석 작성자는 DOC에서 생성된 플롯이 더 일관되고 윤곽선과 더 관련성이 높으며 ROLLING 기준선보다 더 높은 개선이 있다고 믿습니다.

그리고 그 결과는 모델 설계의 정확성, 즉 창의적 작업을 계획에서 제도로 전환하고 제어 메커니즘을 개선함으로써 플롯 일관성과 윤곽의 관련성이 향상된다는 점을 확인시켜 줍니다.

그리고 놀랍게도 주석 작성자는 DOC 단락이 훨씬 더 흥미롭다고 믿었습니다. 연구원들은 이것이 더 자세한(더 많은 이벤트 기반) 개요에 의해 가져온 개선이라고 믿었습니다.

그러나 정성적 분석에 따르면 모델에는 여전히 추가 개선의 여지가 큰 것으로 나타났습니다.

RE3와 달리 DOC는 일반적으로 최상위 개요에서 크게 벗어나지 않는 반면 RE3는 때때로 주제에서 거의 완전히 벗어나지만 DOC는 세부 개요의 하위 수준 부분을 따르지 않는 경우가 많습니다.

DOC 및 RE3에는 여전히 내부 일관성 문제가 있으며, 세부 개요에 가끔 오류가 있으면 특히 부정적인 영향을 미쳐 초안 작성 과정에서 연쇄 오류가 더 커질 수 있습니다.

또한 DOC의 개요는 세부 수준에서 일관성이 없는 경우가 많습니다. 일부는 너무 모호하고 다른 일부는 지나치게 확장된 것처럼 보입니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

또한 모델에서 감지한 설정과 문자가 때로는 부정확하거나 불완전할 수 있으며, 아래 예는 위의 개요를 기반으로 DOC에서 작성한 스토리를 크게 요약한 것입니다.

Tian Yuandong 팀은 Long Story Generator DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!

위 내용은 Tian Yuandong 팀은 'Long Story Generator' DOC의 두 번째 버전을 출시했습니다. 일관성이 크게 향상되었으며 재미가 20.7% 증가했습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. 크로스 플레이가 있습니까?
1 몇 달 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

AI 신분증 사진 생성기: 실제 테스트에서 AI 소프트웨어가 독특하고 강력한 성능을 입증했습니다. AI 신분증 사진 생성기: 실제 테스트에서 AI 소프트웨어가 독특하고 강력한 성능을 입증했습니다. Aug 09, 2023 pm 07:33 PM

실제 테스트 결과, AI ID 사진 생성기는 좋은 성능을 발휘했으며 그 강력한 기능은 정말 놀랍습니다. 더 이상 사진 촬영에 대해 걱정할 필요가 없습니다! 이 문장은 다음과 같이 재작성됩니다. Chuzhan AI 소프트웨어 사용(저작권 및 해석 권한은 Chuzhan AI에 속하며 생성된 효과를 표시하는 데에만 사용됩니다) 스케치 모드: 일상적인 작업이든 비즈니스 사무실 상황이든 전문적인 이미지가 중요합니다. 아름다운 증명사진은 전문적인 이미지를 더욱 돋보이게 할 수 있습니다. AI가 생성한 신분증 사진은 전통적인 사진 표준을 충족할 뿐만 아니라 개인의 독특한 얼굴 특징을 복원할 수도 있습니다. AI 기술은 얼굴 윤곽, 피부색, 조명 등 다양한 세부 사항을 지능적으로 식별하고 가장 적합한 증명사진을 생성할 수 있습니다. 외모나 기질에 관계없이 완벽하게 디스플레이되어 사람들에게 깊은 첫인상을 남길 수 있습니다. AI는 한 번의 클릭으로 신분증 사진을 생성합니다.

Java를 사용하여 간단한 학생 성과 보고서 생성기를 작성하는 방법은 무엇입니까? Java를 사용하여 간단한 학생 성과 보고서 생성기를 작성하는 방법은 무엇입니까? Nov 03, 2023 pm 02:57 PM

Java를 사용하여 간단한 학생 성과 보고서 생성기를 작성하는 방법은 무엇입니까? 학생 성과 보고서 생성기는 교사나 교육자가 학생 성과 보고서를 신속하게 생성하는 데 도움이 되는 도구입니다. 이 기사에서는 Java를 사용하여 간단한 학생 성과 보고서 생성기를 작성하는 방법을 소개합니다. 먼저 학생 개체와 학생 성적 개체를 정의해야 합니다. 학생 객체에는 학생의 이름, 학번 등의 기본 정보가 포함되고, 학생 점수 객체에는 학생의 과목 점수, 평균 성적 등의 정보가 포함됩니다. 다음은 간단한 학생 개체의 정의입니다.

최고의 무료 AI 애니메이션 아트 생성기 최고의 무료 AI 애니메이션 아트 생성기 Feb 19, 2024 pm 10:50 PM

최고의 무료 AI 애니메이션 아트 생성기를 찾고 싶다면 검색을 종료할 수 있습니다. 애니메이션 예술의 세계는 독특한 캐릭터 디자인, 매혹적인 색상, 매혹적인 줄거리로 수십 년 동안 관객을 사로잡았습니다. 그러나 애니메이션 아트를 만드는 데는 재능과 기술, 그리고 많은 시간이 필요합니다. 그러나 인공 지능(AI)의 지속적인 발전으로 이제 최고의 무료 AI 애니메이션 아트 생성기의 도움으로 복잡한 기술을 탐구할 필요 없이 애니메이션 아트의 세계를 탐험할 수 있습니다. 이것은 당신의 창의력을 발휘할 수 있는 새로운 가능성을 열어줄 것입니다. AI 애니메이션 아트 생성기란 무엇입니까? AI 애니메이션 아트 생성기는 정교한 알고리즘과 기계 학습 기술을 활용하여 광범위한 애니메이션 작품 데이터베이스를 분석합니다. 이러한 알고리즘을 통해 시스템은 다양한 애니메이션 스타일을 학습하고 식별합니다.

PHP를 통해 간단한 QR 코드 생성기를 작성하는 방법 PHP를 통해 간단한 QR 코드 생성기를 작성하는 방법 Sep 24, 2023 am 08:49 AM

PHP를 통해 간단한 QR 코드 생성기를 작성하는 방법 QR 코드는 현대 사회에서 매우 보편화되었으며 정보를 빠르게 전송하고 사용자 경험을 향상시킬 수 있습니다. 이 기사에서는 PHP를 사용하여 간단한 QR 코드 생성기를 작성하는 방법을 소개하겠습니다. 1. 필요한 도구와 라이브러리 설치 시작하기 전에 다음 도구와 라이브러리가 설치되어 있는지 확인해야 합니다. PHP: 최신 버전의 PHP가 설치되어 있는지 확인하세요. php를 실행하여 현재 PHP 버전을 확인할 수 있습니다. -v 명령. 작곡:C

PHP7의 생성기: 대용량 데이터와 지연 로딩을 효율적으로 처리하는 방법은 무엇입니까? PHP7의 생성기: 대용량 데이터와 지연 로딩을 효율적으로 처리하는 방법은 무엇입니까? Oct 27, 2023 pm 07:31 PM

생성기(Generator) 개념은 PHP7에서 도입되었으며, 대용량 데이터와 지연 로딩을 효율적으로 처리할 수 있는 방법을 제공합니다. 이 기사는 특정 코드 예제와 결합된 개념과 원리로 시작하여 PHP7에서 생성기의 사용법과 장점을 소개합니다. 생성기는 모든 데이터를 한 번에 반환하는 대신 요청 시 데이터를 생성하는 특수 함수입니다. 함수가 Yield 문을 실행하면 현재 생성된 값이 반환되고 함수의 상태가 저장됩니다. 다음에 생성기 함수가 호출되면 함수는

PHP7의 생성기: 대규모 데이터를 효율적으로 처리하고 메모리를 절약하는 방법은 무엇입니까? PHP7의 생성기: 대규모 데이터를 효율적으로 처리하고 메모리를 절약하는 방법은 무엇입니까? Oct 20, 2023 pm 04:42 PM

PHP7의 생성기: 대규모 데이터를 효율적으로 처리하고 메모리를 절약하는 방법은 무엇입니까? 개요: PHP7은 대규모 데이터 처리 및 메모리 절약 측면에서 강력한 도구로 생성기를 도입합니다. 생성기는 PHP 언어의 특수한 유형의 함수입니다. 일반 함수와 달리 생성기는 모든 결과를 한 번에 반환하는 대신 실행을 일시 중지하고 중간 결과를 반환할 수 있습니다. 따라서 생성기는 대량의 데이터를 처리하고, 메모리 사용량을 줄이고, 처리 효율성을 높이는 데 이상적입니다. 이 기사에서는 학생들을 소개합니다.

ChatGPT를 사용하여 몇 초 만에 대규모 모델을 구축하세요! OpenAI의 새로운 플러그인은 놀랍습니다. 코드 해석기에 연결하고 한 번의 클릭으로 얻을 수 있습니다 ChatGPT를 사용하여 몇 초 만에 대규모 모델을 구축하세요! OpenAI의 새로운 플러그인은 놀랍습니다. 코드 해석기에 연결하고 한 번의 클릭으로 얻을 수 있습니다 Apr 04, 2023 am 11:30 AM

ChatGPT가 인터넷에 연결되면 OpenAI는 이 플러그인의 지원을 통해 자체 기계 학습 모델도 생성할 수 있는 코드 생성기를 신속하게 도입했습니다. 지난 금요일, OpenAI는 ChatGPT가 인터넷에 연결되고 타사 플러그인에 연결할 수 있다는 충격적인 소식을 발표했습니다! 타사 플러그인 외에도 OpenAI는 자체 플러그인 "Code Interpreter"를 도입하고 몇 가지 특수 사용 사례를 제공했습니다. 또한 Greg Brockman은 ChatGPT가 업로드된 비디오 파일도 처리할 수 있음을 보여주었습니다. 그리고 Andrew Mayne이라는 베스트셀러 작가도 있습니다.

Python에서 반복자와 생성자의 차이점은 무엇입니까? Python에서 반복자와 생성자의 차이점은 무엇입니까? Oct 20, 2023 pm 07:10 PM

Python에서 반복자와 생성자의 차이점은 무엇입니까? Python 프로그래밍에서 반복자와 생성기는 반복 가능한 객체를 처리하는 데 사용되는 도구입니다. 둘 다 데이터를 탐색하는 데 사용할 수 있지만 구현에는 약간의 차이가 있습니다. 반복자는 반복자 프로토콜을 구현하는 객체입니다. 반복자 객체에는 __iter__() 및 __next__()라는 두 가지 메서드가 포함되어야 합니다. 저것

See all articles