> 기술 주변기기 > 일체 포함 > NetEase Fuxi는 강화 학습 및 자연어 처리와 같은 영역을 다루는 ICLR 2023에서 선정된 3개의 논문을 보유하고 있습니다.

NetEase Fuxi는 강화 학습 및 자연어 처리와 같은 영역을 다루는 ICLR 2023에서 선정된 3개의 논문을 보유하고 있습니다.

WBOY
풀어 주다: 2024-01-22 20:57:06
앞으로
844명이 탐색했습니다.

제11회 표상학습 국제회의(ICLR)가 5월 1일부터 5일까지 르완다의 수도 키갈리에서 오프라인으로 개최될 예정입니다. 최근 ICLR은 NetEase Fuxi의 총 3편의 논문을 포함하여 논문 승인 결과를 발표했습니다. 이 세 편의 논문 중 1편은 구두발표 논문으로, 나머지 2편은 스포트라이트 발표 논문으로 선정됐다. 이 논문의 내용은 강화 학습, 자연어 처리 등 다양한 분야를 포함합니다. 이번에 선정된 논문은 이러한 연구 방향에서 NetEase Fuxi 팀의 중요한 성과이자 학계에서 인정받고 탁월한 공헌을 한 것입니다.

ICLR 2023 | 网易伏羲3篇论文入选,含强化学习、自然语言处理等领域

실험에 따르면 KLD는 비정상적인 지점에 더 민감한 반면 TCD는 견고합니다.

TVD 추정의 균형을 맞추기 위해 TailLr 타겟을 도입합니다. TailLr은 낮은 모델 확률로 실제 데이터 샘플의 가중치를 줄여 이 목표를 달성하며 필요에 따라 페널티 강도를 조정할 수 있습니다. 실험은 우리의 방법이 다양성을 유지하면서 퇴화 시퀀스의 과대평가를 완화하고 광범위한 텍스트 생성 작업에 대한 생성 품질을 향상시키는 것을 보여줍니다.

ICLR 2023 | 网易伏羲3篇论文入选,含强化学习、自然语言处理等领域

그러나 과거 작업은 환경 탐색을 통해 다양한 기술을 갖춘 전략을 사전 훈련하는 데 중점을 두는 경우가 많습니다. 그러나 다양한 탐색의 사전 훈련 방법을 통해 하위 작업의 성능 향상을 보장하기 어렵고 심지어 사전 훈련 소비가 많을수록 성능이 저하될수록 "불일치" 문제가 발생합니다. 따라서 NetEase Fuxi와 Tianjin University Deep Reinforcement Learning Laboratory 팀은 빠른 다운스트림 작업 적응과 더 높은 샘플링 효율성을 달성하기 위해 장기적인 사전 훈련을 통해 정확한 동적 모델의 이점을 얻을 수 있는 모델 기반 RL 패러다임을 도입하는 EUCLID 프레임워크를 제안했습니다. 미세 조정 단계에서 EUCLID는 정책 기반 계획을 위해 사전 훈련된 동적 모델을 사용합니다. 이 설정은 불일치 문제로 인한 성능 충격을 제거하고 단조로운 성능 향상을 얻을 수 있습니다.

ICLR 2023 | 网易伏羲3篇论文入选,含强化学习、自然语言处理等领域

실험 결과 NECSA는 모든 실험 환경에서 가장 높은 점수를 획득하며 최첨단 수준에 도달한 것으로 나타났습니다.

ICLR 2023 | 网易伏羲3篇论文入选,含强化学习、自然语言处理等领域

NECSA는 강화 학습 알고리즘에 쉽게 통합될 수 있으며 강력한 다양성을 갖추고 있습니다. 일반적인 응용 시나리오 중 하나는 게임 경쟁 로봇의 훈련입니다. NECSA는 학습 효과를 높일 수 있는 상태 분석을 기반으로 하는 새로운 아이디어를 제공하며 특히 복잡하고 고차원적인 게임 상태 표현에 적합합니다. NECSA를 통해 로봇의 경쟁력 수준과 의인화를 더욱 빠르고 효과적으로 최적화할 수 있으며 우수한 모델 해석성을 제공할 수 있습니다. 앞으로 NetEase Fuxi는 여러 게임 시나리오에서 NECSA 방법의 실제 적용을 촉진할 것입니다.

"총 변이 거리에 따른 언어 생성 모델 조정"에 대한 중요한 연구 공헌을 해준 칭화 대학교 황 민리에(Huang Minlie) 교수팀에게 특별히 감사드립니다. 그들의 연구 작업은 언어 생성 모델의 사용자 정의에 중요한 기여를 하여 자연어 처리 기술을 개선하기 위한 새로운 아이디어와 방법을 제공했습니다. 동시에 "EUCLID: 객관식 역학 모델을 통한 효율적인 비지도 강화 학습을 향하여"에 대한 중요한 연구 기여에 대해 천진대학교 심층 강화 학습 연구소에 감사의 말씀을 전하고 싶습니다. 그들의 연구 작업은 비지도 강화 학습 분야에 중점을 두고 있으며 효율적인 객관식 동적 모델을 제안하여 강화 학습 알고리즘 개발에 중요한 기여를 하고 있습니다. 또한 "상태 추상화를 통한 신경 에피소드 제어"에 대한 중요한 연구 기여에 대해 규슈 대학 판구 연구소에도 감사의 말씀을 전하고 싶습니다. 그들의 연구 작업은 뉴런 메모리 제어 및 상태 추상화에 중점을 두고 있으며 지능형 시스템의 개발 및 적용을 위한 새로운 아이디어와 기술 지원을 제공하는 새로운 뉴런 제어 방법을 제안합니다. 이들 연구팀의 기여는 학계에서 중요할 뿐만 아니라 실제 적용에도 잠재적인 영향을 미칩니다. NetEase Fuxi는 이들의 뛰어난 작업에 진심으로 감사를 표하며 각자의 분야에서 지속적인 성공을 기대합니다. NetEase Fuxi는 국내 최고의 게임 및 범 엔터테인먼트 AI 연구 및 응용 기관으로서 AI 기술과 제품을 더 많은 사람들에게 공개하기 위해 최선을 다하고 있습니다. 다양한 분야에서 인공지능 기술의 적용을 촉진합니다. 지금까지 200명이 넘는 고객이 NetEase Fuxi의 서비스를 선택했으며 매일 통화 건수가 수억 건을 초과했습니다.

위 내용은 NetEase Fuxi는 강화 학습 및 자연어 처리와 같은 영역을 다루는 ICLR 2023에서 선정된 3개의 논문을 보유하고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:163.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿