2023-06-21 05:17:13 작성자 : 라오 왕
최근 메타는 보이스박스(Voicebox)라는 인공지능 음성 모델을 출시했습니다. 일반적으로 텍스트와 이미지에 중점을 두는 모델과 비교하여 Voicebox는 응답을 위한 음성 메시지를 생성합니다. 보고서에 따르면 이 모델은 단 2초의 오디오 샘플에서 오디오 세부 사항과 음색을 정확하게 식별하고 텍스트 결과를 음성 출력으로 변환할 수 있습니다. 현재 Voicebox는 영어, 프랑스어, 독일어, 스페인어를 지원합니다. Voicebox는 음성 클립 전후의 내용을 기반으로 누락된 부분을 채울 수 있습니다.
이 기술은 메타버스의 가상 비서나 NPC에게 자연스럽고 사실적인 음성 효과를 제공할 수 있습니다. Voicebox는 성대가 손상된 사람들이 어느 정도 장벽 없는 기능을 달성하도록 도울 수 있습니다. 그러나 Voicebox는 아직 연구 개발 단계에 있습니다. 메타는 이러한 인공지능 기술이 위조 등의 위험성이 있어 실제 음성과 보이스박스에서 생성된 음성을 효과적으로 구별할 수 있는 방법을 찾기 위해 노력하고 있다고 밝혔다. 솔루션을 찾을 때까지 모델은 공개적으로 제공되지 않습니다.
위 내용은 Meta, 가상 비서가 NPC와 통신할 수 있도록 음성 AI 모델 Voicebox 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!