Microsoft는 Project Gutenberg와 협력하여 AI를 사용하여 5,000개의 무료 오디오북을 만듭니다.
IT House News 9월 12일자 Microsoft는 최근 '무료 디지털 도서관 프로젝트' 프로젝트 구텐베르크와 협력하여 AI를 사용하여 전자책 도서관을 위한 5,000개 이상의 무료 오디오북을 제작했습니다.
▲ 사진 출처 프로젝트 구텐베르크 홈페이지
이번 프로젝트에서 연구진은 머신러닝, 자동 텍스트 선택, 자연 음성 합성 등 다양한 인공지능 기술을 활용해 전자책을 자동으로 음성으로 변환하는 전 과정을 성공적으로 구현했다고 합니다
IT홈은 문의를 통해 프로젝트 팀이 먼저 전자책의 구조를 자동으로 분석하고 페이지 번호, 표 등 핵심이 아닌 부분과 본문을 구별한 후 텍스트를 텍스트로 변환할 수 있는 알고리즘을 개발했다는 사실을 알게 되었습니다. WaveNet, Tacotron 및 FastSpeech와 같은 음성 기술은 실제 사람과 유사한 자연스러운 읽기 음성을 생성합니다. 또한 팀은 책에 나오는 내레이터, 대화 및 다양한 캐릭터를 식별하고 그에 따라 음성을 조정하여 스토리라인의 음성 표현을 달성할 수 있는 시스템을 활성화했습니다.
마이크로소프트는 다양한 고전 문학, 드라마, 전기, 기타 작품을 포함해 35,000시간이 넘는 오디오북 음성 데이터를 수집하고 정리했다고 밝혔습니다. 이 음성 데이터는 오픈 소스로 무료로 제공됩니다. 사용자는 자신이 녹음한 음성을 소량 활용해 '자신의 목소리로 책 전체를 읽는' 효과를 낼 수도 있다. 이 프로젝트는 웹사이트의 오디오북 콘텐츠를 풍성하게 하고 시각 장애인에게도 편의를 제공합니다
원래 의미를 바꾸지 않고 내용을 다시 작성하려면 언어를 중국어로 변경해야 합니다. 원문이 나올 필요는 없습니다
위 내용은 Microsoft는 Project Gutenberg와 협력하여 AI를 사용하여 5,000개의 무료 오디오북을 만듭니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

ChatGpt 4는 현재 이용 가능하고 널리 사용되며 ChatGpt 3.5와 같은 전임자와 비교하여 상황을 이해하고 일관된 응답을 생성하는 데 상당한 개선을 보여줍니다. 향후 개발에는보다 개인화 된 인터가 포함될 수 있습니다

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

Google Deepmind 's Gencast : 일기 예보를위한 혁신적인 AI 일기 예보는 기초 관측에서 정교한 AI 구동 예측으로 이동하여 극적인 변화를 겪었습니다. Google Deepmind의 Gencast, 획기적인

OpenAi의 O1 : 12 일 선물 Spree는 아직 가장 강력한 모델로 시작합니다. 12 월의 도착은 세계의 일부 지역에서 전 세계적으로 속도가 저하 된 눈송이를 가져 오지만 Openai는 막 시작되었습니다. Sam Altman과 그의 팀은 12 일 선물을 시작하고 있습니다.

이 기사에서는 AI 모델이 Lamda, Llama 및 Grok과 같은 Chatgpt를 능가하는 것에 대해 논의하여 정확성, 이해 및 산업 영향의 장점을 강조합니다. (159 자).
