샤오미의 AI 강점이 다시 한번 검증됐고, 음성인식 알고리즘 성능은 세계 최고 수준이다.
최근 Xiaomi는 음성 인식 알고리즘 분야에서 최신 발전을 이루었습니다. 알고리즘 모델은 성능 측면에서 다른 기관을 앞서고 있으며 국제 순위에서도 높은 순위를 차지하고 있습니다. 이 획기적인 성과는 Google에서 출시한 AudioSet 오디오 라벨링 작업을 통해 Xiaomi에 의해 달성되었습니다
Google은 AudioSet 데이터 세트를 세 개의 하위 세트로 나누었습니다. 처음 두 개의 하위 세트는 훈련에 사용되었으며 병합되어 "AudioSet-2M"이라고 불렸습니다. Xiaomi의 음성 인식 알고리즘 모델이 업계에서 50mAP를 돌파하여 오디오 마킹 기술 지표를 갱신한 것은 이 통합 훈련 세트였습니다. 또한 Xiaomi는 리소스가 제한된 시나리오에 적합한 모델의 Mini 버전도 출시했습니다.
이 기술의 획기적인 발전은 Xiaomi의 소리 인식 알고리즘 기능에 또 다른 획기적인 발전을 의미합니다. 이 기술을 Xiaomi의 많은 스마트 하드웨어 장치에 적용하면 환경 소리를 더욱 예민하게 포착하고 식별할 수 있어 하드웨어의 지능이 크게 향상되어 사용자에게 창작물을 제공할 수 있습니다. 더욱 편리한 스마트 라이프를 경험해보세요.
동시에 Xiaomi의 음성 인식 알고리즘에 따른 오디오 태깅 기술 기능은 업계 최첨단 연구의 연구 개발 프로세스를 효과적으로 촉진했습니다.
Xiaomi의 향상된 음성 인식 알고리즘은 Xiaomi의 스마트 장치에서 널리 사용될 수 있습니다. 오디오 태깅 알고리즘은 아기 울음소리, 동물 소리, 자동차 엔진 소리, 폭발음, 화재 경보기, 초인종 소리, 물 흐르는 소리 등 다양한 환경 소리를 식별하고, 환경 소리를 다음과 같은 양식으로 표현할 수 있습니다. 텍스트로 소리가 "보이도록" 하세요. 이를 통해 하드웨어 장치를 더욱 스마트하게 만들고 사용자에게 더욱 효율적이고 정확한 음성 인식 환경을 제공할 수 있습니다.
샤오미 휴대폰의 "샤오미 소리 듣기" 기능은 화재 경보기, 아기 울음소리, 주전자 소리 등 14가지 중요한 환경 소리를 모니터링하고 휴대폰 알림 표시줄을 통해 문자 메시지를 푸시할 수 있습니다. 이 기능은 청각 장애가 있는 사람들의 삶에 효과적으로 도움이 되며, 샤오미 팔찌도 이러한 소리 정보를 동시에 표시하고 수신할 수 있습니다
이 알고리즘은 스마트 홈 장치에서 더욱 널리 사용됩니다. 현재 샤오미의 음성 인식 알고리즘은 아기 울음소리를 감지하면 실시간으로 사용자의 휴대폰에 알림을 보낼 수 있는 미지아(Mijia) 카메라의 아기 울음소리 모니터링 기능 등 많은 스마트 홈 기기에 사용되고 있다. 샤오미 사운드 스피커에는 소리 인식 기능도 탑재돼 있어 집 경보음, 아기 울음소리, 화재 경보기, 흐르는 물소리, 고양이 울음소리, 개 짖는 소리 등 사용자가 관심을 갖는 6가지 가정 환경 소리를 식별할 수 있다. Xiaomi 건강 앱의 수면 코골이 모니터링은 수면 중에 사용자의 코골이와 잠꼬대를 추적하는 데 도움이 될 수 있습니다.
이 알고리즘의 잠재력을 더 잘 실현하기 위해 Xiaomi는 AIoT 플랫폼 생태계를 통해 이 알고리즘 기술을 적용할 수 있는 광범위한 공간을 제공합니다. 현재 샤오미의 음향 음성 팀은 자체 개발한 음향 음성 기술을 샤오미 휴대폰, 스피커, TV, 헤드폰, 시계, 로봇 등 79개 카테고리의 5,000개 이상의 스마트 제품에 완벽하게 적용했습니다.
음성인식 알고리즘에 속하는 인공지능 분야에서는 샤오미가 오랫동안 투자를 이어온 밑거름 중 하나로 적극적으로 참여하고 있다. 샤오미가 2016년 AI팀을 창설한 이후 AI팀은 7년 만에 6배로 늘어나 인원이 3000명을 넘은 것으로 알려졌다. 동시에 Xiaomi의 AI 기술 역량은 시각, 음향, 음성, NLP, 지식 그래프, 기계 학습, 대형 모델, 다중 양식 등 다양한 방향을 다루며 휴대폰, 자동차, AIoT, 로봇. 올해 4월 샤오미는 대형 모델을 전면적으로 수용하기 위해 AI 대형 모델팀을 공식 설립했으며 현재 일부 적용 시도가 이뤄지고 있다. 첫 번째 대규모 애플리케이션 모델은 지능형 음성 비서 Xiao Ai를 대규모 모델 버전으로 업그레이드하고 초대 테스트를 시작하는 것입니다.
위 내용은 샤오미의 AI 강점이 다시 한번 검증됐고, 음성인식 알고리즘 성능은 세계 최고 수준이다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

ChatGpt 4는 현재 이용 가능하고 널리 사용되며 ChatGpt 3.5와 같은 전임자와 비교하여 상황을 이해하고 일관된 응답을 생성하는 데 상당한 개선을 보여줍니다. 향후 개발에는보다 개인화 된 인터가 포함될 수 있습니다

이 기사는 Chatgpt, Gemini 및 Claude와 같은 최고의 AI 챗봇을 비교하여 고유 한 기능, 사용자 정의 옵션 및 자연어 처리 및 신뢰성의 성능에 중점을 둡니다.

Mistral OCR : 복수 문서 이해를 가진 검색 방지 생성 혁신 RAG (Resprieved-Augmented Generation) 시스템은 AI 기능을 크게 발전시켜보다 정보에 입각 한 대응을 위해 방대한 데이터 저장에 액세스 할 수 있도록했습니다.

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.
