"AI 없이는 산업도 없고, AI 없이는 애플리케이션도 없다." AI(인공지능) 대형 모델 기술의 구현으로 AI 애플리케이션이 곳곳에서 피어나고 있습니다. 최근 많은 기업들이 대형 모델을 기반으로 한 AI 응용 제품을 출시하고 있다. 수백가지 모델의 전쟁시대, 국산 대형 응용제품은 어떻게 개발할 것인가? 더 넓은 컴퓨팅 성능 지원을 제공하고 더 적합한 애플리케이션 시나리오를 찾는 방법은 무엇입니까?
실시간 사진을 게시하세요.
6월 1일, Alibaba Cloud는 Tongyi 대형 모델의 최신 진행 상황을 공개하고 오디오 및 비디오 콘텐츠에 초점을 맞춘 새로운 AI 제품 "Tongyi Listening"을 출시하여 공개 테스트를 위해 공개된 중국 최초의 대형 모델 애플리케이션 제품이 되었습니다. 일부 전문가들은 클라우드 컴퓨팅이 대규모 모델을 구축하는 데 가장 적합한 형태이며, 대규모 모델의 진화가 기존 클라우드 컴퓨팅 아키텍처의 새로운 전환을 시작할 수 있다고 믿습니다.
Alibaba Cloud의 새로운 AI 제품 “Tongyi Tingwu”가 공개 테스트 중입니다
기자는 알리바바 클라우드가 이번에 출시한 'Tongyi Listening'이 'Tongyi Qianwen' 대형 모델의 이해 및 요약 기능과 연결되어 오디오에 중점을 둔 업무 학습용 AI 제품이라는 사실을 출시 현장에서 알게 되었습니다. 그리고 비디오 분야. '통이리스닝'은 기존 녹음 소프트웨어의 콘텐츠 피드백과 달리 실시간 녹음을 기반으로 대화 내용을 텍스트 형태로 사용자에게 보다 직관적으로 제시하고, 아카이브 및 요약할 수 있다. 다국어 커뮤니케이션 시나리오의 경우 "Tongyi Listening"은 향후 번역 기능도 출시하여 언어 차이를 해소하고 진정한 커뮤니케이션이 장벽 없이 완료될 수 있도록 할 것입니다.
"Tongyi Listening"은 음성 콘텐츠를 실시간으로 녹음하는 것 외에도 동영상 정보를 독립적으로 처리하고, 간략한 요약을 생성하고, 콘텐츠를 분할하고, 중심 아이디어를 추출하고, 사용자 요구에 따라 해당 동영상 클립을 찾을 수도 있습니다. "Tongyi Tingwu"는 Alibaba Cloud Disk와도 연결되어 있으며 사용자는 Alibaba Cloud Disk에서 "Tongyi Tingwu"로 비디오를 쉽게 업로드하여 처리할 수 있어 사용자의 작업 효율성과 사용자 경험이 크게 향상됩니다.
일반 사용자의 사무실 및 학습 요구 사항을 처리하는 것 외에도 "Tongyi Listening"은 다른 하위 부서의 다양한 그룹을 위한 맞춤 기능도 설정합니다. Chrome 플러그인을 사용하여 외국어 학습자와 청각 장애인이 사용할 수 있습니다. 이중 언어 플로팅 자막 일정이 자주 겹치는 전문가를 위해 자막 없이 동영상을 시청하세요. "Tongyi Listening"은 음소거 상태에서 회의에 참여하기 위한 '회의 대기자'로도 사용할 수 있으며, AI가 회의를 녹음하고 핵심 내용을 정리합니다. 포인트들.
"우리는 기술 변화의 시대에 살고 있습니다." Alibaba Cloud Intelligence의 최고 기술 책임자인 Zhou Jingren은 "AI가 발전함에 따라 더 많은 AI 보조자가 탄생할 것입니다. 이는 효율성을 향상시킬 뿐만 아니라"라고 말했습니다. 우리의 삶의 경험을 크게 향상시킬 수 있습니다.”
국내 기술 대기업들의 레이아웃 가속화, AI대형 모델 경쟁 심화
'Tongyi Tingwu' 대형 모델의 구현이 실용화 단계에 들어섰고, 이는 의심할 여지 없이 업계에 센세이션을 일으켰습니다. 하지만 이번 대회에 국내 인터넷 기술계에는 수많은 경쟁업체가 참여하고 있으며, 알리바바 클라우드만이 유일한 플레이어는 아니라는 점에 유의해야 한다. 이 기간 동안 '전복' 바람은 계속해서 거세졌다. 새로운 대형 AI 모델이 점점 더 많이 탄생하고 있으며, 기존 대형 AI 모델도 점점 더 강력해지고 있습니다. 기자의 리뷰에 따르면 현재 이 분야에는 동일한 시장을 공유하고 동일한 미개척 영역을 탐색하려는 경쟁자가 많이 있습니다.
첫 번째는 바이두(Baidu)와 알리바바(Alibaba)로 대표되는 '거대 세력'입니다. 올해 3월 16일 Baidu의 "Wen Xin Yi Yan"이 빠르게 출시되어 한 달도 채 지나지 않아 4월 11일 Alibaba Cloud Intelligence에서 열린 Alibaba Cloud Summit에서 국내 대규모 언어 모델의 혁신을 알렸습니다. 최고 기술 책임자(CTO) Zhou Jingren은 대형 언어 모델 "Tongyi Qianwen"의 출시를 공식적으로 발표했습니다. Baidu와 Alibaba는 오늘날 AI가 업계에 가져올 수 있는 파괴적인 힘을 깊이 이해하고 있습니다.
샤오미, 360, Zhihu 등 '인터넷 기술 학교'가 이어졌습니다. 샤오미 그룹이 올해 3월 AI 대형 모델을 탐색 중이라고 밝힌 후, 5월 24일 저녁 1분기 재무 보고 컨퍼런스 콜에서 루 웨이빙 샤오미 회장은 회사가 4월에 공식적으로 AI 실험실 대형 모델 팀을 설립했다고 밝혔습니다. 현재 AI 관련 종사자는 1,200명 이상이다. Lu Wei는 "Xiaomi는 대형 모델을 적극적으로 수용할 것이지만 Open AI와 같은 일반적인 대형 모델을 만들지는 않을 것입니다. 대신 비즈니스와 긴밀하게 통합 및 협력하고 AI 기술을 사용하여 내부 효율성을 향상할 것입니다."라고 말했습니다.
지후는 지난 4월 '2023 Zhihu Discovery Conference'에서 대규모 언어 모델 'Zhihaitu AI'를 출시하고 사이트에서 최초의 대규모 모델 적용 기능인 'Hot List Summary'를 내부 테스트했습니다. 한 달 후 Zhihu는 5월 18일 360그룹 CEO Zhou Hongyi 이사회 의장이 열린 제7차 세계 인텔리전스 컨퍼런스에서 '2023 디지털 엑스포' 사이트에 또 다른 대규모 모델 응용 기능인 '검색 집계'를 선보였습니다. , 2종의 대형 모형제품 '360 지능형 브레인'과 AI 그리기 도구 '360 홍투'를 시연했다.웨이모브는 지난 5월 24일 대형 모델 기반의 AI 응용 제품인 WAI를 출시했습니다. 출시일 현재 Weimob WAI는 "단어 제작, 문자 메시지 템플릿, 제품 설명, 잔디 심기 메모, 라이브 방송 스크립트, 공개 계정 트윗, 짧은 비디오 제품 카피라이팅"을 포함한 25개의 실용적인 응용 시나리오를 공식적으로 출시했습니다.
이 외에도 iFlytek, SenseTime, Yuncong으로 대표되는 '막대기 세력'도 있습니다. 이들 기업은 AI 산업의 정점에 있든, 최저점에 있든 항상 AI 최전선에 굳건히 서 있었다. 수년간 열심히 일해 온 '오버로드'는 따라잡으려는 새로운 세력과 충돌하게 된다. 아이플라이텍은 국내 제조사 중 최초로 대형 모델을 실제 상황에 적용한 기업으로, 현재 교육, 사무, 자동차 등 산업을 위한 솔루션을 출시한 것으로 알려졌다.
중국 과학 기술 정보 연구소가 발표한 보고서에 따르면 불완전한 통계에 따르면 2020년부터 2023년까지 중국은 매개변수가 10억 개가 넘는 대형 모델 79개를 출시했습니다. 업계 관계자들은 국산 대형 모델이 급증하는 것은 오픈AI가 가져온 '메기효과'에 기업들이 대응한 데 따른 것도 있고, 다른 한편으로는 개발이 가져올 장기적인 이익과 파워업화 때문이라고 보고 있다. 대형 모델이 업계에 가져올 수 있습니다. 주요 기업들은 시장 점유율을 놓고 경쟁하고 블록버스터 제품을 출시하며 인공 지능의 지속적인 업그레이드와 진화를 촉진하고 있습니다. AI 대형 모델 경쟁이 치열해지면서 '100개 모델 전쟁'이 본격화된다.
배치가 왕입니다. 대형 모델 제품이 "화려함"을 피할 수 있는 방법은 무엇입니까?
알리바바 CEO 장용은 인공지능 시대에는 모든 제품이 대규모 모델을 이용해 재구성될 가치가 있다고 말했습니다. “대형모델 시대가 가져온 엄청난 기회에 직면해 다양한 기업들이 생태적 틈새시장을 선점하기 위해 서두르고 있습니다. 확실한 상용화 전망과 실제 구현 서비스 역량 지원이 없다면 아무리 목소리가 커도 얻기 어려울 것입니다. 가장 진보된 대규모 모델 성공.신생 제품으로서 대형 모델 구현이 얼마나 쉬운가? 일부 분석가들은 대형 모델의 구상과 제품화 사이에 두 가지 주요 문제가 있다고 생각합니다. 교육 시장은 새로운 기술로서 고객을 교육하는 단계에서 수요 측에서는 대형 모델의 기능 경계를 명확하게 이해하지 못하고 있습니다. 특정 세분화된 시나리오를 구현하려면 기업과 고객이 함께 발전해야 합니다
.ChatGPT의 출현은 실제로 소프트웨어 사용자가 AI에 관한 과학을 대중화하는 데 도움이 되었으며, 이는 어느 정도 대규모 언어 모델의 상업적 응용 프로그램에 대한 더 많은 수요를 가져왔습니다. 이번에 알리바바 클라우드가 출시한 '퉁이 리스닝(Tongyi Listening)'은 시나리오 기반 요구에 적응한 대형 모델 제품의 좋은 예다. 장기간 사용하면 사용자는 AI와 '나란히 일하는' 작업 습관을 기를 수도 있다. 이는 기업에게 매우 중요한 잠재 소비자 시장이라고 합니다.
또 다른 문제는 비용입니다. 다양한 세분화 시나리오에서 구현된 AI에는 다양한 훈련 코퍼스가 필요합니다. 효과적이고 사용하기 쉬운 대규모 모델을 얻으려면 충분하고 타겟화된 코퍼스에 투자해야 하며 이는 많은 비용 투자와 심층적인 기술 지식을 의미합니다. Huawei Cloud 인공지능 분야 수석 과학자 Tian Qi는 대형 모델을 개발하고 훈련하는 데 한 번에 1,200만 달러가 소요된다고 말했습니다. 서비스를 받으려면 높은 수수료를 지불해야 하는데, 이는 높은 자본 및 기술적 한계를 직관적으로 반영한 것입니다. 예를 들어, iFlytek Spark 인지 대형 모델을 기반으로 구축된 "iFlytek Hearing"은 19.8위안/2시간에서 888위안/100시간 범위의 음성-텍스트-기계 빨리 감기 기능 패키지를 갖추고 있습니다. GPT-3 모델을 "더 스마트한" GPT-4로 업그레이드하려면 월 20달러가 추가로 필요합니다.
또한, 국내 대형 AI 모델의 경우 컴퓨팅 성능도 또 다른 핵심 문제입니다. 대형 모델을 생성하려면 포괄적인 컴퓨팅 인프라가 필요하며, 클라우드 컴퓨팅은 대형 모델을 구축하는 데 가장 적합한 형태입니다. 그러나 대규모 모델 기술의 구현으로 인해 기존 클라우드 컴퓨팅 아키텍처에 영향과 변화가 있을 수 있으며, 보다 강력한 컴퓨팅 노드와 저장 장치를 추가하고 데이터 전송 속도와 안정성을 최적화하며 맞춤형 솔루션을 제공해야 합니다.
향후 대형 모델 개발 역시 보안과 진정성 문제에 직면하게 될 것입니다. 올해 4월 중국 사이버공간관리국은 '생성인공지능 서비스 관리 대책(의견 초안)'을 발표해 국가가 다음과 같은 기초 기술의 독립적인 혁신, 홍보, 적용, 국제 협력을 지원하도록 제안했다. 인공 지능 알고리즘 및 프레임워크를 사용하고 안전하고 신뢰할 수 있는 소프트웨어, 도구, 컴퓨팅 및 데이터 리소스의 채택을 장려합니다. 동시에 생성 인공지능 제품은 서비스를 제공하기 전에 보안 평가를 선언해야 한다고 제안되었습니다.
업계 관계자에 따르면 대형 모델 기술은 사회 발전의 기회를 가져오지만 다양한 거버넌스 문제도 가져옵니다. 다음 단계는 혁신 생태계를 조성하는 것뿐만 아니라 위험 예방에도 주의를 기울이는 것입니다. 이러한 문제를 해결해야만 대규모 모델이 그 잠재력을 충분히 발휘하고 다양한 분야에서 널리 사용될 수 있습니다.
대규모 대회에서는 누가 지금 가장 빨리 달릴 수 있는지가 아니라, 앞으로도 누가 더 발전할 수 있는지가 중요합니다. ChatGPT와 경쟁할 수 있는 국내 AI 애플리케이션이 있는지 계속해서 주목해 보겠습니다.
작성자: 아오이뉴스 관우휘 기자
인턴: Xin Yu
위 내용은 많은 회사들이 대형 모델을 기반으로 한 AI 제품을 출시했습니다. 대형 모델 애플리케이션을 구현하는 데 더 능숙한 회사는 어디일까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!