많은 회사들이 대형 모델을 기반으로 한 AI 제품을 출시했습니다. 대형 모델 애플리케이션을 구현하는 데 더 능숙한 회사는 어디일까요?
"AI 없이는 산업도 없고, AI 없이는 애플리케이션도 없다." AI(인공지능) 대형 모델 기술의 구현으로 AI 애플리케이션이 곳곳에서 피어나고 있습니다. 최근 많은 기업들이 대형 모델을 기반으로 한 AI 응용 제품을 출시하고 있다. 수백가지 모델의 전쟁시대, 국산 대형 응용제품은 어떻게 개발할 것인가? 더 넓은 컴퓨팅 성능 지원을 제공하고 더 적합한 애플리케이션 시나리오를 찾는 방법은 무엇입니까?
실시간 사진을 게시하세요.
6월 1일, Alibaba Cloud는 Tongyi 대형 모델의 최신 진행 상황을 공개하고 오디오 및 비디오 콘텐츠에 초점을 맞춘 새로운 AI 제품 "Tongyi Listening"을 출시하여 공개 테스트를 위해 공개된 중국 최초의 대형 모델 애플리케이션 제품이 되었습니다. 일부 전문가들은 클라우드 컴퓨팅이 대규모 모델을 구축하는 데 가장 적합한 형태이며, 대규모 모델의 진화가 기존 클라우드 컴퓨팅 아키텍처의 새로운 전환을 시작할 수 있다고 믿습니다.
Alibaba Cloud의 새로운 AI 제품 “Tongyi Tingwu”가 공개 테스트 중입니다
기자는 알리바바 클라우드가 이번에 출시한 'Tongyi Listening'이 'Tongyi Qianwen' 대형 모델의 이해 및 요약 기능과 연결되어 오디오에 중점을 둔 업무 학습용 AI 제품이라는 사실을 출시 현장에서 알게 되었습니다. 그리고 비디오 분야. '통이리스닝'은 기존 녹음 소프트웨어의 콘텐츠 피드백과 달리 실시간 녹음을 기반으로 대화 내용을 텍스트 형태로 사용자에게 보다 직관적으로 제시하고, 아카이브 및 요약할 수 있다. 다국어 커뮤니케이션 시나리오의 경우 "Tongyi Listening"은 향후 번역 기능도 출시하여 언어 차이를 해소하고 진정한 커뮤니케이션이 장벽 없이 완료될 수 있도록 할 것입니다.
"Tongyi Listening"은 음성 콘텐츠를 실시간으로 녹음하는 것 외에도 동영상 정보를 독립적으로 처리하고, 간략한 요약을 생성하고, 콘텐츠를 분할하고, 중심 아이디어를 추출하고, 사용자 요구에 따라 해당 동영상 클립을 찾을 수도 있습니다. "Tongyi Tingwu"는 Alibaba Cloud Disk와도 연결되어 있으며 사용자는 Alibaba Cloud Disk에서 "Tongyi Tingwu"로 비디오를 쉽게 업로드하여 처리할 수 있어 사용자의 작업 효율성과 사용자 경험이 크게 향상됩니다.
일반 사용자의 사무실 및 학습 요구 사항을 처리하는 것 외에도 "Tongyi Listening"은 다른 하위 부서의 다양한 그룹을 위한 맞춤 기능도 설정합니다. Chrome 플러그인을 사용하여 외국어 학습자와 청각 장애인이 사용할 수 있습니다. 이중 언어 플로팅 자막 일정이 자주 겹치는 전문가를 위해 자막 없이 동영상을 시청하세요. "Tongyi Listening"은 음소거 상태에서 회의에 참여하기 위한 '회의 대기자'로도 사용할 수 있으며, AI가 회의를 녹음하고 핵심 내용을 정리합니다. 포인트들.
"우리는 기술 변화의 시대에 살고 있습니다." Alibaba Cloud Intelligence의 최고 기술 책임자인 Zhou Jingren은 "AI가 발전함에 따라 더 많은 AI 보조자가 탄생할 것입니다. 이는 효율성을 향상시킬 뿐만 아니라"라고 말했습니다. 우리의 삶의 경험을 크게 향상시킬 수 있습니다.”
국내 기술 대기업들의 레이아웃 가속화, AI대형 모델 경쟁 심화
'Tongyi Tingwu' 대형 모델의 구현이 실용화 단계에 들어섰고, 이는 의심할 여지 없이 업계에 센세이션을 일으켰습니다. 하지만 이번 대회에 국내 인터넷 기술계에는 수많은 경쟁업체가 참여하고 있으며, 알리바바 클라우드만이 유일한 플레이어는 아니라는 점에 유의해야 한다. 이 기간 동안 '전복' 바람은 계속해서 거세졌다. 새로운 대형 AI 모델이 점점 더 많이 탄생하고 있으며, 기존 대형 AI 모델도 점점 더 강력해지고 있습니다. 기자의 리뷰에 따르면 현재 이 분야에는 동일한 시장을 공유하고 동일한 미개척 영역을 탐색하려는 경쟁자가 많이 있습니다.
첫 번째는 바이두(Baidu)와 알리바바(Alibaba)로 대표되는 '거대 세력'입니다. 올해 3월 16일 Baidu의 "Wen Xin Yi Yan"이 빠르게 출시되어 한 달도 채 지나지 않아 4월 11일 Alibaba Cloud Intelligence에서 열린 Alibaba Cloud Summit에서 국내 대규모 언어 모델의 혁신을 알렸습니다. 최고 기술 책임자(CTO) Zhou Jingren은 대형 언어 모델 "Tongyi Qianwen"의 출시를 공식적으로 발표했습니다. Baidu와 Alibaba는 오늘날 AI가 업계에 가져올 수 있는 파괴적인 힘을 깊이 이해하고 있습니다.
샤오미, 360, Zhihu 등 '인터넷 기술 학교'가 이어졌습니다. 샤오미 그룹이 올해 3월 AI 대형 모델을 탐색 중이라고 밝힌 후, 5월 24일 저녁 1분기 재무 보고 컨퍼런스 콜에서 루 웨이빙 샤오미 회장은 회사가 4월에 공식적으로 AI 실험실 대형 모델 팀을 설립했다고 밝혔습니다. 현재 AI 관련 종사자는 1,200명 이상이다. Lu Wei는 "Xiaomi는 대형 모델을 적극적으로 수용할 것이지만 Open AI와 같은 일반적인 대형 모델을 만들지는 않을 것입니다. 대신 비즈니스와 긴밀하게 통합 및 협력하고 AI 기술을 사용하여 내부 효율성을 향상할 것입니다."라고 말했습니다.
지후는 지난 4월 '2023 Zhihu Discovery Conference'에서 대규모 언어 모델 'Zhihaitu AI'를 출시하고 사이트에서 최초의 대규모 모델 적용 기능인 'Hot List Summary'를 내부 테스트했습니다. 한 달 후 Zhihu는 5월 18일 360그룹 CEO Zhou Hongyi 이사회 의장이 열린 제7차 세계 인텔리전스 컨퍼런스에서 '2023 디지털 엑스포' 사이트에 또 다른 대규모 모델 응용 기능인 '검색 집계'를 선보였습니다. , 2종의 대형 모형제품 '360 지능형 브레인'과 AI 그리기 도구 '360 홍투'를 시연했다.웨이모브는 지난 5월 24일 대형 모델 기반의 AI 응용 제품인 WAI를 출시했습니다. 출시일 현재 Weimob WAI는 "단어 제작, 문자 메시지 템플릿, 제품 설명, 잔디 심기 메모, 라이브 방송 스크립트, 공개 계정 트윗, 짧은 비디오 제품 카피라이팅"을 포함한 25개의 실용적인 응용 시나리오를 공식적으로 출시했습니다.
이 외에도 iFlytek, SenseTime, Yuncong으로 대표되는 '막대기 세력'도 있습니다. 이들 기업은 AI 산업의 정점에 있든, 최저점에 있든 항상 AI 최전선에 굳건히 서 있었다. 수년간 열심히 일해 온 '오버로드'는 따라잡으려는 새로운 세력과 충돌하게 된다. 아이플라이텍은 국내 제조사 중 최초로 대형 모델을 실제 상황에 적용한 기업으로, 현재 교육, 사무, 자동차 등 산업을 위한 솔루션을 출시한 것으로 알려졌다.
중국 과학 기술 정보 연구소가 발표한 보고서에 따르면 불완전한 통계에 따르면 2020년부터 2023년까지 중국은 매개변수가 10억 개가 넘는 대형 모델 79개를 출시했습니다. 업계 관계자들은 국산 대형 모델이 급증하는 것은 오픈AI가 가져온 '메기효과'에 기업들이 대응한 데 따른 것도 있고, 다른 한편으로는 개발이 가져올 장기적인 이익과 파워업화 때문이라고 보고 있다. 대형 모델이 업계에 가져올 수 있습니다. 주요 기업들은 시장 점유율을 놓고 경쟁하고 블록버스터 제품을 출시하며 인공 지능의 지속적인 업그레이드와 진화를 촉진하고 있습니다. AI 대형 모델 경쟁이 치열해지면서 '100개 모델 전쟁'이 본격화된다.
배치가 왕입니다. 대형 모델 제품이 "화려함"을 피할 수 있는 방법은 무엇입니까?
알리바바 CEO 장용은 인공지능 시대에는 모든 제품이 대규모 모델을 이용해 재구성될 가치가 있다고 말했습니다. “대형모델 시대가 가져온 엄청난 기회에 직면해 다양한 기업들이 생태적 틈새시장을 선점하기 위해 서두르고 있습니다. 확실한 상용화 전망과 실제 구현 서비스 역량 지원이 없다면 아무리 목소리가 커도 얻기 어려울 것입니다. 가장 진보된 대규모 모델 성공.신생 제품으로서 대형 모델 구현이 얼마나 쉬운가? 일부 분석가들은 대형 모델의 구상과 제품화 사이에 두 가지 주요 문제가 있다고 생각합니다. 교육 시장은 새로운 기술로서 고객을 교육하는 단계에서 수요 측에서는 대형 모델의 기능 경계를 명확하게 이해하지 못하고 있습니다. 특정 세분화된 시나리오를 구현하려면 기업과 고객이 함께 발전해야 합니다
.ChatGPT의 출현은 실제로 소프트웨어 사용자가 AI에 관한 과학을 대중화하는 데 도움이 되었으며, 이는 어느 정도 대규모 언어 모델의 상업적 응용 프로그램에 대한 더 많은 수요를 가져왔습니다. 이번에 알리바바 클라우드가 출시한 '퉁이 리스닝(Tongyi Listening)'은 시나리오 기반 요구에 적응한 대형 모델 제품의 좋은 예다. 장기간 사용하면 사용자는 AI와 '나란히 일하는' 작업 습관을 기를 수도 있다. 이는 기업에게 매우 중요한 잠재 소비자 시장이라고 합니다.
또 다른 문제는 비용입니다. 다양한 세분화 시나리오에서 구현된 AI에는 다양한 훈련 코퍼스가 필요합니다. 효과적이고 사용하기 쉬운 대규모 모델을 얻으려면 충분하고 타겟화된 코퍼스에 투자해야 하며 이는 많은 비용 투자와 심층적인 기술 지식을 의미합니다. Huawei Cloud 인공지능 분야 수석 과학자 Tian Qi는 대형 모델을 개발하고 훈련하는 데 한 번에 1,200만 달러가 소요된다고 말했습니다. 서비스를 받으려면 높은 수수료를 지불해야 하는데, 이는 높은 자본 및 기술적 한계를 직관적으로 반영한 것입니다. 예를 들어, iFlytek Spark 인지 대형 모델을 기반으로 구축된 "iFlytek Hearing"은 19.8위안/2시간에서 888위안/100시간 범위의 음성-텍스트-기계 빨리 감기 기능 패키지를 갖추고 있습니다. GPT-3 모델을 "더 스마트한" GPT-4로 업그레이드하려면 월 20달러가 추가로 필요합니다.
또한, 국내 대형 AI 모델의 경우 컴퓨팅 성능도 또 다른 핵심 문제입니다. 대형 모델을 생성하려면 포괄적인 컴퓨팅 인프라가 필요하며, 클라우드 컴퓨팅은 대형 모델을 구축하는 데 가장 적합한 형태입니다. 그러나 대규모 모델 기술의 구현으로 인해 기존 클라우드 컴퓨팅 아키텍처에 영향과 변화가 있을 수 있으며, 보다 강력한 컴퓨팅 노드와 저장 장치를 추가하고 데이터 전송 속도와 안정성을 최적화하며 맞춤형 솔루션을 제공해야 합니다.
향후 대형 모델 개발 역시 보안과 진정성 문제에 직면하게 될 것입니다. 올해 4월 중국 사이버공간관리국은 '생성인공지능 서비스 관리 대책(의견 초안)'을 발표해 국가가 다음과 같은 기초 기술의 독립적인 혁신, 홍보, 적용, 국제 협력을 지원하도록 제안했다. 인공 지능 알고리즘 및 프레임워크를 사용하고 안전하고 신뢰할 수 있는 소프트웨어, 도구, 컴퓨팅 및 데이터 리소스의 채택을 장려합니다. 동시에 생성 인공지능 제품은 서비스를 제공하기 전에 보안 평가를 선언해야 한다고 제안되었습니다.
업계 관계자에 따르면 대형 모델 기술은 사회 발전의 기회를 가져오지만 다양한 거버넌스 문제도 가져옵니다. 다음 단계는 혁신 생태계를 조성하는 것뿐만 아니라 위험 예방에도 주의를 기울이는 것입니다. 이러한 문제를 해결해야만 대규모 모델이 그 잠재력을 충분히 발휘하고 다양한 분야에서 널리 사용될 수 있습니다.
대규모 대회에서는 누가 지금 가장 빨리 달릴 수 있는지가 아니라, 앞으로도 누가 더 발전할 수 있는지가 중요합니다. ChatGPT와 경쟁할 수 있는 국내 AI 애플리케이션이 있는지 계속해서 주목해 보겠습니다.
작성자: 아오이뉴스 관우휘 기자
인턴: Xin Yu
위 내용은 많은 회사들이 대형 모델을 기반으로 한 AI 제품을 출시했습니다. 대형 모델 애플리케이션을 구현하는 데 더 능숙한 회사는 어디일까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

"높은 복잡성, 높은 단편화 및 교차 도메인"은 항상 운송 산업의 디지털 및 지능적 업그레이드로 가는 길의 주요 문제점이었습니다. 최근에는 China Vision, Xi'an Yanta District Government, Xi'an Future Artificial Intelligence Computing Center가 공동으로 구축한 매개변수 규모 1,000억 규모의 '친링·친추안 교통 모델'이 스마트 교통 및 스마트 교통 분야를 지향하고 있습니다. 시안과 그 주변 지역에 서비스를 제공하여 스마트 교통 혁신의 거점을 만들 것입니다. '친링·친추안 교통 모델'은 개방형 시나리오의 시안의 대규모 지역 교통 생태 데이터, China Vision이 독자적으로 개발한 독창적인 고급 알고리즘, 시안 미래 인공 지능 컴퓨팅 센터의 Shengteng AI의 강력한 컴퓨팅 성능을 결합하여 도로를 제공합니다. 네트워크 모니터링, 비상 명령, 유지 관리, 대중 교통 등 스마트 교통 시나리오는 디지털 및 지능적 변화를 가져옵니다. 교통 관리는 도시마다 특성이 다르며 도로 교통도 다릅니다.

1. TensorRT-LLM의 제품 포지셔닝 TensorRT-LLM은 NVIDIA에서 LLM(대형 언어 모델)을 위해 개발한 확장 가능한 추론 솔루션입니다. TensorRT 딥 러닝 컴파일 프레임워크를 기반으로 계산 그래프를 구축, 컴파일 및 실행하고 FastTransformer의 효율적인 커널 구현을 활용합니다. 또한 장치 간 통신에는 NCCL을 활용합니다. 개발자는 커틀라스를 기반으로 한 맞춤형 GEMM을 개발하는 등 기술 개발 및 수요 차이를 기반으로 특정 요구 사항을 충족하도록 운영자를 맞춤화할 수 있습니다. TensorRT-LLM은 고성능을 제공하고 실용성을 지속적으로 개선하기 위해 노력하는 NVIDIA의 공식 추론 솔루션입니다. 텐서RT-LL

4월 4일 뉴스에 따르면 중국 사이버공간국은 최근 등록된 대형 모델 목록을 공개했는데, 여기에 차이나 모바일의 'Jiutian Natural Language Interaction Large Model'이 포함돼 있어 차이나 모바일의 Jiutian AI 대형 모델이 공식적으로 생성 인공 지능을 제공할 수 있음을 알렸다. 외부 세계에 대한 정보 서비스. 차이나 모바일은 이 모델이 중앙 기업이 개발한 최초의 대규모 모델로 국가 '생성 인공 지능 서비스 등록'과 '국내 심층 합성 서비스 알고리즘 등록' 이중 등록을 모두 통과했다고 밝혔습니다. 보고서에 따르면 Jiutian의 자연어 상호 작용 대형 모델은 향상된 산업 역량, 보안 및 신뢰성을 갖추고 있으며 풀 스택 현지화를 지원하며 90억, 139억, 570억, 1000억 등 다양한 매개변수 버전을 형성했습니다. 클라우드에 유연하게 배포할 수 있으며 엣지와 엔드는 상황이 다릅니다.

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

시험 문제가 너무 단순하면 상위권 학생과 하위 학생 모두 90점을 받을 수 있어 격차가 더 벌어질 수 없다… 클로드3, 라마3, 심지어 GPT-5 등 더욱 강력한 모델이 출시되면서 업계는 보다 어렵고 차별화된 모델 벤치마크가 시급히 필요합니다. 대형 모델 아레나를 운영하는 조직인 LMSYS가 차세대 벤치마크인 Arena-Hard를 출시해 큰 관심을 끌었습니다. Llama3 명령의 두 가지 미세 조정 버전의 강점에 대한 최신 참조도 있습니다. 이전에 비슷한 점수를 받았던 MTBench와 비교하면 Arena-Hard 판별력이 22.6%에서 87.4%로 증가해 한눈에 봐도 강하고 약해졌습니다. Arena-Hard는 경기장의 실시간 인간 데이터를 사용하여 구축되었으며 인간 선호도와 89.1%의 일치율을 가지고 있습니다.

안녕하세요 여러분 카슨입니다. 많은 프로그래머 친구들은 자신의 AI 제품 개발에 참여하고 싶어합니다. '프로세스 자동화 정도'와 'AI 적용 정도'를 기준으로 제품 형태를 4개 사분면으로 나눌 수 있습니다. 그 중 프로세스 자동화 정도는 '제품의 서비스 프로세스 중 수동 개입이 얼마나 필요한지'를 측정하고, AI 적용 정도는 '제품에서 AI가 적용되는 비율'을 측정한다. AI 사진 애플리케이션과 사용자가 이를 애플리케이션을 통해 전달하는 방식으로 UI와의 상호작용을 통해 완전한 서비스 프로세스를 완료할 수 있어 자동화 수준이 높다. 동시에 'AI 영상처리'는 AI 역량에 크게 의존하기 때문에 AI 활용도가 높다. 두 번째 사분면은 지식 관리 애플리케이션, 시간 관리 애플리케이션 및 높은 프로세스 자동화 개발과 같은 기존 애플리케이션 개발 분야입니다.
