


국내 대형 AI 모델의 '안드로이드 모멘트'가 도래했다! Alibaba Cloud Tongyi Qianwen은 무료 오픈 소스이며 상업적 용도로 사용 가능합니다.
메타 해외에 이어 알리바바는 인공지능(AI) 대형 모델의 '안드로이드 모멘트' 트렌드를 촉진하는 또 하나의 기술 거대 기업으로 거듭났다
Beijing Business Daily의 보도에 따르면 Alibaba Cloud는 8월 3일 목요일에 오픈 소스 일반 질문 및 답변 모델 Qwen-7B와 대화 모델 Qwen-7B-Chat을 출시할 예정입니다. 두 모델 모두 70억 개의 매개변수를 가지고 있습니다. 그들은 중국 최초의 "Model as a Service" 개방형 플랫폼인 Magic Community를 출시했으며 무료로 사용할 수 있으며 상업적인 사용도 허용됩니다
사용자는 오픈 소스 코드를 통해 Qwen-7B 및 Qwen-7B-Chat을 수량화하고 소비자급 그래픽 카드에서 모델을 배포 및 실행할 수 있습니다. Moda 커뮤니티에서 모델을 직접 다운로드하거나 Alibaba Cloud Lingji 플랫폼을 통해 Qwen-7B 및 Qwen-7B-Chat에 액세스하여 호출할 수 있습니다. Alibaba Cloud는 사용자에게 모델 훈련, 추론, 배포 및 미세 조정을 포함한 서비스를 제공합니다
매직타워 커뮤니티에는 Tongyi Qianwen 모델의 설치 방법, 공간 만들기 경험, 모델 추론 및 모델 훈련의 모범 사례를 소개하는 게시물이 있으며, 모델 링크 및 다운로드 상황의 스크린샷도 첨부합니다.
공개 정보에 따르면 Qwen-7B는 2조 2천억 개가 넘는 토큰의 중복 제거 및 필터링된 데이터를 사용하여 사전 훈련된 기본 모델입니다. 중국어, 영어 등 다국어를 지원하며 컨텍스트 창 길이는 8k입니다. 모델에는 고품질 중국어, 영어, 다국어, 코드, 수학 및 기타 데이터가 포함되어 있으며 전체 네트워크 텍스트, 백과사전, 서적, 코드, 수학 및 다양한 분야의 수직 분야를 포괄합니다
MMLU 평가 결과에 따르면 Qwen-7B는 영어 평가에서 좋은 성적을 거두어 다른 유사한 오픈 소스 사전 학습 모델을 능가하고 더 큰 규모의 모델과 경쟁력을 갖췄습니다. 중국 평가에서는 Qwen-7B가 C-Eval 검증 세트에서 가장 높은 점수를 획득했으며 더 큰 규모의 모델에서도 경쟁력을 보였습니다
다음은 Qwen-7B의 MMLU 5발 정확도 결과 비교입니다
Alibaba Cloud는 정렬 메커니즘을 통해 기본 모델을 기반으로 AI 보조 Qwen-7B-Chat을 구축했습니다. 이는 Transformer를 기반으로 한 중국어 및 영어 대화의 대규모 언어 모델로, 인간 인식과의 정렬을 성공적으로 달성했습니다. 이 모델은 다양한 주제를 다루는 온라인 텍스트, 전문 서적, 코드 등 다양한 사전 학습 데이터를 사용합니다
C-Eval 검증 세트와 MMLU 평가 세트 모두에서 Qwen-7B-Chat 모델의 제로샷 정확도는 다른 유사한 정렬 모델을 능가합니다
다음은 C-Eval 테스트 세트의 제로샷 정확도 결과를 비교한 것입니다
알리바바 클라우드는 중국 최초의 대형 기술 기업으로 오픈소스 대형 모델 대열에 합류했으며, 올해 7월 OpenAI와 Google의 모델을 대체할 수 있는 Meta를 탑재한 오픈소스 AI 모델 Llama 2의 상용 버전을 공동 출시했습니다. . 또한 Zhipu AI와 Tsinghua KEG Laboratory는 7월에 중국 최고의 오픈소스 대형 모델도 발표했습니다
오픈 소스 모델의 장점은 사용자 수용도를 높이고 인공 지능 처리를 위한 더 많은 데이터를 제공한다는 것입니다. LLM의 데이터 용량이 클수록 그 기능은 더욱 강력해집니다. 또한 오픈 소스 모델은 연구원과 개발자가 취약점을 발견하고 해결하여 기술 및 보안 수준을 향상시키는 데 도움이 됩니다
2023년 4월 Alibaba Cloud Summit에서 Alibaba는 기업에 Tongyi Qianwen을 개방한다고 발표했습니다. 이를 통해 기업은 Tongyi Qianwen의 기능을 사용하여 자체 대형 모델을 교육할 수 있습니다
Alibaba Cloud Intelligence 그룹 최고 기술 책임자(CTO) Zhou Jingren은 앞으로 기업은 Alibaba Cloud의 Tongyi Qianwen 기능을 최대한 활용하고 자체 산업 지식과 애플리케이션 시나리오를 결합하여 맞춤형 기업 대형 모델을 교육할 수 있다고 말했습니다. 예를 들어, 각 회사는 자체 지능형 고객 서비스, 지능형 쇼핑 가이드, 지능형 음성 도우미, 카피라이팅 도우미, AI 디자이너 및 자율 주행 모델 및 기타 기능을 보유할 수 있습니다
Alibaba 그룹 CEO이자 Alibaba Cloud Intelligence Group CEO인 Zhang Yong은 모든 Alibaba 제품이 Tongyi Qianwen 대형 모델과 통합될 것이라고 말했습니다
Alibaba Cloud는 더 많은 기업이 대형 모델을 사용하여 AI 시대의 요구 사항에 적응할 수 있도록 지원하여 각 기업이 업계 역량을 갖춘 고유한 대형 모델을 보유하고 Tongyi Qianwen을 기반으로 재구성할 수 있기를 바랍니다
위 내용은 국내 대형 AI 모델의 '안드로이드 모멘트'가 도래했다! Alibaba Cloud Tongyi Qianwen은 무료 오픈 소스이며 상업적 용도로 사용 가능합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











8월 5일 이 웹사이트의 소식에 따르면 Alibaba Cloud는 2024년 Yunqi 컨퍼런스가 9월 19일부터 21일까지 항저우 Yunqi 타운에서 개최될 것이라고 발표했습니다. 3일간의 메인 포럼, 400개의 하위 포럼 및 병행 주제가 있을 예정입니다. 약 4만 평방미터의 전시 면적도 있습니다. Yunqi Conference는 무료이며 대중에게 공개됩니다. 이제부터 일반인은 Yunqi Conference 공식 웹사이트를 통해 5,000위안의 전체 티켓을 구매할 수 있습니다. 티켓 웹사이트는 다음 웹사이트에 첨부되어 있습니다. https://yunqi.aliyun.com/2024 /ticket-list 보고서에 따르면 Yunqi 컨퍼런스는 2009년에 시작되었으며 원래 2011년에 첫 번째 중국 웹사이트 개발 포럼으로 명명되었으며 2015년에 Alibaba Cloud 개발자 컨퍼런스로 발전했습니다. , 공식적으로 "Yunqi 회의"로 이름이 변경되었으며 계속해서 성공적인 움직임을 이어왔습니다.

5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

1. TensorRT-LLM의 제품 포지셔닝 TensorRT-LLM은 NVIDIA에서 LLM(대형 언어 모델)을 위해 개발한 확장 가능한 추론 솔루션입니다. TensorRT 딥 러닝 컴파일 프레임워크를 기반으로 계산 그래프를 구축, 컴파일 및 실행하고 FastTransformer의 효율적인 커널 구현을 활용합니다. 또한 장치 간 통신에는 NCCL을 활용합니다. 개발자는 커틀라스를 기반으로 한 맞춤형 GEMM을 개발하는 등 기술 개발 및 수요 차이를 기반으로 특정 요구 사항을 충족하도록 운영자를 맞춤화할 수 있습니다. TensorRT-LLM은 고성능을 제공하고 실용성을 지속적으로 개선하기 위해 노력하는 NVIDIA의 공식 추론 솔루션입니다. 텐서RT-LL

4월 4일 뉴스에 따르면 중국 사이버공간국은 최근 등록된 대형 모델 목록을 공개했는데, 여기에 차이나 모바일의 'Jiutian Natural Language Interaction Large Model'이 포함돼 있어 차이나 모바일의 Jiutian AI 대형 모델이 공식적으로 생성 인공 지능을 제공할 수 있음을 알렸다. 외부 세계에 대한 정보 서비스. 차이나 모바일은 이 모델이 중앙 기업이 개발한 최초의 대규모 모델로 국가 '생성 인공 지능 서비스 등록'과 '국내 심층 합성 서비스 알고리즘 등록' 이중 등록을 모두 통과했다고 밝혔습니다. 보고서에 따르면 Jiutian의 자연어 상호 작용 대형 모델은 향상된 산업 역량, 보안 및 신뢰성을 갖추고 있으며 풀 스택 현지화를 지원하며 90억, 139억, 570억, 1000억 등 다양한 매개변수 버전을 형성했습니다. 클라우드에 유연하게 배포할 수 있으며 엣지와 엔드는 상황이 다릅니다.

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

시험 문제가 너무 단순하면 상위권 학생과 하위 학생 모두 90점을 받을 수 있어 격차가 더 벌어질 수 없다… 클로드3, 라마3, 심지어 GPT-5 등 더욱 강력한 모델이 출시되면서 업계는 보다 어렵고 차별화된 모델 벤치마크가 시급히 필요합니다. 대형 모델 아레나를 운영하는 조직인 LMSYS가 차세대 벤치마크인 Arena-Hard를 출시해 큰 관심을 끌었습니다. Llama3 명령의 두 가지 미세 조정 버전의 강점에 대한 최신 참조도 있습니다. 이전에 비슷한 점수를 받았던 MTBench와 비교하면 Arena-Hard 판별력이 22.6%에서 87.4%로 증가해 한눈에 봐도 강하고 약해졌습니다. Arena-Hard는 경기장의 실시간 인간 데이터를 사용하여 구축되었으며 인간 선호도와 89.1%의 일치율을 가지고 있습니다.

6월 13일 뉴스에 따르면 Byte의 'Volcano Engine' 공개 계정에 따르면 Xiaomi의 인공 지능 비서인 'Xiao Ai'가 Volcano Engine과 협력을 이루었습니다. 두 당사자는 beanbao 대형 모델을 기반으로 보다 지능적인 AI 상호 작용 경험을 달성할 것입니다. . ByteDance가 만든 대형 빈바오 모델은 매일 최대 1,200억 개의 텍스트 토큰을 효율적으로 처리하고 3,000만 개의 콘텐츠를 생성할 수 있는 것으로 알려졌습니다. Xiaomi는 Doubao 대형 모델을 사용하여 자체 모델의 학습 및 추론 능력을 향상시키고 사용자 요구를 보다 정확하게 파악할 뿐만 아니라 보다 빠른 응답 속도와 보다 포괄적인 콘텐츠 서비스를 제공하는 새로운 "Xiao Ai Classmate"를 만들었습니다. 예를 들어, 사용자가 복잡한 과학 개념에 대해 질문하면 &ldq
