집중, 완벽함, 평판, 속도 및 비용.
Zhou Ming은 Lanzhou Technology의 창립자이자 CEO입니다. 그는 Lei Jun의 인터넷 "7자 규칙"에 "비용"이라는 단어를 추가한 "대형 모델 구현을 위한 9자 규칙"을 제안했습니다.
그는 2024년을 대형 모델의 원년이라고 불렀지만, 동시에 이것이 모든 곳에 금이 있다는 것을 의미하지는 않는다고 단호하게 말했습니다.
대형 모델의 구체적인 구현에 대해 Zhou Ming은 자신이 이끄는 대형 모델 창업 팀 Lanzhou Technology와 함께 모범을 보였습니다. Mencius 대형 모델을 기반으로 한 시나리오 중심의 Lanzhou의 "1개 수평 및 N 수직" 시스템을 사용하여, 제품 출시.
간단히 말하면 기술과 응용의 이륜차입니다. 첨단 기술을 적극적으로 연구하고 습득하면서 이러한 기술의 효과적인 적용을 보장하기 위해 최선을 다하고 있습니다.
3월 18일 란저우 대형 모델 기술 및 제품 출시 컨퍼런스에서 란저우 기술은 Zero-One Wanshi와 전략적 협력 계약도 체결했습니다.
현장에서 시노베이션 벤처스(Sinovation Ventures) 회장이자 제로원에브리씽(Zero-One Everything) CEO인 이개푸는 세계 최고의 대규모 모델 지능이 인간 평균 지능 수준의 3배에 달했다고 공유했다. 즉, 100개의 질문은 일반 사람들만 답할 수 있습니다. 33개의 질문에 올바르게 답한 반면, 최고의 대형 AI 모델은 99개 이상의 질문에 올바르게 답할 수 있습니다.
그는 AI 2.0 시대의 미래 4가지 주요 트렌드를 기대했습니다.
가장 혁신적인 AI 2.0 애플리케이션은 AI-First/AI-Native여야 합니다. 마침내 눈에 띄는 애플리케이션은 다음과 같은 선구자들의 것입니다. 새로운 기술에 과감하게 투자하세요. 대규모 언어 모델의 도입은 AI 우선 애플리케이션에 큰 자극을 가져왔습니다.
대형 모델은 텍스트로 시작하여 향후 "모든 모드"로 확장될 예정입니다. 크로스 모달 생성 기술은 인지 및 의사 결정 지능을 실현하는 전환점입니다. 현실 세계의 정보는 텍스트, 오디오, 시각, 센서 및 다양한 인간의 접촉 감각으로 구성된 포괄적인 시스템입니다. 현실 세계를 보다 정확하게 시뮬레이션하려면 텍스트-이미지, 텍스트-이미지 등 다양한 모달 기능을 열어야 합니다. 비디오 및 기타 크로스 모달 시스템 또는 전체 모달 포괄적 기능.
AI 2.0은 대화를 넘어 채팅 도구부터 스마트 생산성 도구까지, 사용자 경험은 물론 미래의 대화형 인터페이스와 비즈니스 모델까지 큰 변화를 겪게 될 것입니다.
AI 2.0은 물리적으로 구현되어 사회적 생산성을 크게 향상시킬 것입니다. 구현된 지능을 통해 로봇은 로봇을 제조할 수 있으며 AI 2.0+ 생산 라인의 지능형 계획을 더욱 실현할 수 있습니다.
10B-100B 매개변수 대형 모델 연구 개발에 집중
Lanzhou Technology는 2021년 6월에 설립되었습니다. 중국에서 대형 모델 사업을 시작한 최초의 팀 중 하나입니다.
란저우는 지난해 3월 Mencius GPT V1(MChat)을 올해 1월 출시했으며 Mencius 대형 모델 GPT V2(맹자 대형 모델 - 표준, 맹자 대형 모델 - 경량, 맹자 대형 모델 - 금융, 맹자 대형 모델 포함) 코딩)을 공개하고 있습니다.
최근 Lanzhou 팀은 Mengzi3-13B의 대형 모델 훈련을 완료했습니다.
한 가지 더, Mengzi 대규모 모델 훈련 뒤에는 큰 기여자가 있습니다. 즉 웹 페이지, 코드, 책, 서류 등
보도에 따르면 이달 말(3월 30일) Mengzi3-13B 모델이 GitHub, HuggingFace, Moda 및 Shizhi AI 커뮤니티에 오픈 소스로 공개될 예정입니다.
오픈소스 Mencius 모델 버전이 13B인 이유는 무엇인가요? Zhou Ming은 이 질문에 정면으로 대답했습니다.
우선, 란저우는 ToC로 보완된 ToB 시나리오 서비스에 중점을 두고 있습니다.
실습 결과 ToB 시나리오에서 가장 많이 사용되는 대형 모델의 매개변수는 대부분 7B, 13B, 40B, 100B이며 전체 매개변수는 10B~100B 사이에 집중되어 있는 것으로 나타났습니다.
둘째, 이 범위 내에서는 ROI 관점에서 현장의 요구를 충족할 뿐만 아니라 가장 비용 효율적입니다.
그래서 오랫동안 Lanzhou의 목표는 10B-100B 매개변수 규모 내에서 대규모 산업 모델을 구축하는 것이었습니다. 이는 오픈 소스 버전으로 13B를 선택한 이유를 이해하는 것을 불가능하게 만듭니다.
Zhou Ming은 자신이 실제로 스케일링 법칙을 믿는 사람이지만 기업가 정신은 과학 연구와 다르다고 설명했습니다.
" 첫째, 이 크기의 대형 모델은 이미 문제의 80%를 해결할 수 있습니다. 둘째, 팀이 상대적으로 안정적이며 계속 확대되는 모델 규모 경쟁으로 인해 불안해하지 않을 것입니다." 이렇게 하면 차분한 사고를 통해 비용을 효율적으로 관리하고 GPU 컴퓨팅 성능, 데이터 및 인력에 대한 불필요한 경쟁을 피할 수 있습니다.
"하나의 수평 N 수직" 시스템
기자회견에서 란저우는 자체적인 하나의 수평 N 수직 시스템을 발표했습니다.
"Yi 수평"은 맹자의 대형 모델 기술을 기반으로 개발된 각 모델인 모델 레이어입니다.
"N 수직"은 맹자의 대형 모델을 기반으로 하는 ToB 애플리케이션에 가장 중요한 기술이자 제품입니다.
란저우는 현재 금융 산업, 보조 프로그래밍 및 기타 분야에 주력하고 있으며 보다 포괄적이고 전문적이며 고품질의 현장 데이터를 통해 산업 시나리오에 더 가까운 대규모 수직 모델을 만드는 것을 목표로 하고 있는 것으로 이해됩니다.
Mencius GPT 범용 대형 모델의 "One Horizon"을 기반으로 Lanzhou Technology의 파트너이자 최고 제품 책임자인 Li Jingmei는 다음을 포함하여 Lanzhou의 응용 가능 제품을 소개했습니다.
AI 문서 이해: 전문가를 포괄 PDF 문서 구문 분석 기능 및 정보 추출 기능은 RAG 솔루션에서 문서 이해를 위한 더 나은 기본 기능을 제공합니다.
AI 문서 Q&A: 기업 요구에 따른 민영화된 기업 지능형 지식 기반 구축을 위한 솔루션 기능 제공
AI 문서 지원 작성 지원; 사용자는 여러 문서를 참조 자료로 업로드하고, 맞춤형 다단계 질문 및 작성 개요를 지원하며, 필요에 따라 기사의 완전한 첫 번째 초안을 자동으로 생성할 수 있는 대형 모델을 지원합니다.
기계 번역 플랫폼: 세계 주요 중국어 번역에 중점을 둡니다. 20개 이상의 분야에 대한 언어 및 전문 번역
Lanzhou Intelligence: 회의 내용의 지능형 분석 및 질문 및 답변에 중점을 둔 제품으로, 대형 모델을 기반으로 구축된 대형 모델 기반 지능형 회의 도우미입니다. AI 검색: 대규모 언어 모델 시대의 검색 엔진입니다.
지난 1년 동안 대형 모델 분야는 날이 갈수록 변화해 왔습니다.
우리는 OpenAI가 하는 모든 일을 할 것입니다. 단기적으로는 괜찮지만, 우리만의 혁신적인 아이디어가 있어야 합니다.
Zhou Ming은 강점을 활용하고 약점을 피하며 자신만의 고유한 혁신 경로를 찾는 방법에 대한 자신의 견해를 표현했습니다.
가장 중요한 첫 번째 단계는 회사가 명확한 포지셔닝을 갖는 것입니다. Lanzhou Technology의 포지셔닝은 중국의 다른 대형 모델 스타트업과 크게 다릅니다.
예를 들어 란저우는 "대형 모델 기술 + 엔터프라이즈 시나리오 애플리케이션"을 제공하는 종합 회사로 자리매김하고 있습니다. "우리는 기술적인 관점에서 애플리케이션을 가장 잘 이해할 수 있고 애플리케이션 관점에서 기술을 가장 잘 이해할 수 있기를 바랍니다. 동시에 시간이 지나면 기술과 애플리케이션이 생태학적 연결을 형성하여 양측이 빠르게 반복할 수 있기를 바랍니다. "
동시에 구현을 통해 가치를 창출하고 혁신을 주도하려면 구현에 집중하고 구현하는 것이 여전히 필요합니다.
그리고 혁신과 구현은 서로를 보완한다는 점에 유의해야 합니다.
무작정 혁신하거나 맹목적으로 구현하지 말고, 이 둘을 연결하여 빠르게 반복하도록 하세요.
마지막으로 Zhou Ming도 진심을 담아 상기시켰습니다.
올해는 대형 모델 출시 첫해라서 곳곳에 금이 있죠? 아니요, 우리는 많은 곳을 탐험하지 못했다고 책임감 있게 말할 수 있습니다.
예를 들어, 대형 모델이 착지하는 라스트 마일을 어떻게 해결할 수 있을까요? 빅모델의 비즈니스 모델은 무엇인가? 전달력을 강화하려면? 제품 상용화를 개선하는 방법은 무엇입니까?
대형 모델의 출시가 이제 막 시작되었습니다.
— 작성자에게 문의 —
위 내용은 Lanzhou는 모든 노력을 기울일 것을 주장합니다. ToB 장면을 구현하려면 10B 매개변수를 가진 대형 모델이면 충분합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!