목차
1. 개발자는 AI 엔지니어의 시대를 열고 있습니다
2 예, 최상위 레이어는 데이터입니다
3. 힌트 및 쿼리
4. 조립 라인 운영: LLMOps
5. Web3가 출시되고 대규모 모델 개발 스택이 등장합니다
기술 주변기기 일체 포함 대규모 모델 개발 도구 세트가 생성되었습니다!

대규모 모델 개발 도구 세트가 생성되었습니다!

Sep 17, 2023 pm 02:21 PM
액자 대형 모델 개발 스택

다시 작성해야 하는 콘텐츠는 다음과 같습니다. 작성자 Richard MacManus

Planning | Yan Zheng

Web3는 Web2를 전복하는 데 실패했지만 신흥 대규모 모델 개발 스택을 통해 개발자는 "클라우드 네이티브" 시대에서 새로운 AI로 이동할 수 있습니다. 기술 스택.

빠른 엔지니어는 대형 모델로 돌진하는 개발자의 신경을 건드리지 못할 수도 있지만 제품 관리자 또는 리더의 문장은 다음과 같습니다. "에이전트"를 개발할 수 있는지, "체인"을 구현할 수 있는지, "어떤 벡터가 데이터베이스를 사용하시겠습니까?"가 되었습니다. 현재 주요 주류 대형 모델 응용 회사는 기술 학생들이 AI 개발의 어려움을 극복하도록 유도했습니다.

신흥 기술 스택의 계층은 무엇입니까? 가장 어려운 부분은 어디인가요? 이 기사를 통해 알아낼 수 있습니다

1. 개발자는 AI 엔지니어의 시대를 열고 있습니다

지난 해에는 LangChain 및 LlamaIndex와 같은 일부 도구가 등장했습니다. AI 애플리케이션 개발자의 생태계가 성숙해지기 시작했습니다. 이제는 인공지능 개발에 집중하는 이들을 지칭하는 용어, 즉 'AI 엔지니어'도 등장한다. Shawn @swyx Wang에 따르면 이는 "신속한 엔지니어"를 위한 다음 단계입니다. 또한 그는 더 넓은 인공지능 생태계에서 AI 엔지니어의 위치를 ​​시각적으로 보여주는 좌표 다이어그램을 만들었습니다

대규모 모델 개발 도구 세트가 생성되었습니다!출처: swyx

대형 언어 모델(LLM)은 AI 엔지니어의 핵심 기술입니다. LangChain과 LlamaIndex가 모두 LLM을 확장하고 보완하는 도구라는 것은 우연이 아닙니다. 하지만 이 새로운 유형의 개발자가 사용할 수 있는 다른 도구는 무엇입니까?

지금까지 제가 본 LLM 스택 중 최고의 다이어그램은 벤처 캐피탈 회사인 Andreessen Horowitz(a16z)에서 나온 것입니다. 다음은 "LLM 앱 스택"에 대한 보기입니다.

대규모 모델 개발 도구 세트가 생성되었습니다!이미지 출처: a16z

2 예, 최상위 레이어는 데이터입니다

LLM 기술 스택에서 데이터는 가장 중요한 구성 요소입니다. 이것은 매우 분명합니다. a16z의 차트에 따르면 데이터가 맨 위에 있습니다. LLM에서 "임베디드 모델"은 매우 중요한 영역입니다. OpenAI, Cohere, Hugging Face 또는 점점 인기를 얻고 있는 오픈 소스 LLM을 포함하여 수십 가지 다른 LLM 옵션 중에서 선택할 수 있습니다.

LLM을 사용하기 전에 "데이터 파이프라인"도 필요합니다 설립될 예정이다. 예를 들어 Databricks와 Airflow를 두 가지 예로 고려하거나 데이터가 "구조화되지 않은" 처리될 수 있습니다. 이는 데이터의 주기에도 적용되며 기업이 맞춤형 LLM에 데이터를 입력하기 전에 데이터를 "정리"하거나 간단히 구성하는 데 도움이 될 수 있습니다. Alation과 같은 "데이터 인텔리전스" 회사는 이러한 유형의 서비스를 제공합니다. 이는 IT 기술 스택에서 더 잘 알려진 "비즈니스 인텔리전스"와 같은 도구와 약간 비슷해 보입니다.

데이터 레이어의 마지막 부분은 벡터 데이터베이스입니다. LLM 데이터를 저장하고 처리하기 위해 최근에 매우 인기가 있습니다. Microsoft의 정의에 따르면 이는 데이터를 기능이나 속성의 수학적 표현인 고차원 벡터로 저장하는 데이터베이스입니다. 데이터는 임베딩 기술을 사용하여 벡터로 저장됩니다.

미디어 채팅에서 선도적인 벡터 데이터베이스 공급업체인 Pinecone은 자사 도구가 Databricks와 같은 데이터 파이프라인 도구와 함께 사용되는 경우가 많다고 언급했습니다. 이 경우 데이터는 일반적으로 다른 곳에(예: 데이터 레이크) 저장된 다음 기계 학습 모델을 통해 내장된 데이터로 변환됩니다. 처리 및 청킹 후 결과 벡터는 Pinecone로 전송됩니다

3. 힌트 및 쿼리

다음 두 레벨은 힌트 및 쿼리로 요약될 수 있습니다. 이는 LLM 및 (선택 사항) 다른 상호 작용 지점을 사용한 AI 응용 프로그램입니다. 데이터 도구 인터페이스. A16z는 LangChain 및 LlamaIndex를 "오케스트레이션 프레임워크"로 지정합니다. 즉, 개발자가 어떤 LLM을 사용하고 있는지 이해하면 이러한 도구를 활용할 수 있습니다.

a16z에 따르면 LangChain 및 LlamaIndex와 같은 오케스트레이션 프레임워크는 "추상화되어 있습니다. 세부 사항에 대한 많은 힌트가 있습니다. "연결"이란 응용 프로그램과 LLM 간의 데이터를 쿼리하고 관리하는 것을 의미합니다. 이 오케스트레이션 프로세스에는 외부 API 인터페이스와의 상호 작용, 벡터 데이터베이스에서 컨텍스트 데이터 검색, 여러 LLM 호출에 걸쳐 메모리 유지 관리가 포함됩니다. a16z의 다이어그램에서 가장 흥미로운 상자는 OpenAI, nat.dev 및 Humanloop를 포함하는 "Playground"입니다.

A16z는 블로그 게시물에 정확하게 정의되어 있지 않지만 "Playground" 도구는 개발자가 A16z를 캐스팅하는 데 도움이 될 수 있다고 추론할 수 있습니다. 큐 주짓수". 이러한 장소에서 개발자는 다양한 프롬프트 기술을 실험할 수 있습니다.

휴먼루프는 영국 회사로 플랫폼의 특징은 "Collaborative Prompt Workspace"입니다. 또한 "프로덕션 LLM 기능을 위한 완전한 개발 툴킷"이라고 설명합니다. 따라서 기본적으로 LLM을 사용해 본 다음 작동하면 애플리케이션에 배포할 수 있습니다

4. 조립 라인 운영: LLMOps

현재 대규모 생산 라인의 레이아웃이 점차 명확해지고 있습니다. 오케스트레이션 상자 오른쪽에는 LLM 캐싱 및 검증을 포함한 많은 작업 상자가 있습니다. 또한 Hugging Face와 같은 개방형 API 저장소와 OpenAI와 같은 독점 API 제공자를 포함하여 다양한 LLM 관련 클라우드 서비스 및 API 서비스가 있습니다.

이것은 우리가 "클라우드 네이티브"에서 익숙한 개발일 수 있습니다. 시대 사람 기술 스택에서 가장 유사한 점은 많은 DevOps 회사가 제품 목록에 인공 지능을 추가했다는 것입니다. 이는 우연이 아닙니다. 지난 5월에는 Harness CEO Jyoti Bansal과 이야기를 나눴습니다. Harness는 CI/CD 프로세스의 "CD" 부분에 초점을 맞춘 "소프트웨어 제공 플랫폼"을 운영합니다.

Bansai는 AI가 기존 기능을 기반으로 사양 생성부터 코드 작성까지 소프트웨어 제공 수명 주기와 관련된 지루하고 반복적인 작업을 완화할 수 있다고 말했습니다. 또한 그는 AI가 코드 검토, 취약성 테스트, 버그 수정을 자동화하고 빌드 및 배포를 위한 CI/CD 파이프라인을 생성할 수도 있다고 말했습니다. 지난 5월에 나눈 또 다른 대화에 따르면 AI는 개발자 생산성도 변화시키고 있습니다. 빌드 자동화 도구 Gradle의 Trisha Gee는 AI가 상용구 코드 작성과 같은 반복 작업에 소요되는 시간을 줄이고 개발자가 코드가 비즈니스 요구 사항을 충족하는지 확인하는 등 큰 그림에 집중할 수 있도록 하여 개발 속도를 높일 수 있다고 말했습니다.

5. Web3가 출시되고 대규모 모델 개발 스택이 등장합니다

새로운 LLM 개발 기술 스택에서는 오케스트레이션 프레임워크(예: LangChain 및 LlamaIndex), 벡터 데이터베이스 및 Humanloop와 같은 일련의 새로운 제품 유형을 관찰할 수 있습니다. "놀이터" 플랫폼을 기다리고 있습니다. 이러한 모든 제품은 현 시대의 핵심 기술인 대규모 언어 모델을 확장 및/또는 보완하고 있습니다.

지난 몇 년간 Spring Cloud 및 Kubernetes와 같은 클라우드 기반 시대 도구의 등장과 같습니다. 그러나 이제 클라우드 네이티브 시대의 거의 모든 대기업, 중소기업 및 최상위 기업은 도구를 AI 엔지니어링에 적용하기 위해 최선을 다하고 있으며 이는 LLM 기술 스택의 향후 개발에 매우 ​​도움이 될 것입니다.

네, 이번에 큰 모델은 "거인의 어깨 위에 서 있는 것"과 같습니다. 컴퓨터 기술의 최고의 혁신은 항상 이전 기반 위에 구축됩니다. 아마도 이것이 "Web3" 혁명이 실패한 이유일 것입니다. 이전 세대를 기반으로 구축한 것이 아니라 이를 찬탈하려고 시도한 것입니다.

LLM 기술 스택이 해낸 것 같습니다. 클라우드 개발 시대에서 새로운 인공 지능 기반 개발자 생태계로의 다리가 되었습니다

참조 링크: https://www.php.cn/link/ c589c3a8f99401b24b9380e86d939842

위 내용은 대규모 모델 개발 도구 세트가 생성되었습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

대형 모델 앱 Tencent Yuanbao가 온라인에 출시되었습니다! Hunyuan은 어디서나 휴대할 수 있는 만능 AI 비서로 업그레이드되었습니다. 대형 모델 앱 Tencent Yuanbao가 온라인에 출시되었습니다! Hunyuan은 어디서나 휴대할 수 있는 만능 AI 비서로 업그레이드되었습니다. Jun 09, 2024 pm 10:38 PM

5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Bytedance Beanbao 대형 모델 출시, Volcano Engine 풀스택 AI 서비스로 기업의 지능적 혁신 지원 Bytedance Beanbao 대형 모델 출시, Volcano Engine 풀스택 AI 서비스로 기업의 지능적 혁신 지원 Jun 05, 2024 pm 07:59 PM

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

산업지식 그래프 고급실습 산업지식 그래프 고급실습 Jun 13, 2024 am 11:59 AM

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

샤오미 바이트가 힘을 합쳤습니다! Xiao Ai의 Doubao 액세스 대형 모델: 휴대폰과 SU7에 이미 설치되어 있음 샤오미 바이트가 힘을 합쳤습니다! Xiao Ai의 Doubao 액세스 대형 모델: 휴대폰과 SU7에 이미 설치되어 있음 Jun 13, 2024 pm 05:11 PM

6월 13일 뉴스에 따르면 Byte의 'Volcano Engine' 공개 계정에 따르면 Xiaomi의 인공 지능 비서인 'Xiao Ai'가 Volcano Engine과 협력을 이루었습니다. 두 당사자는 beanbao 대형 모델을 기반으로 보다 지능적인 AI 상호 작용 경험을 달성할 것입니다. . ByteDance가 만든 대형 빈바오 모델은 매일 최대 1,200억 개의 텍스트 토큰을 효율적으로 처리하고 3,000만 개의 콘텐츠를 생성할 수 있는 것으로 알려졌습니다. Xiaomi는 Doubao 대형 모델을 사용하여 자체 모델의 학습 및 추론 능력을 향상시키고 사용자 요구를 보다 정확하게 파악할 뿐만 아니라 보다 빠른 응답 속도와 보다 포괄적인 콘텐츠 서비스를 제공하는 새로운 "Xiao Ai Classmate"를 만들었습니다. 예를 들어, 사용자가 복잡한 과학 개념에 대해 질문하면 &ldq

대형 모델에 대한 새로운 과학적이고 복잡한 질문 답변 벤치마크 및 평가 시스템을 제공하기 위해 UNSW, Argonne, University of Chicago 및 기타 기관이 공동으로 SciQAG 프레임워크를 출시했습니다. 대형 모델에 대한 새로운 과학적이고 복잡한 질문 답변 벤치마크 및 평가 시스템을 제공하기 위해 UNSW, Argonne, University of Chicago 및 기타 기관이 공동으로 SciQAG 프레임워크를 출시했습니다. Jul 25, 2024 am 06:42 AM

편집자 |ScienceAI 질문 응답(QA) 데이터 세트는 자연어 처리(NLP) 연구를 촉진하는 데 중요한 역할을 합니다. 고품질 QA 데이터 세트는 모델을 미세 조정하는 데 사용될 수 있을 뿐만 아니라 LLM(대형 언어 모델)의 기능, 특히 과학적 지식을 이해하고 추론하는 능력을 효과적으로 평가하는 데에도 사용할 수 있습니다. 현재 의학, 화학, 생물학 및 기타 분야를 포괄하는 과학적인 QA 데이터 세트가 많이 있지만 이러한 데이터 세트에는 여전히 몇 가지 단점이 있습니다. 첫째, 데이터 형식이 비교적 단순하고 대부분이 객관식 질문이므로 평가하기 쉽지만 모델의 답변 선택 범위가 제한되고 모델의 과학적 질문 답변 능력을 완전히 테스트할 수 없습니다. 이에 비해 개방형 Q&A는

AI 하드웨어가 다른 멤버를 추가합니다! 휴대폰을 교체하는 것보다 노트핀을 더 오래 사용할 수 있을까요? AI 하드웨어가 다른 멤버를 추가합니다! 휴대폰을 교체하는 것보다 노트핀을 더 오래 사용할 수 있을까요? Sep 02, 2024 pm 01:40 PM

지금까지 AI 웨어러블 디바이스 트랙에서는 특별히 좋은 결과를 얻은 제품이 없습니다. 올해 초 MWC24에서 출시된 AI핀은 평가 프로토타입이 출시되자 출시 당시 과대평가됐던 'AI 신화'가 깨지기 시작했고, 단숨에 대규모 수익률을 경험했다. 몇 달간, 역시 초기에 잘 팔렸던 RabbitR1은 상대적으로 좋아졌지만, 대량으로 출시되자 '안드로이드 케이스'와 비슷한 부정적인 평가를 받기도 했습니다. 이제 또 다른 회사가 AI 웨어러블 디바이스 트랙에 진입했습니다. 기술 매체 더버지(TheVerge)는 어제 AI 스타트업 플라우드(Plaud)가 노트핀(NotePin)이라는 제품을 출시했다는 블로그 게시물을 게재했다. 아직 '채색' 단계인 AIFriend와 달리 NotePin은 이제 시작되었습니다.

Java 프레임워크에 대한 상용 지원의 비용 효율성을 평가하는 방법 Java 프레임워크에 대한 상용 지원의 비용 효율성을 평가하는 방법 Jun 05, 2024 pm 05:25 PM

Java 프레임워크에 대한 상용 지원의 비용/성능 평가에는 다음 단계가 포함됩니다. 필요한 보증 수준과 SLA(서비스 수준 계약) 보장을 결정합니다. 연구지원팀의 경험과 전문성. 업그레이드, 문제 해결, 성능 최적화와 같은 추가 서비스를 고려하십시오. 위험 완화 및 효율성 향상을 기준으로 비즈니스 지원 비용을 평가합니다.

Poe의 새로운 기능은 매우 강력합니다! 프로그래밍 기술이 전혀 없어도 10분 안에 밈 편집기를 만들 수 있습니다 Poe의 새로운 기능은 매우 강력합니다! 프로그래밍 기술이 전혀 없어도 10분 안에 밈 편집기를 만들 수 있습니다 Aug 02, 2024 am 12:23 AM

기계력 보고서 편집장 : 시아의 국내 대형 모델이 빨리 따라잡는 게 필요한가? 최근 북미 Q&A 커뮤니티 쿼라(Quora)가 운영하는 AI 채팅 플랫폼 포(Poe)가 '프리뷰'라는 새로운 기능을 출시했다. 실시간 미리보기 기능을 통해 사용자는 Poe chat에서 생성된 웹 애플리케이션을 직접 확인하고 사용할 수 있습니다. 즉, Poe에서는 Claude-3.5-Sonnet, GPT-4, Gemini1.5Pro와 같이 코딩에 매우 능숙한 일부 LLM과 채팅할 수 있습니다. 채팅 중에 생성된 코드 조각, 웹 디자인, 게임 및 기타 콘텐츠를 이 창에서 미리 볼 수 있으며 실습 경험에 사용할 수 있습니다. 처음 시도했을 때 프로그래밍 지식이 전혀 없는 편집자는 겁을 먹었습니다.

See all articles