이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다-일체 포함-php.cn

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

Lisa Kudrow

풀어 주다： 2025-03-21 10:54:15

원래의

122명이 탐색했습니다.

Andrej Karpathy의 최신 비디오 인 "How I 사용 LLM"은 빠르게 진화하는 대형 언어 모델 (LLM) 생태계에 대한 포괄적 인 개요를 제공합니다. Karpathy는 이전의 "LLMS에 대한 Diving Diving"비디오를 바탕으로 LLM이 간단한 텍스트 기반 채팅 인터페이스에서 다양한 도구와 기능을 통합하는 정교한 멀티 모달 플랫폼으로 전환 한 방법을 보여줍니다. 이 기사는 그의 주요 통찰력과 시연을 요약합니다.

확장 LLM 환경
텍스트를 넘어서 : 멀티 모달 기능
"사고"모델 : 고의적 인 문제 해결
도구 통합 : 웹 검색 및 심도있는 연구
고급 연구 : 여러 출처의 정보 합성
파일 업로드를 통한 문서 및 멀티미디어 처리
Python 통역사 : 코드 실행 및 데이터 분석
사용자 정의 비주얼 및 코드 도구 : Claude Artifacts 및 커서 작곡가
Notebooklm을 사용한 오디오 상호 작용 및 팟 캐스트 생성
시각적 처리 : 이미지 입력/OCR, 이미지 생성 및 비디오
개인화 : 메모리, 사용자 정의 지침 및 사용자 정의 GPT
LLM 초보자를위한 팁
결론

확장 LLM 환경

Karpathy는 개척자 Chatgpt 이외의 성장을 강조하여 Gemini, Copilot, Claude, Grok, Deepseek 및 Lechat과 같은 경쟁자를 언급합니다. 그는 Chatbot Arena 및 Scale의 리더 보드와 같은 리소스를 사용하여 모델 성능을 비교할 것을 제안합니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

텍스트를 넘어서 : 멀티 모달 기능

Karpathy는 LLM의 멀티 모달 기능을 탐구하여 텍스트 생성을 넘어서고 있습니다.

텍스트 생성 : LLMS는 창의적 작문 작업 (시, 이메일 등)에서 탁월하며 상호 작용은 동적 "채팅 버블"로 시각화되었습니다. 그는 토큰 화, 컨텍스트 창 및 POS 태깅 및 NER의 역할의 기본 역학을 설명합니다. 다른 토큰 화 알고리즘 (바이트 페어 인코딩) 및 특수 토큰 (: 및)에 대해 논의합니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

2 단계 교육 프로세스 (사전 훈련 및 후 훈련)는 사전 훈련의 비용과 한계와 인간의 상호 작용 및 환각 감소에 대한 훈련 후의 중요성을 강조합니다. 또한 디코딩 및 샘플링 기술 (Nucleus Sampling, Top-K 샘플링, 빔 검색)에 대해서도 논의합니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

이미지 및 비디오 : Karpathy는 캡션과 이미지 생성 모델을 결합하여 이미지 생성을 보여줍니다. 그는 또한 LLM이 카메라 피드를 통해 "보고"객체를 식별하는 비디오 기능을 보여줍니다.

오디오 : 그는 "가짜 오디오"(텍스트 음성 연설)과 "True Audio"(기본 오디오 토큰 화)를 차별화하는 음성 상호 작용을 강조합니다. 다양한 페르소나에서 오디오 응답을 생성하는 기능이 전시됩니다.

"사고"모델 : 고의적 인 문제 해결

Karpathy는 복잡한 문제를 통해 단계별로 추론하기 위해 강화 학습을 활용하는 "사고 모델"을 탐구합니다. 그는이를 표준 모델과 대조하여, 사고 모델이 처리 시간이 증가하는 비용에도 불구하고보다 정확한 솔루션을 제공 할 수있는 방법을 보여줍니다. 그는 그라디언트 체크 실패 예제를 사용하여 차이를 강조합니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

도구 통합 : 웹 검색 및 심도있는 연구

인터넷 검색 기능의 통합에 대해 논의하여 LLMS가 실시간 정보에 액세스하고 처리 할 수있는 방법을 보여주고 지식 컷오프를 극복합니다. 그는 다양한 모델의 검색 통합 (Claude, Gemini, Chatgpt, Perplexity.ai)을 비교합니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

Advanced Research : 종종 더 높은 계층 구독이 필요한 심층 연구는 광범위한 웹 검색과 인용과 함께 포괄적 인 보고서를 작성하기위한 추론과 함께 광범위한 웹 검색을 결합한 프로세스로 설명됩니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다

파일 업로드, Python 통역사, 사용자 정의 도구 및 개인화

그런 다음이 기사는 문서 및 멀티미디어를 처리하기위한 파일 업로드, 코드 실행 및 데이터 분석을위한 통합 Python 통역사, 사용자 정의 시각 및 코드 도구 (Claude Artifacts 및 Cursor Composer) 및 메모리, 사용자 정의 지침 및 사용자 정의 GPT와 같은 개인화 기능의 중요성을 다룹니다. 각각의 예가 제공됩니다.

이것이 Andrej Karpathy가 LLM을 사용하는 방식입니다