Langsmith의 LLM을 디버깅 및 테스트하는 소개
.
그러나 프롬프트와 함께 숫자가 아닌 텍스트가 들어오고 나오는 것을 다루고 있습니다. 따라서 MSE 또는 Cross-Entropy와 같은 오류 또는 정확성을 측정하는 일반적인 방법은 여기서 작동하지 않습니다. 또한 평가를 위해 모든 입력과 출력을 읽는 것을 상상해보십시오. 평가해야 할 수천 개의 프롬프트가 있다면 며칠이 걸릴 것입니다.
따라서 수동 점검에 익사하지 않고 LLM 앱이 얼마나 잘 수행하고 있는지 확인하기 위해 이러한 프롬프트를 효율적으로 생성하고 테스트하는 워크 플로가 필요합니다. 다음은 다음과 같습니다.
1.
를 개발하십시오 이 단계에서는 Langchain과 같은 프레임 워크를 사용하여 응용 프로그램의 기반을 프로토 타입합니다. 플래시 카드 생성기 프로젝트의 경우 프로토 타입에는 공급 업체에서 선택한 LLM 위에 여러 구성 요소가 포함될 수 있습니다. 예를 들어,로 체인해야 할 수도 있습니다
<:> 리트리버 : 검색 엔진 API, 웹 스크레이퍼 <:> 문서 로더 : 파일 입력 - PDF, 텍스트, CSV, JSON, 클립 보드, YouTube, 검색 등 채팅 로더등 (Langchain 문서 의이 페이지에서 어떤 종류의 구성 요소를 추가 할 수 있는지 참조하십시오). 그러나 일반적인 고급 작업을 위해 Langchain이 제공하는 상용 체인을 사용하여 개발 시간을 크게 줄일 수 있습니다.
2. 생산 <..> 이 단계에서는 가능한 많은 시나리오에 대해 응용 프로그램을 테스트합니다. 즉, 모든 추가 구성 요소가 잘 작동하고 체인을 잘 수행하며 일관된 고품질 출력을 생성해야합니다.
3. 배포 <..>
일단 실행 가능한 응용 프로그램이 있으면 REST API로 배포 할 수 있습니다. REST API는 기본적으로 기존 Langchain 체인 또는 에이전트를 HTTPS 링크로 변환합니다. 다른 사람은 AI 모델과 상호 작용하도록 요청을 보낼 수 있습니다. 이제 데스크톱 응용 프로그램 또는보다 일반적으로 웹 사이트와 같은 서비스의 사용자 인터페이스를 구축합니다.
지금,이 작업을 수행하는 쉬운 방법은 없지만 Langchain 개발자는 Langserve를 출시하려고합니다. 문서 의이 페이지에서 몰래 피크를 확인하십시오.
이제, 마침내 랑 스미스와 함께 땜질을 시작합시다
Langsmith 플랫폼 개요
우리는 웹 UI를 이해하는 것으로 시작합니다. Smith.langchain.com 링크를 통해 사용할 수 있습니다. 액세스하려면 현재 폐쇄 베타 버전에있는 대기자 명단에서 가입하고 지우려면
하지만 일단 당신이 들어가면 착륙 페이지가 다음과 같이 보일 것입니다 :
두 가지 주요 섹션은 프로젝트 및 데이터 세트 및 테스트이며, 두 섹션 모두 Python SDK를 통해 조작 할 수 있습니다. 이 플랫폼에는 배포 및 주석 대기열을위한 탭도 있지만이 기사의 범위를 벗어납니다. .
Langsmith Python sdk 설정
Langsmith의 프로젝트 관리는 API 키를 통해 플랫폼에 연결된 Python SDK를 사용하면 훨씬 쉽습니다.
키를 얻으려면 플랫폼의 키 아이콘을 클릭하고 안전한 곳에 저장하십시오. 그런 다음 새 가상 환경이 초기화 된 새 디렉토리에서 .env 파일을 만듭니다. 내부에 다음 두 줄을 붙여 넣습니다
다음, 터미널에서 다음 명령을 실행하여 Langsmith 및 Python-Dotenv를 설치하여 환경 변수를 읽습니다.
이제 코드를 작성할 시간 :
<_> 우리는 find_dotenv 및 load_dotenv 함수를 가져와 환경 변수를 읽고 OS로 설정합니다.
클라이언트는 Langsmith의 프로젝트와 자산을 조작하기위한 고급 명령을 포함합니다. 우리가 사용할 클라이언트의 첫 번째 명령은 새 프로젝트를 만드는 것입니다 :
Create_Project가 성공적으로 실행 된 후 웹 UI의 프로젝트 섹션에 나열된 프로젝트를 볼 수 있습니다.
다음으로, 우리는 새로운 프로젝트를 다른 환경 변수와 함께 기본값으로 설정해야합니다.
이제 프로젝트에 LLM이 필요합니다. 우리는 GPT-3.5 터보가 저렴하기 때문에 갈 것이지만 Langchain을 통해 사용할 수있는 다른 많은 모델을 사용할 수 있습니다. Openai 모델은 Chatopenai 클래스를 통해 초기화됩니다
첫 번째 달리기를하자 : LANGCHAIN_API_KEY="LangSmith-API-key"
OPENAI_API_KEY="Your-OPENAI-key"
로그인 후 복사로그인 후 복사
UI에서 프로젝트를 빠르게 확인하면 위의 실행이 추적 (로그인)을 볼 수 있습니다.
환경 변수와 클라이언트를 설정하면 자동으로 로깅을 활성화했습니다. 보시다시피, 우리는 이미 달리기에 대한 메타 데이터가 많이 있습니다.
몇 가지 프롬프트를 더 실행합시다 :
우리는 이미 기본 텍스트 요약자를 만들 수 있습니다. 마지막 실행의 출력을 요약하겠습니다 :
좋아요, 이제 첫 번째 데이터 세트를 만들 시간입니다.
langsmith에서 표지되지 않은 데이터 세트 생성
"LLM 응용 프로그램 개발 워크 플로우"섹션에서 언급했듯이 LLM 모델, 체인 또는 에이전트를 평가하기 위해 수천 개의 프롬프트를 작성하거나 수집해야 할 것입니다. 따라서 위에서했던 것처럼 1-10을 실행하는 것은 모범 사례가 아닙니다.
이러한 이유로 Langsmith는 세 가지 유형의 데이터 세트를 제공합니다
키 값 (KV)-기본값 : 입력을 임의의 키 값 쌍으로 정의합니다. 여러 입력이 필요한 체인 및 에이전트를 평가할 때 유용합니다.
채팅 데이터 세트 (채팅) : 이들은 LLM 채팅에서 변환 된 데이터 세트이며 구조화 된 입력 및 직렬화 된 메시지를 사용하여 정의됩니다.
python-dotenv to read environment variables:
pip install -U langsmith
pip install python-dotenv
로그인 후 복사로그인 후 복사
먼저, 출력없이 키 값 데이터 세트를 만드는 방법을 살펴 보겠습니다. 클라이언트의 create_dataset 함수를 사용합니다 :
이제, 각각 LLM에 단일 플래시 카드를 만들도록 요청하는 세 가지 입력을 추가해 봅시다.
UI의 데이터 세트 탭을 살펴보면 각 프롬프트가 Null 출력으로 표시됩니다.
import warnings
from dotenv import find_dotenv, load_dotenv
warnings.filterwarnings("ignore")
로그인 후 복사로그인 후 복사
이제 run_on_dataset 함수를 사용하여 모든 프롬프트를 한 줄의 코드로 실행합시다.
런이 완료되면 데이터 세트 페이지에 나열됩니다. 다음은 다음과 같습니다.
.
<_> 우리는 find_dotenv 및 load_dotenv 함수를 가져와 환경 변수를 읽고 OS로 설정합니다.
LANGCHAIN_API_KEY="LangSmith-API-key" OPENAI_API_KEY="Your-OPENAI-key"
이러한 이유로 Langsmith는 세 가지 유형의 데이터 세트를 제공합니다
이제, 각각 LLM에 단일 플래시 카드를 만들도록 요청하는 세 가지 입력을 추가해 봅시다.
이제 run_on_dataset 함수를 사용하여 모든 프롬프트를 한 줄의 코드로 실행합시다.
python-dotenv to read environment variables:
pip install -U langsmith
pip install python-dotenv
import warnings
from dotenv import find_dotenv, load_dotenv
warnings.filterwarnings("ignore")
위 내용은 Langsmith의 LLM을 디버깅 및 테스트하는 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

이 기사는 Chatgpt, Gemini 및 Claude와 같은 최고의 AI 챗봇을 비교하여 고유 한 기능, 사용자 정의 옵션 및 자연어 처리 및 신뢰성의 성능에 중점을 둡니다.

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - ’

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

이 기사는 Google Cloud, Amazon Polly, Microsoft Azure, IBM Watson 및 Destript와 같은 최고의 AI 음성 생성기를 검토하여 기능, 음성 품질 및 다양한 요구에 대한 적합성에 중점을 둡니다.
