> 기술 주변기기 > 일체 포함 > Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기

Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기

Joseph Gordon-Levitt
풀어 주다: 2025-03-06 10:34:09
원래의
154명이 탐색했습니다.
gemini 1.5 Pro : Google의 고급 멀티 모달 AI와 그 API 에 대한 깊은 다이빙 Google의 Gemini 1.5 Pro는 AI에서 상당한 도약을 나타내며 텍스트, 비디오 및 오디오 모드에서 장기 컨텍스트 추론 기능을 자랑합니다. 이 튜토리얼은 검색, 질문 답변 및 텍스트 내 학습과 같은 작업을 위해 Gemini 1.5 Pro API를 연결하고 활용하여 안내합니다. Gemini 가족에 대한 광범위한 이해를 위해이 자원을 탐구하십시오. Google Gemini

. gemini 가족 : 스펙트럼의 기능 Gemini AI 제품군은 Google Research 및 Google Deepmind가 개발 한 여러 생성 AI 모델로 구성됩니다. 이러한 모델은 다양한 멀티 모달 작업에서 뛰어나며 개발자가 컨텐츠 생성 및 문제 해결을 지원합니다. 각 모델 변형은 특정 응용 프로그램에 맞게 조정되어 다양한 시나리오에서 성능을 최적화합니다. 가족은 3 가지 크기의 계층을 제공함으로써 계산 요구와 기능의 균형을 이룹니다.

이 튜토리얼은 1.5 시리즈의 첫 모델 인 Gemini 1.5 Pro에 중점을 둡니다. gemini 1.5 Pro : 전례없는 장기 텍스트 이해 Gemini 1.5 Pro의 실질적인 컨텍스트 창 (최소 1 천만 개의 토큰)을 통해 다양한 응용 분야에서 광범위한 컨텍스트를 이해할 수 있습니다. 장기 의존성 작업에서 엄격한 테스트는 뛰어난 기능을 보여줍니다. 건초 더미가 1 천만 마리의 토큰을 초과하는 경우에도 "바늘 in-a-haystack"시나리오에서 거의 완벽한 리콜 (& gt; 99%)을 달성했습니다. Gemini 1.5 Pro는 외부 검색 방법을 사용하는 것, 특히 방대한 양의 컨텐츠에 대한 상호 의존성을 이해해야하는 작업을 포함하여 경쟁 업체를 능가했습니다. 단일 언어 문서에서 새로운 언어를 번역하는 것과 같이 텍스트 내 학습을 수행하는 능력도 놀랍습니다. 이 향상된 장기 텍스트 성능은 고유의 다중 모드 능력을 손상시키지 않습니다. 다양한 영역 (수학, 과학 및 추론에서 28.9%)에서 이전 모델 (Gemini 1.0 Pro)에 비해 크게 개선되었으며, 많은 벤치 마크에서 Gemini 1.0 Ultra 모델을 능가했습니다.

.

데이터 소스 포괄적 인 세부 사항은 기술 보고서를 참조하십시오.“Gemini 1.5 : 수백만의 컨텍스트에 걸쳐 멀티 모달 이해 잠금 해제”. gemini 1.5 pro 의 실제 응용 프로그램 gemini 1.5 프로의 처리 능력은 수백만 개의 토큰을 혁신적인 응용 프로그램에 열어줍니다.

소프트웨어 엔지니어링 :

는 대규모 코드베이스 내에서 특정 코드 위치를 정확히 찾아 낼 수 있습니다 (예 : 746,152-Token Jax 코드베이스 내에서 핵심 자동 차별화 방법을 식별). 언어 번역 : 는 온라인 데이터가 제한된 언어로 번역 할 수 있으며, 제공된 컨텍스트에만 의존합니다 (예 : 문법 책과 Wordlist를 사용하여 영어에서 Kalamang으로 번역). 이것은 멸종 위기에 처한 언어를 보존한다는 약속을 보여줍니다.

이미지 및 비디오 분석 : 긴 텍스트 내에서 장면을 식별 할 수 있습니다 (예 : Les misérables 에서 스케치를 기반으로 한 장면을 찾기) 및 비디오 (예 : "Sherlock Jr."의 특정 프레임에서 정보를 추출하고 스케치에서 장면을 식별). Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM Gemini 1.5 Pro API에 연결 API를 통해 Gemini 1.5 Pro의 힘에 액세스하는 방법을 살펴 보겠습니다. 1 단계 : API 키를 얻으십시오 개발자 페이지의 Google AI로 이동합니다 (로그인한지 확인). "API 키 얻기"를 클릭하여 하나를 생성하십시오. 프로젝트를 설정해야합니다.

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM 2 단계 : 파이썬 환경을 설정하십시오 Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

필요한 파이썬 패키지를 설치하십시오 :

Jupyter 노트에서 필수 라이브러리를 가져 오십시오 : 3 단계 : API 호출

키로 API를 구성하십시오

<:> 사용 가능한 모델 점검 :

액세스 쌍둥이 자리 1.5 프로 :
pip install google-generativeai
로그인 후 복사
간단한 텍스트 프롬프트를 만듭니다

import google.generativeai as genai
from google.generativeai.types import ContentType
from PIL import Image
from IPython.display import Markdown
import time
import cv2
로그인 후 복사
gemini ai는 다수의 응답 후보를 제공합니다. 가장 좋은 것을 선택하십시오.

Gemini 1.5 Pro 이미지 이미지 처리를 시연합시다. "bookshelf.jpeg": 라는 이미지가 있다고 가정하십시오

결론 gemini 1.5 Pro는 확장 된 컨텍스트 창과 멀티 모달 기능을 갖춘 다양한 응용 프로그램을위한 강력한 도구를 제공합니다. API는 다양한 데이터 유형으로 작업 할 수있는 유연성을 제공하여 개발자에게 귀중한 자산이됩니다. AI 지식을 더욱 발전 시키려면이 기술 트랙을 고려하십시오.

위 내용은 Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿