Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기-일체 포함-php.cn

Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기

Joseph Gordon-Levitt

풀어 주다： 2025-03-06 10:34:09

원래의

154명이 탐색했습니다.

gemini 1.5 Pro : Google의 고급 멀티 모달 AI와 그 API 에 대한 깊은 다이빙 Google의 Gemini 1.5 Pro는 AI에서 상당한 도약을 나타내며 텍스트, 비디오 및 오디오 모드에서 장기 컨텍스트 추론 기능을 자랑합니다. 이 튜토리얼은 검색, 질문 답변 및 텍스트 내 학습과 같은 작업을 위해 Gemini 1.5 Pro API를 연결하고 활용하여 안내합니다. Gemini 가족에 대한 광범위한 이해를 위해이 자원을 탐구하십시오. Google Gemini
. gemini 가족 : 스펙트럼의 기능 Gemini AI 제품군은 Google Research 및 Google Deepmind가 개발 한 여러 생성 AI 모델로 구성됩니다. 이러한 모델은 다양한 멀티 모달 작업에서 뛰어나며 개발자가 컨텐츠 생성 및 문제 해결을 지원합니다. 각 모델 변형은 특정 응용 프로그램에 맞게 조정되어 다양한 시나리오에서 성능을 최적화합니다. 가족은 3 가지 크기의 계층을 제공함으로써 계산 요구와 기능의 균형을 이룹니다.
이 튜토리얼은 1.5 시리즈의 첫 모델 인 Gemini 1.5 Pro에 중점을 둡니다. gemini 1.5 Pro : 전례없는 장기 텍스트 이해 Gemini 1.5 Pro의 실질적인 컨텍스트 창 (최소 1 천만 개의 토큰)을 통해 다양한 응용 분야에서 광범위한 컨텍스트를 이해할 수 있습니다. 장기 의존성 작업에서 엄격한 테스트는 뛰어난 기능을 보여줍니다. 건초 더미가 1 천만 마리의 토큰을 초과하는 경우에도 "바늘 in-a-haystack"시나리오에서 거의 완벽한 리콜 (& gt; 99%)을 달성했습니다. Gemini 1.5 Pro는 외부 검색 방법을 사용하는 것, 특히 방대한 양의 컨텐츠에 대한 상호 의존성을 이해해야하는 작업을 포함하여 경쟁 업체를 능가했습니다. 단일 언어 문서에서 새로운 언어를 번역하는 것과 같이 텍스트 내 학습을 수행하는 능력도 놀랍습니다. 이 향상된 장기 텍스트 성능은 고유의 다중 모드 능력을 손상시키지 않습니다. 다양한 영역 (수학, 과학 및 추론에서 28.9%)에서 이전 모델 (Gemini 1.0 Pro)에 비해 크게 개선되었으며, 많은 벤치 마크에서 Gemini 1.0 Ultra 모델을 능가했습니다.
.

데이터 소스 포괄적 인 세부 사항은 기술 보고서를 참조하십시오.“Gemini 1.5 : 수백만의 컨텍스트에 걸쳐 멀티 모달 이해 잠금 해제”. gemini 1.5 pro 의 실제 응용 프로그램 gemini 1.5 프로의 처리 능력은 수백만 개의 토큰을 혁신적인 응용 프로그램에 열어줍니다.
소프트웨어 엔지니어링 :
는 대규모 코드베이스 내에서 특정 코드 위치를 정확히 찾아 낼 수 있습니다 (예 : 746,152-Token Jax 코드베이스 내에서 핵심 자동 차별화 방법을 식별). 언어 번역 : 는 온라인 데이터가 제한된 언어로 번역 할 수 있으며, 제공된 컨텍스트에만 의존합니다 (예 : 문법 책과 Wordlist를 사용하여 영어에서 Kalamang으로 번역). 이것은 멸종 위기에 처한 언어를 보존한다는 약속을 보여줍니다.
이미지 및 비디오 분석 : 긴 텍스트 내에서 장면을 식별 할 수 있습니다 (예 : Les misérables 에서 스케치를 기반으로 한 장면을 찾기) 및 비디오 (예 : "Sherlock Jr."의 특정 프레임에서 정보를 추출하고 스케치에서 장면을 식별). Gemini 1.5 Pro API에 연결 API를 통해 Gemini 1.5 Pro의 힘에 액세스하는 방법을 살펴 보겠습니다. 1 단계 : API 키를 얻으십시오 개발자 페이지의 Google AI로 이동합니다 (로그인한지 확인). "API 키 얻기"를 클릭하여 하나를 생성하십시오. 프로젝트를 설정해야합니다.
2 단계 : 파이썬 환경을 설정하십시오

필요한 파이썬 패키지를 설치하십시오 :

Jupyter 노트에서 필수 라이브러리를 가져 오십시오 : 3 단계 : API 호출
키로 API를 구성하십시오
<:> 사용 가능한 모델 점검 :
액세스 쌍둥이 자리 1.5 프로 :
pip install google-generativeai
로그인 후 복사
간단한 텍스트 프롬프트를 만듭니다

import google.generativeai as genai from google.generativeai.types import ContentType from PIL import Image from IPython.display import Markdown import time import cv2
로그인 후 복사
gemini ai는 다수의 응답 후보를 제공합니다. 가장 좋은 것을 선택하십시오.
Gemini 1.5 Pro 이미지 이미지 처리를 시연합시다. "bookshelf.jpeg": 라는 이미지가 있다고 가정하십시오

결론 gemini 1.5 Pro는 확장 된 컨텍스트 창과 멀티 모달 기능을 갖춘 다양한 응용 프로그램을위한 강력한 도구를 제공합니다. API는 다양한 데이터 유형으로 작업 할 수있는 유연성을 제공하여 개발자에게 귀중한 자산이됩니다. AI 지식을 더욱 발전 시키려면이 기술 트랙을 고려하십시오.

위 내용은 Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!