기술 주변기기 일체 포함 Chitrarth-1 : Krutrim AI Labs의 다국어 VLM

Chitrarth-1 : Krutrim AI Labs의 다국어 VLM

Mar 03, 2025 pm 06:22 PM

인도의 AI 환경은 빠르게 발전하고 있으며, 상당한 발전과 혁신이 떠오르고 있습니다. Ola Group 회사 인 Krutrim AI Labs는이 성장의 핵심 플레이어로, 최근 획기적인 비전 언어 모델 (VLM) 인 Chitrarth-1을 발표했습니다. 인도의 다양한 언어 및 문화적 맥락을 위해 설계된 Chitrarth-1은 10 개의 주요 인도 언어와 영어를 지원하며 다국어 AI 솔루션에 대한 중요한 요구를 해결합니다. 이 기사는 Chitrarth-1과 인도의 AI 기능 확장에 대한 영향을 탐구합니다. 목차

chitrarth-1은 무엇입니까? Chitrarth-1 아키텍처 및 사양 훈련 데이터 및 방법론 1 단계 : 어댑터 사전 훈련

    2 단계 : 명령 튜닝
  • 성능 및 벤치 마크 에 액세스 chitrarth-1 chitrarth-1의 행동
  • 결론
    • Chitrarth-1은 무엇입니까?
    • Chitrarth-1 ( "Chitra"-이미지와 "Artha"-의미)는 고급 언어 및 비전 처리를 통합하는 7.5 억 개의 매개 변수 VLM입니다. 인도의 다양한 언어 적 요구를 제공하기 위해 지어진이 도시는 힌디어, 벵골어, 텔루구 어, 타밀어, 마라 티어, 구자라트티, 칸나다어, 말라 얄 람어, 오디아, 아삼 어 및 영어를 지원합니다. 이 모델은 "우리 나라, 국가, 시민들을 위해 AI를 개발하려는 Krutrim의 약속을 구현합니다. 풍부하고 다국어 데이터 세트를 사용하면 편견을 최소화하고 Indic Languages ​​및 English에서 강력한 성능을 보장하여 공평한 AI 액세스를 촉진합니다. Chitrarth-1에 대한 연구는 Neurips 및 Machine Translation에 관한 9 번째 회의를 포함한 주요 학술 저널에 발표되었습니다. Chitrarth-1 아키텍처 및 사양
    • Chitrarth-1은 Siglip (Siglip-SO400M-PATCH14-384) 모델을 기반으로 한 비전 인코더에 의해 향상된 기초로 Krutrim-7B LLM을 기초로 사용합니다. 주요 아키텍처 구성 요소는 다음과 같습니다
    • 이미지 기능 추출을위한 미리 훈련 된 Siglip Vision Encoder LLM의 토큰 공간에 이미지 기능을 제공하기위한 훈련 가능한 선형 매핑 레이어. 광학적 인 성능 향상을위한 명령어를 따르는 이미지 텍스트 데이터 세트로 미세 조정
    • 훈련 데이터 및 방법론
    • Chitrarth-1의 훈련은 광대 한 다국어 데이터 세트를 사용하여 두 단계를 포함했습니다.
    • 1 단계 : 어댑터 사전 훈련

        오픈 소스 모델을 사용하여 여러 인디언 언어로 변환 된 다양한 데이터 세트에서 미리 훈련되었습니다. 는 공평한 성능을 보장하기 위해 영어 및 인디언의 균형 잡힌 표현을 유지했습니다. 단일 언어에 대한 편견을 피하고 효율성과 견고성을 최적화하도록 설계되었습니다.
      • 2 단계 : 명령 튜닝
      • 복잡한 명령 데이터 세트에서 미세 조정하여 멀티 모달 추론 기능을 향상시킵니다. 는 영어 기반의 명령 조정 데이터 세트와 다국어 번역을 활용했습니다 는 다양한 인도 이미지 (성격, 기념물, 예술 작품, 요리)를 특징으로하는 비전 언어 데이터 세트를 포함했습니다. 균형 도메인 표현을위한 고품질 독점 영어 텍스트 데이터.
      • 성능 및 벤치 마크

      Chitrarth-1은 Idefics 2 (7b) 및 Palo 7B와 같은 주요 VLM에 대해 엄격하게 테스트되었으며 TextVQA 및 Vizwiz와 같은 작업에 대한 경쟁력을 유지하면서 다양한 벤치 마크에서 지속적으로 성능이 우수합니다. 또한 주요 지표에서 LLAMA 3.2 11B 비전 지시를 능가합니다. Krutrim은 세 가지 작업에 걸쳐 10 개의 자원 부족 인디 언어에 대한 새로운 평가 제품군 인 Bharatbench를 소개하여 향후 연구를위한 기준을 설정하고 Chitrarth-1의 언어를 효과적으로 처리 할 수있는 능력을 강조했습니다. 샘플 Bharatbench 결과는 다음과 같습니다 자세한 내용은 여기를 클릭하십시오 chitrarth-1

      액세스

      Chitrarth-1은 다음을 통해 액세스 할 수 있습니다 포옹 얼굴 :

      직접 사용 또는 미세 조정. (방문하려면 여기를 클릭하십시오) github : (원본 기사에 제공된 코드) Krutrim Cloud : (탐색하려면 여기를 클릭하십시오)

      chitrarth-1의 행동
        Chitrarth-1의 기능의 예에는 이미지 분석, 이미지 캡션 생성 및 UI/UX 화면 분석 (원본 기사에 제공된 이미지)이 포함됩니다.
      • 결론
      • OLA 그룹의 부서 인 Krutrim AI Labs는 AI 컴퓨팅의 미래를 구축하기 위해 노력하고 있습니다. Chitrarth-1 및 GPU와 같은 기타 제품을 서비스, AI 스튜디오 등으로, 그들은 포용적이고 문화적으로 민감한 AI에 대한 새로운 표준을 구축하여보다 공평한 기술 환경을 조성하고 있습니다.

위 내용은 Chitrarth-1 : Krutrim AI Labs의 다국어 VLM의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) 창의적인 프로젝트를위한 최고의 AI 아트 발전기 (무료 & amp; 유료) Apr 02, 2025 pm 06:10 PM

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

Meta Llama 3.2- 분석 Vidhya를 시작합니다 Meta Llama 3.2- 분석 Vidhya를 시작합니다 Apr 11, 2025 pm 12:04 PM

메타의 라마 3.2 : 멀티 모달 및 모바일 AI의 도약 Meta는 최근 AI에서 강력한 비전 기능과 모바일 장치에 최적화 된 가벼운 텍스트 모델을 특징으로하는 AI의 상당한 발전 인 Llama 3.2를 공개했습니다. 성공을 바탕으로 o

최고의 AI 챗봇 비교 (Chatgpt, Gemini, Claude & amp; more) 최고의 AI 챗봇 비교 (Chatgpt, Gemini, Claude & amp; more) Apr 02, 2025 pm 06:09 PM

이 기사는 Chatgpt, Gemini 및 Claude와 같은 최고의 AI 챗봇을 비교하여 고유 한 기능, 사용자 정의 옵션 및 자연어 처리 및 신뢰성의 성능에 중점을 둡니다.

10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. 10 생성 AI 코드의 생성 AI 코딩 확장 대 코드를 탐색해야합니다. Apr 13, 2025 am 01:14 AM

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - &#8217

컨텐츠 생성을 향상시키기 위해 AI를 쓰는 최고 AI 작문 컨텐츠 생성을 향상시키기 위해 AI를 쓰는 최고 AI 작문 Apr 02, 2025 pm 06:11 PM

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.

AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 AV 바이트 : Meta ' S Llama 3.2, Google의 Gemini 1.5 등 Apr 11, 2025 pm 12:01 PM

이번 주 AI 환경 : 발전의 회오리 바람, 윤리적 고려 사항 및 규제 토론. OpenAi, Google, Meta 및 Microsoft와 같은 주요 플레이어

직원에게 AI 전략 판매 : Shopify CEO의 선언문 직원에게 AI 전략 판매 : Shopify CEO의 선언문 Apr 10, 2025 am 11:19 AM

Shopify CEO Tobi Lütke의 최근 메모는 AI 숙련도가 모든 직원에 대한 근본적인 기대를 대담하게 선언하여 회사 내에서 중요한 문화적 변화를 표시합니다. 이것은 도망가는 트렌드가 아닙니다. 그것은 p에 통합 된 새로운 운영 패러다임입니다

비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서 비전 언어 모델 (VLMS)에 대한 포괄적 인 안내서 Apr 12, 2025 am 11:58 AM

소개 생생한 그림과 조각으로 둘러싸인 아트 갤러리를 걷는 것을 상상해보십시오. 이제 각 작품에 질문을하고 의미있는 대답을 얻을 수 있다면 어떨까요? “어떤 이야기를하고 있습니까?

See all articles