Yuncong Technology의 대규모 모델은 벤치마크 COCO에서 세계 기록을 경신하여 AI 적용 비용을 크게 절감합니다.
최근 Yuncong Technology의 대규모 모델은 비전 분야에서 다시 중요한 진전을 이루었습니다. 비전의 기본 대규모 모델을 기반으로 하는 타겟 탐지기는 Microsoft의 탐지 분야에서 유명한 벤치마크 COCO 데이터 세트에서 큰 성공을 거두었습니다. 연구(MSR), 상하이 인공지능 연구소, 지능형 지능 위안 인공지능 연구소(Yuan Artificial Intelligence Research Institute) 등 많은 유명 기업과 연구 기관이 눈에 띄며 새로운 세계 기록을 세웠습니다.
COCO 테스트 세트에서 Yuncong Technology의 대형 모델의 평균 정확도(이하 mAP, 평균 정밀도라고 함)가 0.662에 도달하여 목록에서 1위를 차지했습니다(아래 그림 참조). 검증 세트에서 단일 스케일은 0.656의 mAP를 달성했고, 다중 스케일 TTA 이후의 mAP는 0.662에 도달하여 둘 다 세계 최고의 수준에 도달했습니다.
빅데이터와 자기주도학습을 결합해 핵심 시각기술 탄생
GPT로 대표되는 빅데이터 자기 지도 사전 훈련은 자연어 이해(NLP) 분야에서 눈부신 발전을 이루었습니다. 시각적 분야에서도 자기 지도 학습과 결합된 빅 데이터는 기본 모델 훈련에서도 중요한 진전을 이루었습니다.
광범위한 시각적 데이터는 모델이 일반적인 기본 기능을 학습하는 데 도움이 됩니다. YunCong Vision의 대규모 기본 모델은 레이블이 지정되지 않은 대량의 데이터 세트와 다중 모드 이미지 및 텍스트 데이터 세트를 포함하여 20억 개 이상의 데이터를 사용하여 모델이 강력한 특징을 추출할 수 있게 하여 복잡성을 크게 줄입니다. 다운스트림 작업의 개발 비용.
반면, 자기 지도 학습에는 수동 주석이 필요하지 않으므로 레이블이 지정되지 않은 대규모 데이터로 시각적 모델을 훈련할 수 있습니다. Yuncong은 COCO 감지 작업에 대한 좋은 결과에서 알 수 있듯이 자기 지도 학습 알고리즘을 많이 개선하여 감지 및 분할과 같은 세분화된 작업에 더 적합하게 만들었습니다.
개방형 타겟 감지 + 제로타임 학습 감지 기능으로 R&D 비용 대폭 절감
비주얼 기본 모델의 탁월한 성능 덕분에 Yuncong Rongrong의 대형 모델은 대규모 이미지 및 텍스트 다중 모달 데이터를 기반으로 학습하여 수천 개의 제로샷 학습(이하 제로샷) 감지를 지원할 수 있습니다. 에너지, 운송, 제조업 등 다양한 목표를 포괄하는 목표 카테고리입니다.
다양한 데이터 세트에 대한 대형 모델의 제로샷 기능 성능
제로샷은 인간의 추론 과정을 모방하고 과거 지식을 사용하여 컴퓨터에 있는 새로운 개체의 특정 형태에 대해 추론함으로써 컴퓨터에 새로운 것을 인식하는 능력을 부여할 수 있습니다.
제로샷을 이해하는 방법은 무엇인가요? 당나귀와 말의 형태적 특징을 알고, 호랑이와 하이에나가 줄무늬 동물이고, 팬더와 펭귄이 흑백 동물이라는 것도 알고 있다고 가정해 보겠습니다. 얼룩말 사진을 보지 않고 추론만으로 동물원의 모든 동물 중에서 얼룩말을 찾을 수 있습니다.
Yuncong Vision의 대규모 기본 모델은 강력한 일반화 성능을 보여 다운스트림 작업에 필요한 데이터 의존성과 개발 비용을 크게 줄이는 동시에 제로샷은 교육 및 개발 효율성을 크게 향상시켜 광범위한 적용과 빠른 배포를 가능하게 합니다.
위 내용은 Yuncong Technology의 대규모 모델은 벤치마크 COCO에서 세계 기록을 경신하여 AI 적용 비용을 크게 절감합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

이봐, 코딩 닌자! 하루 동안 어떤 코딩 관련 작업을 계획 했습니까? 이 블로그에 더 자세히 살펴보기 전에, 나는 당신이 당신의 모든 코딩 관련 문제에 대해 생각하기를 원합니다. 완료? - ’

소개 OpenAi는 기대가 많은 "Strawberry"아키텍처를 기반으로 새로운 모델을 출시했습니다. O1로 알려진이 혁신적인 모델은 추론 기능을 향상시켜 문제를 통해 생각할 수 있습니다.

소개 Mistral은 최초의 멀티 모드 모델, 즉 Pixtral-12B-2409를 발표했습니다. 이 모델은 Mistral의 120 억 개의 매개 변수 인 NEMO 12B를 기반으로합니다. 이 모델을 차별화하는 것은 무엇입니까? 이제 이미지와 Tex를 모두 가져갈 수 있습니다

SQL의 Alter Table 문 : 데이터베이스에 열을 동적으로 추가 데이터 관리에서 SQL의 적응성이 중요합니다. 데이터베이스 구조를 즉시 조정해야합니까? Alter Table 문은 솔루션입니다. 이 안내서는 Colu를 추가합니다

에이전트 AI에서 작업하는 동안 개발자는 종종 속도, 유연성 및 자원 효율성 사이의 상충 관계를 탐색하는 것을 발견합니다. 나는 에이전트 AI 프레임 워크를 탐구하고 Agno를 만났다 (이전에는 ph-이었다.

문제가있는 벤치 마크 : 라마 사례 연구 2025 년 4 월 초, Meta는 LLAMA 4 제품군을 공개하여 GPT-4O 및 Claude 3.5 Sonnet과 같은 경쟁자들에 대해 호의적으로 배치 한 인상적인 성능 지표를 자랑했습니다. Launc의 중심

릴리스에는 GPT-4.1, GPT-4.1 MINI 및 GPT-4.1 NANO의 세 가지 모델이 포함되어 있으며, 대형 언어 모델 환경 내에서 작업 별 최적화로 이동합니다. 이 모델은 사용자를 향한 인터페이스를 즉시 대체하지 않습니다

비디오 게임이 불안을 완화하거나 집중하거나 ADHD를 가진 어린이를 지원할 수 있습니까? 건강 관리 도전이 전 세계적으로 급증함에 따라, 특히 청소년들 사이에서 혁신가들은 비디오 게임 인 가능성이없는 도구로 전환하고 있습니다. 이제 세계 최대의 엔터테인먼트 인더스 중 하나입니다
