> 기술 주변기기 > 일체 포함 > 2025 년 포옹 페이스에 대한 상위 9 대 신문

2025 년 포옹 페이스에 대한 상위 9 대 신문

尊渡假赌尊渡假赌尊渡假赌
풀어 주다: 2025-03-11 09:35:48
원래의
815명이 탐색했습니다.

포옹 얼굴 : 최고 AI 연구의 스포트라이트

빠르게 진화하는 인공 지능 분야는 지속적인 학습이 필요합니다. Hugging Face는 최신 연구를 통해 최신 정보를 유지하기위한 귀중한 플랫폼을 제공하여 협업 및 지식 공유를위한 독특한 공간을 제공합니다. 이 기사에서는 주요 초점 영역으로 분류 된 Hugging Face에 등장하는 가장 영향력 있고 인기있는 논문 중 일부를 강조합니다.

목차 :

  • 언어 모델 추론
    • 자기 발견 : LLMS 자체 이동료 추론 구조
    • 명백한 프롬프트없이 생각한 추론
    • REFT : 언어 모델에 대한 효율적인 미세 조정
  • 비전 언어 모델
    • 비전 언어 모델의 주요 건축 고려 사항
    • sharegpt4video : 개선 된 캡션으로 비디오 이해 향상
  • 생성 모델
    • 깊이 v2 : 고급 단안 깊이 추정
    • 시각적 자기 회귀 모델링 : 확장 가능한 이미지 생성
  • 모델 아키텍처
    • Megalodon : 무제한 컨텍스트 길이를 가진 효율적인 LLM
    • SAULLM : 법적 응용 프로그램에 대한 도메인 적응 스케일링
  • 결론

언어 모델 추론

최근의 혁신은 대형 언어 모델 (LLM)의 추론 능력을 향상시키는 데 중점을 둡니다. 자체 발견 프레임 워크는 LLM이 추론 구조를 자율적으로 생성 할 수있게하는 반면, 생각의 사슬에 대한 연구는 명시적인 프롬프트없이 고유 한 논리적 공제의 가능성을 보여줍니다.

1. 자기 발견 : LLMS 자체 복사 추론 구조

2025 년 포옹 페이스에 대한 상위 9 대 신문

이 백서는 LLM이 특정 작업에 맞게 조정 된 추론 경로를 동적으로 구성 할 수있는 프레임 워크 인 Selfscdover를 소개합니다. 전통적인 프롬프트 방법의 한계를 뛰어 넘어 자체 발견은 복잡한 추론 벤치 마크에서 상당한 성능을 얻어 효율성과 해석 가능성을 향상시킵니다.

[종이 링크]

2. 명백한 프롬프트없이 생각한 추론

2025 년 포옹 페이스에 대한 상위 9 대 신문

이 연구는 명백한 프롬프트 사례에 의존하지 않고 생각한 추론을위한 LLM의 고유 용량을 탐구합니다. 새로운 디코딩 과정은 논리적 추론 단계의 자연 출현을 보여 주어보다 자신감 있고 정확한 모델 출력으로 이어집니다.

[종이 링크]

3. REFT : 언어 모델에 대한 효율적인 미세 조정

2025 년 포옹 페이스에 대한 상위 9 대 신문

표현 Finetuning (REFT)은 LLM 미세 조정에 대한 매개 변수 효율적인 접근 방식을 제공합니다. 모델 가중치 대신 숨겨진 표현을 수정함으로써 REFT는 매개 변수 계수가 크게 줄어들면서 비슷하거나 우수한 성능을 달성하여 효율성과 해석 성을 모두 향상시킵니다.

[종이 링크]

비전 언어 모델

비전과 언어의 교차점은 최적의 아키텍처와 고품질 데이터의 영향에 중점을 둔 연구와 함께 계속 발전하고 있습니다.

4. 비전 언어 모델의 주요 건축 고려 사항

2025 년 포옹 페이스에 대한 상위 9 대 신문

이 작업은 VLM (Vision-Language Models)의 건축 선택을 세 심하게 검토하여 강력한 단조제 백본의 중요성과 자동 회귀 아키텍처의 우수성을 강조합니다. 저자는 이러한 결과를 보여주는 고성능 VLM 인 IDEFICS2를 소개합니다.

[종이 링크]

5. ShareGPT4Video : 개선 된 캡션으로 비디오 이해 향상

2025 년 포옹 페이스에 대한 상위 9 대 신문

ShareGpt4Video는 정확한 캡션이 비디오 이해 및 생성에 대한 중요한 영향을 보여줍니다. 이 이니셔티브는 대규모 고품질 비디오 캡션과 해당 모델의 대규모 데이터 세트를 소개하여 멀티 모달 벤치 마크에서 최첨단 결과를 달성합니다.

[종이 링크]

생성 모델

생성 모델은 이미지 생성 및 깊이 추정의 경계를 계속 밀고 있습니다.

6. 깊이 v2 : 고급 단안 깊이 추정

2025 년 포옹 페이스에 대한 상위 9 대 신문

깊이 V2는 합성 및 유사 표지 데이터를 활용하는 혁신적인 교육 전략을 통해 단안 깊이 추정을 크게 향상시킵니다. 결과 모델은 이전 접근법보다 실질적으로 더 빠르고 정확합니다.

[종이 링크]

7. 시각적 자동 회귀 모델링 : 확장 가능한 이미지 생성

2025 년 포옹 페이스에 대한 상위 9 대 신문

이 논문은 이미지 생성에 대한 새로운 자동 회귀 접근법을 소개하여 확산 모델에 비해 우수한 성능과 확장 성을 달성합니다. 결과적인 시각적 자동 회귀 (VAR) 모델은 인상적인 결과와 강력한 스케일링 특성을 보여줍니다.

[종이 링크]

모델 아키텍처

건축 혁신은 긴 시퀀스를 처리하고 모델을 특정 도메인에 적응시키는 데있어 제한을 계속 해결합니다.

8. Megalodon : 무제한 컨텍스트 길이를 가진 효율적인 LLM

2025 년 포옹 페이스에 대한 상위 9 대 신문

Megalodon은 매우 긴 시퀀스를 효율적으로 처리 해야하는 과제를 해결합니다. Megalodon은 건축 향상을 통해 무제한 컨텍스트 길이를 처리하는 데있어 전통적인 변압기를 능가하여 다양한 작업의 성능을 향상시킵니다.

[종이 링크]

9. SAULLM : 법적 응용 프로그램에 대한 도메인 적응 스케일링

2025 년 포옹 페이스에 대한 상위 9 대 신문

SAULLM-54B 및 SAULLM-141B는 법적 응용 프로그램에 대한 도메인 적응에서 상당한 발전을 나타냅니다. 대규모 법적 데이터 세트에 대한 교육을받은 이러한 대형 언어 모델은 법적 벤치 마크에서 최첨단 성과를 달성합니다.

[종이 링크]

결론

이 개요는 포옹 얼굴에 강조된 충격적인 AI 연구의 폭과 깊이를 보여줍니다. 이 플랫폼의 협업 특성은 지식 공유를 촉진하고 현장의 진전을 가속화합니다. 이러한 영향력있는 연구에 대한 정보를 유지하는 것은 인공 지능의 발전을 일하는 사람에게는 중요합니다.

위 내용은 2025 년 포옹 페이스에 대한 상위 9 대 신문의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿