제작자: 51CTO Technology Stack(WeChat ID: blog51cto)
파리에서 열린 스타트업을 위한 연례 기술 컨퍼런스인 VivaTech에서 Meta AI의 CEO인 Yann LeCun은 AI 생태계에서 일하고 싶은 학생들에게 다음과 같이 조언했습니다. LLM을 추구합니다(대규모 언어 모델 작업).
차세대 AI 시스템 구축에 관심이 있다면 LLM에서 일할 필요는 없습니다. 르쿤은 컨퍼런스에서 "이건 대기업의 문제이고 기여할 수 없다"고 말했다.
또한 대규모 언어 모델의 한계를 극복할 수 있는 차세대 AI 시스템을 개발해야 한다고 말했다.
흥미롭게도 최근에는 Devika(Devika가 Devin의 대체자임)의 젊은 창업자인 Mufeed VH가 사람들이 어떻게 움직여야 하는지에 대해 LLM(Large Language Model) 대안에 대한 논의가 이어졌습니다. Transformer 모델에서 벗어나 새로운 아키텍처 구축을 시작하세요.
모두가 같은 일을 하고 있지만 RMKV(RNN 아키텍처)와 같은 다른 아키텍처에 중점을 두는 것이 매우 유익할 것이라고 Mufeed는 설명했습니다.
그는 또한 이 접근 방식을 사용하면 GPT-4만큼 인상적인 것을 구축하는 것이 가능할 수도 있다고 믿습니다.
사진
LLM을 한꺼번에 공부하는 것에 반대하지만 Transformer 훈련 모델은 여전히 진화하고 있습니다. AI/ML 컨설턴트 Dan Hou는 GPT-4o에 대해 이야기하고 훈련 모델을 강조했습니다
원본 기사는 모든 복잡한 모델의 기초인 GPT-를 고려했습니다. 4o는 기본적으로 비디오와 오디오를 이해하도록 설계되었습니다. 이는 향후 버전이 훈련할 수 있는 데이터의 양에 영향을 미칩니다.
“AI는 얼마나 똑똑해질 수 있습니까? 네이티브 멀티모달 아키텍처를 사용하면 대답이 매우 좋다고 생각합니다." Hou는 말했습니다.
또한 Sam Altman은 최근 인터뷰에서 데이터가 더 이상 문제가 되지 않을 것이라고 말하여 훈련 문제를 해결했습니다. LLM 걱정 마세요. 데이터 문제가 해결된다면 LLM의 확장 법칙은 계속 존재할 것입니다. AIGC에 대한 자세한 내용을 보려면
위 내용은 Meta AI CEO LeCun: LLM 직업을 추구하지 마세요의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!