OpenAI가 대학 입학 제안을 포기할 가치가 있나요?
컴퓨터공학 분야에 취업하고 싶은 박사과정 학생의 경우, 학계와 산업계 중에서 어떻게 선택해야 할까요?
워싱턴 대학의 박사 과정 학생인 Rowan Zellers는 원래 교수직을 찾는 것이 박사 과정 중에 그가 설정한 경로였습니다. 이를 위해 그는 목표 목록 초안을 작성하고 많은 지원 자료를 작성했으며 학계의 소셜 네트워크를 활용하여 더 많은 기회를 찾았습니다.
동시에 그는 업계의 기회에도 노출되기 시작했습니다. 업계 기업과의 소통은 점차 Rowan Zellers의 생각을 뒤흔들었습니다. 그는 자신의 연구 분야인 다중 모드 인공 지능에 대해 학계에서 대규모 기초 연구를 수행하는 것이 어렵고 점점 더 어려워지고 있으며, 업계에서 기회가 점점 더 많아지고 있다는 사실을 깨달았습니다. .
2022년경 기술 회사들이 채용 속도를 늦추거나 동결했지만 Rowan Zellers는 여전히 더 매력적인 기회를 찾았습니다. OpenAI가 그에게 올리브 가지를 던졌습니다.
취업 마지막 단계에서 그는 전혀 생각하지 못했던 일을 했습니다. 모든 학문적 직위를 거부하고 OpenAI의 제안에 서명하기로 결정했습니다. 2022년 6월, Rowan Zellers는 공식적으로 오랜 학교 생활에 작별을 고하고 OpenAI에 합류했습니다.
무엇이 그를 1년 만에 생각을 바꾸게 만들었나요? 최근 블로그 게시물에서 Rowan Zellers는 구직 팁 중 일부를 공유했습니다.
다음은 블로그 텍스트입니다.
Rowan Zellers는 CVPR 2019에서 시각적 상식 추론에 관한 그의 작품을 발표했습니다.
결정 과정에서 굉장히 긴장하고 스트레스를 많이 받았어요. 당시에는 반전처럼 느껴졌지만 결과적으로는 결과적으로 정말 만족스럽습니다. 저에게는 두 가지 핵심 요소가 있습니다.
1) OpenAI에서 제가 열정을 갖고 있는 일을 할 수 있을 것 같습니다.
2) OpenAI가 기반을 둔 샌프란시스코는 좋은 곳입니다. 도시에서 살고 일하는 것.
이 기사에서는 의사 결정 과정에 대해 더 자세히 논의하겠습니다.
이 체험글을 쓰는 이유는 무엇인가요?
구직 중에 소셜 네트워크의 교수님들로부터 지원 방법, 인터뷰 방법, 훌륭한 지원서를 만드는 방법에 대한 훌륭한 조언을 많이 받았습니다. (이 시리즈의 1부에서는 이 조언을 취업 지원에 관한 실증적인 기사로 정제하려고 했습니다.)
그러나 실제로 결정해야 할 때가 되었을 때 여전히 약간 외로움을 느꼈습니다. 저는 이러한 문제에 대해 연락할 수 있는 교수 및 업계 연구원의 강력한 네트워크를 갖게 된 것이 정말 행운이라고 인정합니다. 그러나 진로 간의 결정은 어느 정도 "정답이 없다"는 맞춤형 개인 결정에 가깝습니다.
내가 아는 대부분의 사람들이 의사결정에 영향을 미치는 또 다른 요인은 학계와 산업계 중 하나를 선택한 것 같다는 것입니다. 내가 아는 교수들 대부분은 학문적 시스템에 확고히 종사하고 있고(산업계에 약간의 손길이 있음에도 불구하고), 업계에 있는 대부분의 사람들은 학계를 직업으로 진지하게 고려한 적이 없습니다.
이게 특히 이상하게 느껴집니다. 왜냐하면 제가 박사 과정 중에 '학문의 길'을 가기로 결정한 동기는 그렇게 하면 학계와 산업계 간의 최종 결정을 연기할 수 있다는 것이었기 때문입니다. 학계에서 산업계로 이동하는 것이 더 쉽다는 공통된 견해가 있었기 때문입니다. 다른 방향으로 돌리는 것보다. 그러나 거의 몇 년이 지나서 나는 학문의 길을 택하는 것이 실제로 내 직업적 정체성의 일부라는 것을 깨달았습니다. 많은 동료들이 같은 일을 하고 있었기 때문에 나를 학문의 길로 밀어주는 힘이 있다는 것을 느꼈습니다.
어쨌든, 저는 꽤 다양한 선택 중에서 제가 어떻게 결정을 내렸는지에 대한 N=1의 독선적인 관점을 제공하기 위해 이 글을 썼습니다.
학업 일자리를 찾는 과정에서
일과 목표에 대한 관점이 바뀌었습니다
팬데믹 기간 동안의 내 사무실.
저는 2016년부터 2022년까지 워싱턴 대학교에서 박사 과정을 밟았고 그 과정을 정말 좋아했습니다. 내 연구 분야는 언어, 시각 및 기타 세계를 이해할 수 있는 기계 학습 시스템을 구축하는 다중 모드 인공 지능에 관한 것입니다.
이 시리즈의 첫 번째 부분에 쓰인 것처럼 연구 관심 분야가 내 미리 설정된 진로를 형성했습니다. 기초 연구를 하고 후배 연구자들을 멘토링하는 일이 가장 즐겁습니다. 적어도 컴퓨팅의 전통적인 수준에서는 이것이 학계의 초점인 반면, 업계는 응용 연구를 전문으로 하며 과학적 진보를 성공적인 제품으로 전환하기 위해 노력합니다.
학계에서 취업을 하면서 다양한 기관과 CS 하위 분야에서 교수로 일하는 것이 어떤 것인지에 대한 아이디어를 얻었습니다. 나는 모든 인터뷰에서 160명이 넘는 교수들과 이야기를 나누었습니다. 결국, 학계가 전적으로 나에게 맞는 것인지 확신할 수 없었습니다.
학계에서 대규모 기초연구를 하기는 어렵다
지난 6년 동안 학계(구체적으로는 워싱턴대학교 그룹에서 지도교수님의 연구)가 정말 좋았습니다. 나를 위한 환경. 저는 저를 흥분시키는 연구 방향을 추구하게 되었고 멘토링과 자원 측면에서 넉넉한 지원을 받았습니다. 이러한 조건을 통해 저는 규모가 커짐에 따라 개선되고 답변보다 더 많은 질문을 생성하는 다중 모드 AI 시스템 구축에 대한 연구를 주도할 수 있습니다.
비교하면 그 당시 대부분의 업계 대형 연구소는 내 관심분야와 잘 맞지 않는다고 느꼈습니다. 나는 박사 학위 기간 동안 인턴십을 신청하려고 했지만 내 연구 주제에 맞는 인턴십을 찾는데 결코 성공하지 못했습니다. 제가 아는 대부분의 업계 팀은 주로 언어 중심이거나 시각적 중심이므로 둘 중 하나를 선택할 수 없습니다. 저는 비교적 학술적인 느낌이 드는 비영리 연구실인 Allen Institute for Artificial Intelligence에서 많은 시간을 보냈습니다.
그러나 상황이 바뀌고 있습니다. 제가 집중하고 있는 분야에서는 학계에서 획기적인 시스템 구축 연구를 한다는 것이 어렵고, 점점 더 어려워지는 게 아닌가 걱정됩니다.
시스템을 구축하는 것이 정말 어려운 것이 현실입니다. 많은 자원과 엔지니어링이 필요합니다. 이런 고비용, 고위험 시스템 구축 연구에는 학계의 인센티브 구조가 적합하지 않다고 생각합니다.
인공적인 시스템을 구축하고 그것이 잘 확장된다는 것을 입증하려면 대학원생에게 수년의 시간이 걸릴 수 있으며 보조금을 받지 않은 컴퓨팅 비용으로 $100,000 이상이 걸릴 수 있습니다. 그리고 분야가 성장함에 따라 이 숫자는 기하급수적으로 증가하는 것으로 보입니다. 따라서 논문을 많이 쓰는 것은 실행 가능한 전략이 아니며, 적어도 지금 당장의 목표가 되어서는 안 되지만, 안타깝게도 논문 수를 객관적인 척도로 사용하는 경향이 있는 학자들을 많이 알고 있습니다. 또한, 논문은 학계가 자금 지원을 신청하기 위해 사용하는 "협상 칩"입니다. 우리는 많은 논문을 작성해야 하고, 컨퍼런스에서 이야기할 내용이 있어야 하며, 학생들을 위한 인턴십 기회를 찾아야 합니다. 성공적인 학업 경력은 학생들이 자신의 연구 의제를 개척하도록 돕는 것이라는 점에서(그들은 다른 곳에서 교수가 될 수 있으며 이러한 순환은 계속될 수 있음), 이는 훌륭한 연구를 수행하는 데 필요한 협력에 내재되어 있습니다.
그러나 더 넓은 추세는 학계가 응용 연구로 전환되는 것이라고 생각합니다.
모델 기술이 점점 더 강력해지고, 건설 비용도 높아지면서, 모델 위에 애플리케이션을 구축하려는 학자들이 점점 늘어나고 있습니다. 이는 NLP와 CV라는 두 가지 주요 분야에서도 볼 수 있는 추세입니다. 이는 결국 학계가 주목하고 논의하는 문제들에도 영향을 미치게 되었고, 연구자들은 현실적이고 구체적인 문제를 어떻게 해결할 것인지에 관심을 갖기 시작했습니다.
학계에서는 성공적인 연구를 완료하려면 자금 조달, 실험실 설립 등 여러 단계를 거쳐야 정식으로 과학 연구 프로젝트를 시작할 수 있다고 생각합니다. 마침내 좋은 연구 결과를 얻었을 때는 몇 년이 지났을 수도 있습니다. 아마도 이 기간 동안 이미 누군가가 획기적인 결과를 내놓았을 것이고, 이 트랙에서 제가 두각을 나타내기는 어려울 것입니다. 하지만 지난 몇 년 동안 이 분야의 발전은 매우 빨랐습니다.
좀 더 현실적으로, 한 트랙에서 실패하면 연구 방향을 바꿔야 할 수도 있습니다. 하지만 그것은 원래 의도가 아니었고, 아마도 제가 업계의 길을 가게 된 주된 이유였을 것입니다.
학계와 산업계의 또 다른 차이점
제가 전공하는 분야에서 교수의 모든 책임에는 교육(및 교재 준비), 학회 및 현장에 대한 기여, 컴퓨팅 인프라 구축 및 관리, 보조금 신청, 및 행정자금 등 비록 이런 일들이 흥미롭다고 생각하지만, 그렇게 많은 작업 시나리오를 동시에 처리하고 싶지는 않습니다. 이를 쉽게 수행하려면 강력한 작업 능력이 필요하기 때문입니다. 나는 내 직업이 가르치는 것과 같은 중요한 업무에 집중되기를 원합니다.
마찬가지로, 저는 박사 과정 동안 한 번에 하나의 중요한 연구 질문에만 집중하는 것을 좋아합니다. 이런 집중적인 업무 현장은 업계에 더 많이 존재하는 것 같아요. 교수로서 실험과 코드 작성을 동시에 한다는 것은 정말 쉽지 않은 일이고, 업계에서는 업무 분담이 더욱 명확해졌습니다.
많은 사람들이 학계가 주는 명성 때문에 무의식적으로 학계에 매력을 느낀다고 생각하는데 저는 그게 싫습니다. 순위와 평판에만 집중하다 보면 잘못된 목표를 쫓게 되고, 상실감을 느끼게 되는 것 같아요. 반면에 많은 사람들은 더 높은 급여를 제공하기 때문에 업계에 매력을 느낍니다. 이는 중요합니다. 다행스럽게도 나는 내적 만족을 더 많이 주는 환경을 찾았습니다.
Job and Career Security
많은 분들이 테뉴어에 대해 오해하시는 것 같아요. 교수 등 정년직이 안정적이고 고용안정성이 있는 것은 사실이다. 그러나 취업을 앞두고 있는 이들에게 학계 취업 시장 역시 매우 복잡합니다. 물론 업계 연구자들과 달리 학계 연구자들은 불황 속에서도 쉽게 이직할 수 있다.
학계에서는 이론적으로는 모든 주제에 대해 자유롭게 연구할 수 있지만 실제로는 충분한 자원이나 지원 환경이 부족하여 방해가 될 수 있습니다. 내가 가장 관심 있는 문제를 해결하기 위해 이곳에서 큰 지원을 받았기 때문에 OpenAI에 합류했습니다. 저는 모든 산업 연구소에서 제가 관심을 갖고 있는 문제를 해결하려면 회사 제품과 연계되어야 한다고 생각하며 OpenAI는 바로 그런 방식을 갖추고 있습니다.
OpenAI 팀에서 일하면서 후배 연구자들을 멘토링하고 풍부한 연구 자원을 얻을 수 있는 기회를 얻었습니다. 더 중요한 것은 나에게 중요한 어려운 문제를 해결하려는 의지가 있다는 것입니다.
이러한 이유로 OpenAI에서 정규직 계약을 선택하게 되었습니다. 입사한 지 반년이 지났는데 OpenAI에서 일하는 것이 정말 즐겁다는 것을 알게 되었습니다.
위 내용은 OpenAI가 대학 입학 제안을 포기할 가치가 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











대규모 언어 모델(LLM)은 자연어 이해, 언어 생성, 복잡한 추론을 비롯한 여러 중요한 작업에서 강력한 기능을 입증했으며 사회에 지대한 영향을 미쳤습니다. 그러나 이러한 뛰어난 기능을 사용하려면 상당한 교육 리소스(왼쪽 참조)와 긴 추론 시간(오른쪽 참조)이 필요합니다. 따라서 연구자들은 효율성 문제를 해결하기 위한 효과적인 기술적 수단을 개발해야 합니다. 또한 그림의 오른쪽에서 볼 수 있듯이 Mistral-7B와 같은 일부 효율적인 LLM(LanguageModel)이 LLM의 설계 및 배포에 성공적으로 사용되었습니다. 이러한 효율적인 LLM은 LLaMA1-33B와 유사한 정확도를 유지하면서 추론 메모리를 크게 줄일 수 있습니다.

3nm 공정, H100을 능가하는 성능! 최근 외신 디지타임스는 엔비디아가 차세대 GPU인 B100(코드명 '블랙웰')을 인공지능(AI)과 고성능컴퓨팅(HPC) 애플리케이션용 제품으로 개발 중이라는 소식을 전했다. B100은 TSMC의 3nm 공정 공정과 더욱 복잡한 MCM(멀티 칩 모듈) 설계를 사용하며 2024년 4분기에 출시될 예정입니다. 인공지능 GPU 시장의 80% 이상을 독점하고 있는 엔비디아의 경우, B100을 이용해 철이 뜨거울 때 공격할 수 있고, 이번 AI 배치 물결에서 AMD, 인텔 등 도전자들을 더욱 공격할 수 있다. NVIDIA 추정에 따르면, 2027년까지 이 분야의 출력 가치는 대략적으로 도달할 것으로 예상됩니다.

최근에는 다중모달 학습이 많은 주목을 받고 있는데, 특히 텍스트-이미지 합성과 이미지-텍스트 대조 학습이라는 두 가지 방향에서 더욱 그렇습니다. OpenAI에서 출시한 텍스트 이미지 모델 DALL・E 및 DALL-E 2, NVIDIA의 GauGAN 및 GauGAN2와 같은 일부 AI 모델은 창의적인 이미지 생성 및 편집에 적용되어 광범위한 대중의 관심을 끌었습니다. 이에 뒤처지지 않기 위해 Google은 5월 말 자체 텍스트-이미지 모델 Imagen을 출시했는데, 이는 캡션 조건부 이미지 생성의 범위를 더욱 확장하는 것으로 보입니다. 장면에 대한 설명만 주어지면 Imagen은 고품질, 고해상도를 생성할 수 있습니다.

다중 모드 대형 모델에 대한 가장 포괄적인 리뷰가 여기에 있습니다! Microsoft의 중국 연구원 7명이 집필한 이 책은 119페이지로 구성되어 있습니다. 이는 이미 완성되어 현재까지 선두에 있는 두 가지 유형의 다중 모드 대형 모델 연구 방향에서 시작하여 시각적 이해와 시각적 생성이라는 5가지 구체적인 연구 주제를 포괄적으로 요약합니다. 통합 시각적 모델 LLM이 지원하는 다중 모드 대형 모델 다중 모드 에이전트는 현상에 초점을 맞춥니다. 다중 모드 기본 모델은 전문화된 모델에서 범용 모델로 이동했습니다. Ps. 그래서 저자는 논문 서두에 도라에몽의 이미지를 직접 그렸습니다. 이 리뷰(보고서)를 누가 읽어야 합니까? Microsoft의 원래 말로: 전문 연구원이든 학생이든 다중 모달 기본 모델의 기본 지식과 최신 진행 상황을 배우는 데 관심이 있는 한 이 콘텐츠는 함께 모이는 데 매우 적합합니다.

이미지-비디오 생성(I2V) 작업은 정적 이미지를 동적 비디오로 변환하는 것을 목표로 하는 컴퓨터 비전 분야의 과제입니다. 이 작업의 어려움은 이미지 콘텐츠의 신뢰성과 시각적 일관성을 유지하면서 단일 이미지에서 시간 차원의 동적 정보를 추출하고 생성하는 것입니다. 기존 I2V 방법에는 이 목표를 달성하기 위해 복잡한 모델 아키텍처와 많은 양의 교육 데이터가 필요한 경우가 많습니다. 최근 Kuaishou가 주도한 새로운 연구 결과 "I2V-Adapter: AGeneralImage-to-VideoAdapter for VideoDiffusionModels"가 발표되었습니다. 본 연구에서는 혁신적인 이미지-비디오 변환 방법을 소개하고 경량 어댑터 모듈을 제안합니다.

2022년 볼츠만상을 수상한 두 명의 과학자가 발표되었습니다. 이 상은 IUPAP 통계물리학위원회(C3)가 통계물리학 분야에서 뛰어난 업적을 이룬 연구자를 표창하기 위해 제정한 것입니다. 우승자는 이전에 볼츠만상이나 노벨상을 수상한 적이 없는 과학자여야 합니다. 이 상은 1975년에 시작되었으며 통계 물리학의 창시자인 루트비히 볼츠만(Ludwig Boltzmann)을 기념하기 위해 3년마다 수여됩니다. 수상 이유: 자기 조직화의 정확한 해결을 포함하여 통계 물리학 분야에 대한 Deepak Dharistheoriginalstatement의 선구적인 공헌을 인정하여 수여됩니다. 중요 모델, 인터페이스 성장, 장애

EfficientSAM의 이 작업은 CVPR2024에 5/5/5점 만점으로 포함되었습니다! 작가는 그 결과를 아래 사진처럼 소셜미디어에 공유했습니다. 르쿤 튜링상 수상자도 이 작품을 강력 추천했습니다! 최근 연구에서 Meta 연구진은 SAM을 사용한 SAMI(Mask Image Pre-training)라는 새로운 개선된 방법을 제안했습니다. 이 방법은 MAE 사전 훈련 기술과 SAM 모델을 결합하여 고품질 사전 훈련된 ViT 인코더를 달성합니다. SAMI를 통해 연구자들은 모델의 성능과 효율성을 개선하고 비전 작업을 위한 더 나은 솔루션을 제공하려고 노력합니다. 이 방법의 제안은 컴퓨터 비전 및 딥 러닝 분야를 더욱 탐구하고 개발할 수 있는 새로운 아이디어와 기회를 제공합니다. 서로 다른 것을 결합하여

영상 생성이 본격화되고 있으며, 피카는 위대한 장군, 즉 피카의 창립 과학자인 구글 연구원 오메르 바르탈(Omer Bar-Tal)을 맞이했습니다. 한 달 전, 구글이 영상 생성 모델인 뤼미에르(Lumiere)를 공동저자로 출시했는데, 그 효과는 놀라웠다. 당시 네티즌들은 “구글이 영상 세대 전쟁에 합류했는데, 또 한 번 볼만한 좋은 쇼가 있다”고 말했다. StabilityAI CEO와 Google의 전 동료들을 포함하여 업계 관계자들이 축복을 보냈습니다. 뤼미에르의 첫 작품, 막 석사 학위를 취득한 오메르 바르탈(Omer Bar-Tal)은 2021년 텔아비브 대학교 수학과 컴퓨터과학과를 졸업한 뒤 와이즈만 과학원에서 컴퓨터 석사 과정을 공부했다. 주로 이미지 및 비디오 합성 분야의 연구에 중점을 두고 있습니다. 그의 논문 결과는 여러 차례 발표되었습니다
