다음 주부터 주간 AI 뉴스가 매일 업데이트됩니다. 매일 AI 뉴스 칼럼이 계속해서 월스트리트 뉴스와 지혜 연구를 팔로우하는 것을 환영합니다.
이번 주 새로운 AI 뉴스 - 뉴스의 새로운 관점
주간 뉴스
이번 주 핵심 사항 요약:
1. Ma Huateng은 AI가 전력 산업 혁명과 비슷하다고 말했습니다. Meituan은 알고리즘 채용을 확대하고 대형 모델을 조용히 개발하고 있습니다.
2. OpenAI는 iOS 버전의 chatGPT를 출시하여 Plus 사용자에게 70개의 플러그인을 공개합니다
3. Meta는 AI 칩인 MTIA를 출시하는데, 이는 여전히 NVIDIA GPU를 사용합니다.
4. AI 그리기의 새로운 이정표인 DragGAN은 한 번의 클릭으로 코끼리가 돌아서고 자동차가 "변환"될 수 있게 해줍니다.
5. 구체화된 지능은 인공지능의 차세대 물결인 AI 능동 인식을 만듭니다.
6. 윤총기술이 대형모델을 출시한다. 버티컬 분야의 상용화 경로는 국내 대형모델에게 기회다.
7. AI 블랙 기술 - 인간과 컴퓨터의 상호작용에 대한 인식을 뒤집는 반기계식 '스파이더맨'을 집에서 경험할 수 있습니다.
새로운 시각으로 뉴스 보기
Tencent의 2023년 주주총회에서 Ma Huateng은 다음과 같이 말했습니다. “처음에는 모두가 AI가 인터넷을 위한 10년에 한 번 있는 기회라고 생각했지만 이제는 AI에 대한 이해가 백 년의 발전 기회로 떠올랐습니다. 이는 전력산업혁명에 비유될 수 있습니다.” 텐센트는 현재도 AI 기술 연구개발에 몰두하고 있지만, 앞으로는 단기적인 성공에만 열중하지 않고 더 많은 가치를 창출해 나가겠습니다. 우리는 to-C 측면에만 초점을 맞추는 것이 아니라 to-B 측면 기회에도 중요성을 부여할 것입니다.
또한, 메이투안은 비밀리에 대형 모델을 개발하고 있으며 3월 초부터 이 분야의 레이아웃을 펼치고 있습니다. 최근에는 알고리즘 팀도 확대되고 있으며, 메이투안의 대형 모델을 지원하기 위해 별도의 '플랫폼 부서'를 설립할 계획도 있습니다. 모델이 특정 상용화 양식을 통과했습니다.
Jianzhi Research는 다음과 같이 믿습니다. 현재 대형 모델 간의 경쟁은 매우 치열하며 많은 오픈 소스 대형 모델의 출현으로 이러한 혁신의 속도가 빨라졌습니다. 그러나 오픈소스 대형 모델의 문제점은 상용화가 어렵고 주로 학술 연구에 활용된다는 점이다. 그러나 해외 폐쇄형 첨단 대형 모델을 일부 핵심 분야에 활용하게 되면 보안상의 위험이 따른다.
그래서 국내 대형 모델 개발의 추세는 중국 예측 라이브러리의 풍부함, 강력한 현지화 장점, 높은 보안 및 기밀성에 있습니다. 향후 중국 전용 대형 모델에 대한 시장 수요는 매우 높을 것입니다.
특별히 주목해야 할 점은 대형 모델과 애플리케이션의 결합이 갖는 상업적 가치입니다. 오픈AI, 마이크로소프트, 구글 모두 생태적 영역을 잇따라 확장하기 시작했습니다. 이는 국내 AI의 발전이 결국 실현되고 더 큰 상업적 가치를 창출하기 위한 불가피한 길이기도 합니다.
속보 출시
1. OpenAI는 iOS 버전의 chatGPT를 출시하여 Plus 사용자에게 70개의 플러그인을 제공합니다
OpenA는 이번 주에 iOS 버전의 chatGPT를 공식 출시했습니다. 사용자는 iOS 16.1 이상의 운영 체제 버전을 사용해야 합니다. 그리고 곧 안드로이드 버전이 출시될 것이라고 약속합니다.
휴대폰의 ChatGPT는 여러 장치에서 사용자의 이력 기록을 동기화하고 OpenAI의 오픈 소스 음성 인식 시스템인 Whisper를 통합합니다. 사용자는 음성을 사용하여 콘텐츠를 입력하고 질문과 답변, 언어 번역, 교육 코칭을 수행하고 자동으로 텍스트를 생성할 수 있습니다. .
또한 ChatGPT는 PLUS 사용자에게 네트워킹 기능을 개방하여 70개의 타사 플러그인을 사용할 수 있습니다.
Jianzhi Research는 다음과 같이 믿습니다. 모바일 애플리케이션을 홍보하든, 개방형 타사 플러그인을 사용하든, 이는 사용자 충성도를 높이고 사용자 침투를 더욱 달성하기 위한 OpenAI의 노력입니다.
모바일 버전을 열면 PC 버전보다 더 편리하고 사용하기 쉽기 때문에 사용자 사용 빈도가 크게 높아질 것입니다. ChatGPT 출시 이후 사용자들은 모바일 장치에서 ChatGPT를 사용하고 싶어했습니다. ChatGPT의 상업적 가치와 일일 활동량은 모바일 단말기의 출시로 다시 한 번 새로운 정점에 도달할 것입니다. 또한, 방문 횟수가 증가함에 따라 컴퓨팅 파워에 대한 수요는 더욱 확대될 것입니다.
또한 타사 플러그인은 현재 PLUS 유료 사용자에게만 공개되어 있지만, 현재 AI 혁명의 정도를 고려하면 완전히 무료로 제공될 날이 머지않았습니다.
2. 메타, AI 전용 칩 MTIA 출시
MTIA는 학습 및 추론을 위해 설계된 프로그래밍 가능 칩으로, 인공 지능 분야에서 Meta의 하드웨어 강점이 크게 향상되었습니다. 결국, 기술 거대 기업 간의 경쟁은 핵심 하드웨어를 벗어날 수 없습니다. 특히 AI가 발전하는 시대에는 컴퓨팅 파워 수준이 개발의 초석입니다. 컴퓨팅 파워를 마스터할 수 없다면 개발 프로세스는 필연적으로 "타인"에 의해 통제될 것입니다. .
그러나 MTIA는 아직 최적화의 여지가 많이 남아 있으며, 나올 때까지 25년 정도 기다려야 할 것으로 예상됩니다. NNP 및 GPU 성능 테스트 측면에서 MTIA는 낮음 및 중간 복잡도 모델에서 더 나은 성능을 발휘하지만 복잡도가 높은 모델에서는 여전히 GPU보다 훨씬 뒤떨어집니다.
Zhizhi Research는 다음과 같이 믿습니다. Meta는 장기적으로 AI 칩을 개발합니다. 결국 칩은 우리 손에 있는 핵심 하드 파워입니다. 그러나 고성능 칩 개발의 길은 매우 멀었습니다. 빠르면 2020년에 완료되었습니다. 시작합니다. 현재 Meta는 여전히 NVIDIA GPU를 사용할 것입니다. 결국 Meta는 NVIDIA GPU를 도입하기 위해 데이터 센터에 대한 파괴적인 설계를 수행했습니다. 앞으로는 주로 RSC 슈퍼컴퓨팅 센터에 의존하여 AI를 개발할 것입니다.
3. AI 드로잉의 새로운 이정표 - DragGAN은 모든 상상을 실현합니다DragGAN은 AI 드로잉 분야에서 확산 모델의 독점 위치를 완전히 무너뜨립니다. "Drag Your GAN"이라는 제목의 논문은 AI 드로잉 서클을 폭발시켰습니다. 이 논문은 MPII, MIT, 펜실베이니아 대학, Google 및 기타 기관의 학자들이 공동으로 출판했으며 SIGGRAPH2023에 승인되었습니다.
이 모델은 사진 편집에 대한 거의 모든 사람들의 요구를 충족시킬 수 있습니다. 물체의 모양, 세부 사항, 심지어 방향과 레이아웃까지 변경할 수 있습니다.
사용자는 사진에 몇 가지 작업 지점(빨간색 점)과 대상 지점(파란색 점)을 설정한 다음 끌어서 놓아 새 이미지를 생성하기만 하면 됩니다.
Jizhi Research는 다음과 같이 믿습니다. DragGAN의 출현은 이미지 학습의 기계 학습이 새로운 수준에 도달했음을 보여줍니다. DragGAN은 더욱 강력한 일반화 기능을 가지고 있으며 훈련 데이터를 초과하는 이미지를 생성할 수 있다는 점은 주목할 가치가 있습니다. 예를 들어 사자 입 모양이 완전히 변경되었습니다. 이것은 사람들이 원래 생각했던 수정이 아니라 기본적으로 새로 생성된 콘텐츠입니다. .그래프 기능.
DragGAN은 이전 방법과 비교하여 특정 분야의 모델링이나 보조 네트워크에 의존하지 않고 대신 일반 프레임워크를 사용하고 GAN을 사용하여 이미지 품질을 식별하며 포인트 추적을 사용하여 이미지 변형 기능을 완성합니다. 이 강력한 기능을 사용하면 비디오 작가와 사진 리터처가 많은 즐거움을 누릴 수 있습니다.
4. 구체화된 지능은 인공지능의 차세대 물결인 AI 능동 인식을 만듭니다.
ITF 세계 2023 반도체 컨퍼런스에서 엔비디아 CEO 젠슨 황(Jensen Huang)은 인공 지능의 다음 물결은 구체화된 지능이 될 것이라는 또 다른 대담한 성명을 발표했습니다.
Jianzhi Research는 다음과 같이 믿습니다. 체화된 지능이 가져오는 AI의 가치는 휴머노이드 로봇의 가치보다 훨씬 큽니다. 체화된 지능의 가장 큰 특징은 주인공의 관점에서 물리적 세계를 자율적으로 인식하고, 의인화된 사고 경로를 활용하여 학습함으로써, 데이터가 공급되기를 수동적으로 기다리는 것이 아니라, 인간이 기대하는 행동 피드백을 제공할 수 있다는 점이다. 인간의 5가지 주요 감각 중 비전은 획득된 정보의 80% 이상을 차지하며, 기계가 인간의 언어를 이해하는 것도 매우 중요합니다. 따라서 머신 비전과 다중 모드 대형 모델은 기계 자체를 잠금 해제하는 두 가지 열쇠입니다. -지각 학습. 자세한 내용은 NVIDIA의 인기 있는 "구체화된 지능"이란 무엇입니까?를 참조하세요. AI의 가치는 로봇의 가치보다 훨씬 크다.
5. 윤콩테크놀로지에서 콩롱 대형 모델을 출시합니다
인공지능 플랫폼 기업 윤콩테크놀로지(Yuncong Technology)는 광저우에서 콩롱 모델을 출시하고 고등학교 입시에서 대화, 프로그래밍, 읽기, 실기 문제 풀이 등 기본 능력을 입증했다. 대형 모델은 현재 내부 베타 단계에 있습니다. 이 모델은 대형 Vincentian 모델이며 Vincentian 다이어그램과 같은 다중 모드 대형 모델의 기능을 아직 완료할 수 없습니다.
공개 테스트 성능: 응답 속도는 빠르지만 내용 정확도는 개선이 필요합니다. 더욱이, 데이터베이스의 적시성은 상대적으로 낮으며, 아직 21년이 되었습니다. 또한, 수학과 추론 능력에 있어서 모델의 성능은 아직 기대에 미치지 못했습니다.
Jianzhi Research는 다음과 같이 믿습니다. 국내 대형 모델의 장점은 중국 코퍼스의 풍부함이 외국 고급 대형 모델보다 훨씬 높다는 것입니다. 비록 리더십 측면에서 ChatGPT를 따라잡기는 어렵지만, Congrong Big Model은 향후 수직산업의 응용개발을 주도할 것이며, 특히 금융, 정무, 산업 등 분야의 독점 산업모델 개발에 앞장서게 될 것입니다. 제조 및 모델화에 전념하고 있습니다.
AI 블랙 테크놀로지
1. 디즈니의 'Beyond the Horizon'을 집에서 체험할 수 있습니다
외국 개발자 Nils Bakker는 Unreal Engine 5.1 + ChatGPT + Google Maps 3D Tiles API를 사용하여 ChatGPT를 사용하여 "가상 공간 전송" 시스템을 성공적으로 만들었습니다. 사용자는 위치만 입력하면 되며 시스템은 1인칭 관점에서 사용자를 안내합니다. 세계의 아름다운 풍경을 바라보며 집에서 지평선 너머로 날아가는 즐거움을 경험하는 시간입니다.
Google 3D Tiles와 ChatGPT의 API를 결합한 다음 Unreal Engine의 기능을 사용하여 사용자가 몰입감 있게 우주 여행을 경험할 수 있도록 합니다. 이제 집에 누워서도 수평선 너머로 날아가는 매력을 느껴보세요.
Jizhi Research는 믿습니다: AI는 아직 산업 발전의 초기 단계에 있으며, 상상력과 창의성은 매우 중요하며, 산업 경로와 비즈니스 기회는 비가 내린 후 버섯처럼 솟아오를 것입니다.
2. 사이보그 '스파이더맨'이 왔어요
일본 로봇 회사인 Jizai Arms는 인간이 자유롭게 제어할 수 있는 로봇 팔을 가질 수 있도록 하는 거미 모양의 로봇 팔다리 시스템을 설계했습니다. 시스템은 착용한 사용자가 제어할 수 있는 6개의 팔로 구성됩니다. 최대 4개의 로봇 팔을 설치할 수 있습니다. 주목할만한 점은 이 시스템이 인간과 기계의 상호 작용 방식을 변화시킨다는 것입니다.
이 보철물은 매우 유연하며 창고부터 병원 수술실까지 다양한 용도로 사용할 수 있어 향후 장애인의 삶의 질을 향상시키는 데 도움이 될 수 있습니다.
Jianzhi Research는 다음과 같이 믿습니다. 로봇 팔과 실제 사람의 "융합"은 인간-기계 통합의 상상 공간을 열어주고 로봇 개발에 대한 사람들의 이해의 상한선을 새롭게 합니다. 앞으로는 더 불가능한 일이 실현될 것입니다.
다음주 볼만한 영상
OpenAI의 첫 오픈소스 대형 모델이 기대됩니다. 오픈소스 왕으로서의 Meta의 위상을 다시 쓸 수 있을까요?
위 내용은 AI 주간 뉴스: Ma Huateng은 AI가 100년에 한 번 있는 기회라고 말했습니다. OpenAI는 iOS를 사용하여 사용자 접착성을 유지하며, 구체화된 지능을 통해 AI가 현실 세계를 인식할 수 있습니다 |의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!