- 방향:
- 모두 웹3.0 백엔드 개발 웹 프론트엔드 데이터 베이스 운영 및 유지보수 개발 도구 PHP 프레임워크 일일 프로그램 위챗 애플릿 일반적인 문제 다른 기술 CMS 튜토리얼 Java 시스템 튜토리얼 컴퓨터 튜토리얼 하드웨어 튜토리얼 모바일 튜토리얼 소프트웨어 튜토리얼 모바일 게임 튜토리얼
- 나누다:
-
- Doubao Big Model Team은 VLM 캡션 평가의 신뢰성을 향상시키기 위해 새로운 세부 이미지 캡션 평가 벤치마크를 출시했습니다.
- AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 현재의 시각적 언어 모델(VLM)은 주로 QA 질문 및 답변 형식을 통해 성능 평가를 수행하지만, 신뢰성 있는 평가 방법 등 모델에 대한 기본 이해에 대한 평가가 부족합니다. 디테일이미지캡션 성능. 이 문제에 대해 중국과학원에서는
- 일체 포함 927 2024-07-18 20:10:02
-
- 삼성 중국 갤럭시 Z 시리즈 신제품 액세스 빈백 대형 모델
- 삼성전자가 7월 17일 중국 시장을 겨냥한 차세대 갤럭시Z 시리즈 제품을 출시했다. 이날 회의에서 삼성전자와 볼케이노엔진은 빈백 모델을 갤럭시Z폴드6와 갤럭시Z플립6 휴대폰의 스마트 비서 및 AI 비전에 연결해 휴대폰의 스마트 애플리케이션 경험을 향상시키는 협력을 공식 발표했다. 앞서 삼성전자는 해외 신제품 출시 때 구글 제미니와 긴밀한 협력을 밝힌 바 있다. 중국에서는 볼케이노 엔진 등 제조사를 대형 모델 파트너로 선정한 바 있다. fenye 캡션: 삼성 갤럭시 Z Fold6 및 Galaxy Z Flip 6 휴대폰의 스마트 비서 및 AI 시각적 액세스 빈백 모델 외에도 원 검색, 실시간 번역, 녹음 전사 등 공개된 AI 기능이 있습니다. 등, 이번에는
- 일체 포함 646 2024-07-18 20:07:33
-
- 시각적 인코더를 포기한 이 '네이티브 버전' 다중 모드 대형 모델은 주류 방법과도 비슷합니다.
- AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Diao Haiwen은 Dalian University of Technology의 박사 과정 학생이며 그의 지도교수는 Lu Huchuan 교수입니다. 현재 베이징 즈위안 인공지능 연구소에서 인턴으로 근무하고 있는 강사는 왕신롱 박사입니다. 그의 연구 관심 분야는 시각과 언어, 대형 모델의 효율적인 전달, 다중 모드 대형 모델 등입니다. Cui를 함께 만들어 볼까요
- 일체 포함 423 2024-07-18 19:21:11
-
- 이 VLM은 모두 시각 장애가 있습니까? GPT-4o와 Sonnet-3.5는 '비전' 테스트에 연속적으로 실패했습니다.
- 4개의 주요 VLM이 모두 시각 장애인을 속이려고 노력하고 있습니까? 가장 인기 있는 SOTA 모델(GPT-4o, Gemini-1.5, Sonnet-3, Sonnet-3.5)이 두 선 사이에 몇 개의 교차점이 있는지 계산해 보겠습니다. 이들이 인간보다 더 나은 성능을 발휘할까요? 대답은 아마도 '아니요'일 것입니다. GPT-4V 출시 이후 시각적 언어 모델(VLM) 덕분에 대형 모델의 지능이 우리가 상상했던 인공지능 수준에 한 발 더 가까워졌습니다. VLM은 이미지를 이해하고 언어를 사용하여 자신이 보는 것을 설명하고 이러한 이해를 바탕으로 복잡한 작업을 수행할 수 있습니다. 예를 들어 VLM 모델에 식탁 사진과 메뉴 사진을 보내면 두 사진에서 맥주병의 개수와 메뉴 단가를 추출해 계산할 수 있다.
- 일체 포함 690 2024-07-18 18:18:02
-
- MotionClone: 교육이 필요하지 않으며 원클릭으로 비디오 동작을 복제합니다.
- AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 참조 비디오의 움직임은 프롬프트 단어로 지정된 새 장면에서 복제될 수 있습니다. 신체 움직임은 원클릭으로 가능합니다. 논문: https://arxiv.org/abs/2406.05
- 일체 포함 1045 2024-07-18 17:06:12
-
- 인간이 AI를 흉내낼 수 있는 새로운 길, AI: 광기라면 당신은 나의 아버지
- 기계의 힘에 관한 보고서 편집자: Yang Wen의 AI는 인간에 의해 길을 잃었습니다! 이 세상은 정말 미쳤어요... 최근 소셜 미디어에는 AI라는 기치 아래 실제 사람들이 AI로 코스프레하는 재미있는 영상이 많이 올라왔고, Douyin은 심지어 인간 모방 AI 콘테스트라는 화제까지 가지고 있습니다. (Douyin 블로거 "Guan Ni Luan Shi"의 비디오) 비디오 링크: https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlw루틴은 모두 동일합니다. 왼쪽은 오래된 사진이고 "AI 수리"는 왼쪽입니다. 오른쪽 ” 자막, 뇌간 누락에 대한 피비린내 나는 “음모”는 실제로 실제 사람들이 수행합니다. -1-AI: 사칭은 처음인데 저보다 더 심할 줄은 몰랐습니다.
- 일체 포함 1788 2024-07-18 16:51:08
-
- 대형 모델의 추론 효율성이 손실 없이 3배 향상되었습니다. 워털루 대학교, 북경 대학교 및 기타 기관에서 EAGLE을 출시했습니다.
- LLM(대형 언어 모델)은 다양한 분야에서 점점 더 많이 사용되고 있습니다. 그러나 텍스트 생성 프로세스는 비용이 많이 들고 느립니다. 이러한 비효율성은 자동 회귀 디코딩의 운영 규칙에 기인합니다. 즉, 각 단어(토큰)를 생성하려면 순방향 전파가 필요하며, 수십억에서 수천억 개의 매개변수에 대한 LLM에 액세스해야 합니다. 이로 인해 기존의 자동 회귀 디코딩 속도가 느려집니다. 최근 워털루 대학교, 캐나다 벡터 연구소, 북경 대학교 및 기타 기관이 공동으로 EAGLE을 출시했습니다. EAGLE은 모델 출력 텍스트의 일관된 배포를 보장하면서 대규모 언어 모델의 추론 속도를 향상시키는 것을 목표로 합니다. 이 방법은 LLM의 두 번째 최상위 특징 벡터를 추정하여 생성 효율성을 크게 향상시킬 수 있습니다. 기술 보고서: https://sites.google.com/view
- 일체 포함 1044 2024-07-18 14:43:48
-
- Agent의 실제 성능을 효과적으로 평가하기 위해 새로운 온라인 평가 프레임워크인 WebCanvas가 출시되었습니다.
- 판이첸(Pan Yichen): 저장대학교 석사 1년차 학생. Kong Dehan: Cross Star Technology의 모델 알고리즘 책임자. Zhou Sida: 2024년 난창대학교를 졸업한 그는 시안전자과학기술대학교에서 석사 학위 과정을 공부할 예정입니다. 추이 쳉(Cui Cheng): 2024년 절강중의과대학교를 졸업하고 쑤저우대학교에서 석사학위 과정을 공부할 예정입니다. Pan Yichen, Zhou Sida 및 Cui Cheng은 Cross Star Technology의 알고리즘 인턴으로서 공동으로 이 논문의 연구 작업을 완료했습니다. 오늘날 급속한 기술 발전 시대에 LLM(대형 언어 모델)은 우리가 디지털 세계와 상호 작용하는 방식을 전례 없는 속도로 변화시키고 있습니다. LLM 기반 지능형 에이전트(LLMAgent)는 단순한 정보 검색에서 복잡한 웹 페이지 운영으로 점차 통합되고 있습니다.
- 일체 포함 636 2024-07-18 14:04:51
-
- AKOOL은 칸 광고상(Cannes Advertising Awards)을 지원하고 혁신적인 실시간 디지털 휴먼 플랫폼을 출시합니다.
- 2024년 유러피언컵이 본격화되면서 프랑스 통신업체 오렌지가 제작한 축구 경기 영상도 빠르게 인기를 끌었다. 영상에서 우리는 음바페, 지루, 그리즈만... 사실 코트를 달리는 선수들은 모두 실제 사람이 아닌 인공지능이 생성한 가상의 캐릭터들이다. 뛰어난 창의성과 독창성을 갖춘 이 작품은 올해 칸 국제광고제에서 스포츠 부문상인 광고 크리에이티브 마케팅 업계의 '오스카상'을 수상했다. AKOOL은 수상 경력이 있는 이 작업에 핵심 기술 지원을 제공했습니다. 그들이 개발한 AI 얼굴 캡처 시스템은 세심하게 설계된 렌더링 기술의 지원으로 작품 속 가상 캐릭터를 인간 얼굴의 미묘한 표정과 움직임까지 정확하게 포착할 수 있다.
- 일체 포함 565 2024-07-18 09:26:11
-
- 178페이지, 128개 사례, 의료 분야의 GPT-4V 종합 평가, 임상 적용 및 실질적인 의사 결정에는 아직 멀음
- Shanghai Jiao Tong University & Shanghai AILab은 178페이지 분량의 GPT-4V 의료 사례 리뷰를 공개하여 의료 분야에서 GPT-4V의 시각적 성능을 처음으로 종합적으로 공개했습니다. 대규모 기본 모델을 중심으로 인공지능 개발은 최근 큰 진전을 이루었으며, 특히 OpenAI의 GPT-4의 강력한 질문과 답변, 지식 능력은 AI 분야의 유레카 모멘트를 빛내며 광범위한 대중을 불러일으켰습니다. 우려. GPT-4V(ision)은 OpenAI의 최신 멀티모달 기본 모델입니다. GPT-4와 비교하여 이미지 및 음성 입력 기능이 추가되었습니다. 본 연구는 총 1건의 사례 분석을 통해 다중모달 의료 진단 분야에서 GPT-4V(ision)의 성능을 평가하는 것을 목표로 한다.
- 일체 포함 1262 2024-07-18 06:20:10
-
- 수학을 위한 ICML 2024 AI 워크숍 논문 모집 및 챌린지 개시!
- ICML2024, 형식 및 자연어 AI 수학적 추론에 관한 AIforMath워크숍 워크숍 시간: 2024년 7월 26/27일 위치: 오스트리아 비엔나. 현장과 온라인을 동시에 진행합니다. 워크샵 홈페이지: https://sites.google.com/view/ai4mathworkshopicml2024/ 수학적 추론은 인간 지능의 가장 어렵고 깊은 부분입니다. 수학적 추론의 발전 과정에서 인간은 수학적 문제와 증명 과정을 엄밀하게 기술할 수 있는 다양한 형식 언어를 요약해 왔다. 최근 몇 년 동안 기계 학습 알고리즘과 대규모 언어 모델은 일부 수학적 추론에서 점차 인간의 성능에 접근하거나 심지어 능가하고 있습니다.
- 일체 포함 753 2024-07-18 05:36:50
-
- Meta는 System 2 증류 기술을 개발하고 Llama 2 대화 모델 작업 정확도는 100%에 가깝습니다.
- 연구원들은 System2 증류가 미래 연속 학습 AI 시스템의 중요한 기능이 될 수 있다면 System2가 잘 수행하지 못하는 추론 작업의 성능을 더욱 향상시킬 수 있다고 말했습니다. LLM(대형 언어 모델) 전략에는 일반적으로 두 가지 유형이 있습니다. 하나는 즉각적 System1(빠른 응답)이고 다른 하나는 System2(느린 사고)입니다. System2 추론이 사려 깊은 사고를 선호하는 반면, 생성적 중간 사고는 모델(또는 인간)이 작업을 성공적으로 완료하거나 지시에 응답하기 위해 추론하고 계획할 수 있도록 합니다. System2 추론에서는 특히 System1(보다 자동적인 사고)이 잘못될 수 있는 상황에서 노력적인 정신 활동이 필요합니다. 따라서 System1은
- 일체 포함 1175 2024-07-18 05:07:20
-
- A당의 실제 AGI 요구 사항을 직접적으로 해결하기 위해 인공 지능 역량 강화 산업 통합 발전 포럼이 성공적으로 개최되었습니다.
- 7월 6일, '2024 WAIC 인공지능 역량 강화 산업 통합 발전 포럼'이 세계 엑스포 전시 컨벤션 센터에서 성대하게 열렸습니다. 이번 포럼의 주요 주제는 리더십 연설, 조인식, 기조연설, 중앙 및 국유 기업을 위한 인공지능 시나리오 요구 사항 발표, 그리고 원탁 포럼. 중국전자정보산업발전연구소, 중국모바일연구소, Sinopec Shengli Oilfield, State Grid Customer Service Center, China Electronics Yuchuang, China Southern Power Grid Digital Grid Group, Damo Institute, Baidu Smart Cloud, Innovation Qizhi 등 컨퍼런스에 참석한 참석자들은 다양한 분야의 인공지능 응용 실습, 대형 모델의 개발 및 적용, 지능형 운영 및 유지 관리에 중점을 두었습니다.
- 일체 포함 575 2024-07-18 03:14:57
-
- 패셔너블한 AIGC 마케터들은 어떻게 'lizi'와 'face' 사이에서 윈윈(win-win) 상황을 달성할 수 있을까요?
- 마케팅 분야 AIGC 기술의 혁신과 보안 지난 1년 동안 AI 기술은 사회 각계에 변화의 물결을 일으켰습니다. 언제나 '유행'을 이어가던 마케팅계는 AIGC 기술을 가장 먼저 받아들였습니다. 관련 데이터에 따르면 2023년에는 우리나라 광고주 중 거의 절반이 AIGC 기술을 온라인 마케팅 활동에 적용할 것이며 이러한 애플리케이션 중 90% 이상이 콘텐츠 제작 및 창의적 개발에 중점을 둘 것입니다. 이 새로운 기술 중심의 광고 및 마케팅 모델은 점차적으로 구체화되어 광고주가 비용을 절감하고 효율성을 높일 수 있는 더 많은 가능성을 제공하고 있습니다. 그러나 AIGC 기술이 마케팅 분야에서 널리 활용되고 있는 반면, 많은 과제도 안고 있습니다. 예를 들어 AIGC 기술은 마케팅 자료 생성 시 콘텐츠 리스크를 초래할 수 있고, 막대한 투자를 가한 마케팅 활동이 실수로 불법 제품의 웨딩드레스 역할을 할 수도 있다. 그래서,
- 일체 포함 874 2024-07-18 01:41:21
-
- ICML 2024 | 그라데이션 체크포인트가 너무 느립니까? LowMemoryBP는 속도를 늦추거나 비디오 메모리를 절약하지 않고도 역전파 비디오 메모리 효율성을 크게 향상시킵니다.
- AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 이 기사의 첫 번째 저자는 Nankai 대학 통계 및 데이터 과학부 석사 2년차 Yang Yuchen이며 그의 지도교수는 Xu Jun입니다. 난카이 대학교 통계 및 데이터 과학부. Xu Jun 교수 팀의 연구 초점은 컴퓨터 비전, 생성 AI 및 효율적인 기계 학습이며, 그들은 최고의 연구를 진행하고 있습니다.
- 일체 포함 775 2024-07-18 01:39:51