- 방향:
- 모두 웹3.0 백엔드 개발 웹 프론트엔드 데이터 베이스 운영 및 유지보수 개발 도구 PHP 프레임워크 일일 프로그램 위챗 애플릿 일반적인 문제 다른 기술 CMS 튜토리얼 Java 시스템 튜토리얼 컴퓨터 튜토리얼 하드웨어 튜토리얼 모바일 튜토리얼 소프트웨어 튜토리얼 모바일 게임 튜토리얼
- 나누다:
-
- 비디오 모델에 빠르고 느린 눈을 추가하면 훈련이 필요 없는 Apple의 새로운 방법이 모든 SOTA를 몇 초 만에 능가합니다.
- 소라 출시 이후 AI 영상 생성 분야는 더욱 '바빠졌다'. 지난 몇 달 동안 우리는 Jimeng, RunwayGen-3, LumaAI 및 Kuaishou Keling이 차례로 폭발하는 것을 목격했습니다. AI가 모델을 생성했다는 것을 한눈에 알 수 있었던 과거와 달리 이번 대규모 영상 모델 배치는 우리가 본 것 중 '최고'일지도 모른다. 그러나 비디오 LLM(대형 언어 모델)의 놀라운 성능 뒤에는 매우 높은 비용이 필요한 거대하고 세밀하게 주석이 달린 비디오 데이터 세트가 있습니다. 최근 연구 분야에서는 추가 훈련이 필요하지 않은 혁신적인 방법이 많이 등장했습니다. 훈련된 이미지 대형 언어 모델을 사용하여 비디오 작업을 직접 처리함으로써 "비용이 많이 드는" 훈련 과정을 우회하는 것입니다. 또한 대부분의 기존 비디오 LLM은
- 일체 포함 601 2024-08-11 16:02:31
-
- 하이브리드 전문가는 더욱 적극적이며 다양한 양상을 인식하고 상황에 따라 행동할 수 있습니다. Meta는 양상 인식 전문가 하이브리드를 제안합니다.
- 혼합 전문가는 또한 자신의 직업에 전문화되어 있습니다. 현재 혼합 양식 기본 모델의 경우 일반적인 아키텍처 설계는 특정 양식의 인코더 또는 디코더를 융합하는 것입니다. 그러나 이 방법에는 여러 양식의 정보를 통합할 수 없으며 여러 양식이 포함된 콘텐츠를 출력하기가 어렵습니다. 이러한 한계를 극복하기 위해 MetaFAIR의 Chameleon 팀은 최근 논문 "Chameleon: Mixed-modalearly-fusionfoundationmodels"에서 다음 토큰의 예측 대상을 기반으로 이산 이미지와 텍스트를 변환할 수 있는 새로운 단일 Transformer 아키텍처를 제안했습니다. 토큰으로 구성된 시퀀스가 모델링되므로 다양한 모드에서
- 일체 포함 488 2024-08-11 13:02:22
-
- 오픈 소스와 비공개 소스 모델 '카오스(Chaos)': 인간의 진짜 의도를 가장 잘 엿볼 수 있는 에이전트가 누구인지 알아보자
- AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 이 기사의 첫 번째 저자는 Tsinghua University 컴퓨터 과학과 학부생인 Qian Cheng과 He Bingxiang입니다. 둘 다 THUNLP의 멤버이다. Qian Cheng의 주요 연구 관심 분야는 도구 학습과 대규모 모델 기반 에이전트입니다. 그는 곧 UIUC에서 박사 과정을 밟을 예정입니다. He Bingxiang의 주요 연구 관심 분야는 대규모 모델 정렬과
- 일체 포함 1300 2024-08-11 13:02:02
-
- 첫 번째 인공지능 파티가 성공적으로 개최되었습니다.
- 1905년, 중국인이 직접 촬영한 최초의 영화 '정군산'이 베이징 펑타이 사진관에서 탄생해 중국 국내 영화가 없던 역사를 마감했습니다. 그로부터 100여 년이 지난 2023년 8월 28일, 인민일보 뉴미디어 빌딩 '원심' 홀에서 중국인 대학생들이 '차원적 합작'으로 노래 '신정군산'을 연주했습니다. 오페라 아카데미이자 디지털 인물인 무란(Mu Lan)이 참석한 청중으로부터 폭발적인 박수를 불러일으켰습니다. 고대 경극 예술, 반복적인 빛과 그림자 기술, 새로운 디지털 기술은 고전에 경의를 표하는 동시에 시대를 뛰어넘어 새로운 매력을 선보입니다. 이는 인민일보 온라인이 주최한 제1회 인공지능(AI) 갈라에서 선보인 주요 프로그램 중 하나이다. 기술, 지능, 미래가 가득한 일련의 문화 축제를 통해 파티는
- 일체 포함 595 2024-08-10 22:23:02
-
- 2024 세계인공지능컨퍼런스 TOP20 젊은 우수 논문 발표
- 2024년 3월 “2024 세계인공지능학회 청년 우수논문상” 참가논문 추천 공고문이 발표되었고, 대학, 과학연구기관을 대상으로 인공지능 분야 젊은 우수 논문 수집 활동이 시작되었습니다. , 그리고 전세계 기업. 투고 마감일 현재 국내외 유명 대학, 과학연구기관, 기업 등 국내외로부터 총 159편의 리뷰논문이 접수됐다. 사전 평가와 재평가를 거쳐 2024년 TOP20 우수 청소년 논문이 공개되었습니다. (논문분야 및 명칭 알파벳순) 2024년 세계인공지능컨퍼런스 청년우수논문상은 7월 세계인공지능컨퍼런스에서 발표될 예정이니 많은 관심 부탁드립니다!
- 일체 포함 1042 2024-08-10 16:06:11
-
- 포럼 미리보기 | '지식은 세상을 변화시킵니다 - 수직형 대형 모델은 지식 관리를 재정의합니다' 포럼이 곧 열립니다
- 소개: 대형 모델 기술은 지식 습득, 통합, 적용 및 혁신을 가속화하는 데 큰 잠재력을 갖고 있으며 교육, 금융, 정부 업무 등 다양한 산업에 혁신적인 영향을 미칠 수 있습니다. 현재 우리나라의 기업 시나리오에 수직형 대형 모델을 적용하는 것은 아직 탐색 단계에 있습니다. 많은 기업이 여전히 대형 모델에 대한 최상의 구현 계획을 찾고 있습니다. 그 중 기업 내부 지식 기반과의 긴밀한 통합이 가장 중요합니다. 수직형 대형 모델 구현을 위한 엔터프라이즈급 시나리오의 중요한 적용 방향입니다. 이를 위해 2024년 세계 인공 지능 회의 및 인공 지능 글로벌 거버넌스에 관한 고위급 회의에서 Daguan Data는 Fudan-Daguan Financial Vertical Application 대형 모델 학교-기업 공동 연구 센터 및 Pudong Youth Federation과 손을 잡고 공동으로 주최할 예정입니다. "지식은 "지식 관리를 재정의하는 모델"이라는 주제로 세계 수직적 빅 포럼을 변화시킵니다. 포럼은 2024년 7월 개최 예정
- 일체 포함 1018 2024-08-10 11:20:06
-
- 최고의 국제 데이터베이스 컨퍼런스인 ICDE에 선정되어 Tencent Cloud 데이터베이스 기술 혁신이 권위를 인정받았습니다.
- Tencent Cloud Database에 관한 두 편의 논문이 최고의 국제 데이터베이스 컨퍼런스인 ICDE에 선정되었다는 소식을 오늘 들었습니다. 분산 트랜잭션 프로토콜인 Lion과 메모리 디스크 스패닝 인덱스 설계 프레임워크는 데이터베이스 분야의 일반적인 문제를 해결했으며 기술 혁신은 국제 당국으로부터 인정을 받았습니다. Tencent Cloud 데이터베이스 팀은 3대 데이터베이스 컨퍼런스인 ICDE에서 기술을 공유했습니다. ICDE(IEEE International Conference on Data Engineering)는 SIGMOD 및 VLDB와 함께 데이터베이스 연구 분야의 국제 컨퍼런스입니다. 최고의 데이터베이스 컨퍼런스. 분산 데이터베이스 트랜잭션 처리 분산 트랜잭션 처리에는 여러 차례의 노드 간 통신이 포함되며 속도가 느립니다. 과거 이주
- 일체 포함 731 2024-08-10 07:10:06
-
- AI는 학업에 도움을 주지만 도와주지는 않습니다(ChatGPT, NotebookLM)
- 저는 AI 도구에 대해 엇갈린 감정을 가진 이성애자 대학원생입니다. 많은 사람들이 학업 환경에서 자신의 노력을 대체하기 위해 AI를 사용합니다. 그러나 AI를 사용하여 학습을 지원하고, 연구에 효율성을 추가하고, 연구를 개선할 수 있습니다. In-De 시작하기
- 일체 포함 838 2024-08-10 06:43:32
-
- Tongyi Qianwen 오픈 소스 Qwen2-Math, 가장 발전된 수학 관련 모델이 됨
- 8월 9일 뉴스에 따르면 Alibaba Tongyi 팀은 기본 모델과 1.5B, 7B, 72B의 세 가지 매개변수가 있는 명령 미세 조정 모델을 포함하는 차세대 수학적 모델 Qwen2-Math를 오픈소스로 공개했습니다. Qwen2-Math는 Tongyi Qianwen 오픈 소스 대규모 언어 모델 Qwen2를 기반으로 개발되었습니다. 플래그십 모델 Qwen2-Math-72B-Instruct는 GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro 및 Llama보다 높은 점수를 받았습니다. 권위 있는 평가 세트 MATH.-3.1-405B 등은 대수학, 기하학, 계산 및 확률, 수론 등 다양한 수학 문제를 84%의 정확도로 처리하여 가장 발전된 수학 전용 모델이 됩니다. 참고: MATH 벤치마크 평가에서
- 일체 포함 938 2024-08-09 19:44:14
-
- Google I/O 개발자 컨퍼런스 차이나 스테이션: 대형 모델 기술이 전체 생태계에 진입
- 수요일, 구글은 베이징에서 중국 개발자 컨퍼런스를 개최했습니다. 지난 5월 캘리포니아주 마운틴뷰에서 열린 I/O 컨퍼런스에 이어 올해 I/OConnect 글로벌 투어는 독일 베를린을 시작으로 인도 방갈로르를 거쳐 중국 베이징에도 도착했다. 이번 행사에서는 다양한 분야의 전문가들이 국내 개발자들을 대상으로 AI, 웹, 모바일, 클라우드 기술 등 분야에서 구글의 최신 기술 진보와 개발 툴, 글로벌 서비스 플랫폼을 심도 있게 공유했다. Google Greater China의 사장인 Chen Junting은 개회 연설에서 "중국은 세계에서 가장 큰 개발자 시장 중 하나이며 우리 개발자들은 항상 글로벌 무대에서 없어서는 안 될 선구자 역할을 해왔습니다"라고 말했습니다. "지난해 중국의 25개 개발팀이 전 세계 다양한 지역에서 총 31개의 게임과 애플리케이션을 제작했습니다.
- 일체 포함 673 2024-08-09 19:42:02
-
- 2.5일 안에 1년 MD 계산을 완료하시겠습니까? 유클리드 변환기(Euclidean Transformer)를 기반으로 한 DeepMind 팀의 새로운 계산 방법
- Editor | Radish Skin 최근 몇 년 동안 ab initio 참조 계산을 기반으로 하는 MLFF(기계 학습 역장) 개발이 큰 진전을 이루었습니다. 낮은 테스트 오류가 달성되었음에도 불구하고 분자 역학(MD) 시뮬레이션에서 MLFF의 신뢰성은 더 긴 시뮬레이션 시간 규모에 따른 불안정성에 대한 우려로 인해 점점 더 면밀히 조사되고 있습니다. 연구에 따르면 누적 부정확성에 대한 견고성과 MLFF의 등변 표현 사용 사이의 잠재적인 연관성이 밝혀졌지만 이러한 표현과 관련된 계산 비용으로 인해 실제로 이러한 이점이 제한될 수 있습니다. 이 문제를 해결하기 위해 Google DeepMind와 베를린 공과대학교(TUBerlin)의 연구원들은 SO3krates라는 변환기 프레임워크를 제안했습니다.
- 일체 포함 773 2024-08-09 19:40:30
-
- Karpathy의 견해는 논란의 여지가 있습니다. RLHF는 실제 강화 학습이 아니며 Google과 Meta는 이에 반대합니다.
- RLHF와 RL을 같은 범주로 분류할 수 있는지에 대해서는 여전히 모든 사람이 다른 의견을 갖고 있는 것 같습니다. AI 전문가 Karpathy가 인공지능의 개념을 대중화하기 위해 다시 왔습니다. 어제 그는 "인간 피드백을 기반으로 한 강화 학습(RLHF)은 단지 강화 학습(RL)일 뿐입니다." Karpathy의 전체 텍스트는 다음과 같이 설명됩니다. RLHF는 대규모 언어 모델(LLM)을 훈련하는 세 번째(또한 세 번째) 방법입니다. ) 마지막) 메인 단계인 처음 두 단계는 사전 훈련과 감독 미세 조정(SFT)입니다. 내 생각에 RLHF는 거의 RL로 간주되지 않으며 널리 인식되지도 않습니다. RL은 강력하지만 RLHF는 그렇지 않습니다. 실제 RL을 사용하여 훈련한 AlphaGo의 예를 살펴보겠습니다. 컴퓨터 게임
- 일체 포함 1080 2024-08-09 16:40:09
-
- 두 개의 논문이 동시에 Best Paper Honorable Mention 후보로 지명되었습니다. SIGGRAPH의 최초 실시간 라이브 중국 팀은 생성 AI를 사용하여 3D 세계를 만듭니다.
- 컴퓨터 그래픽을 중심으로 한 세계 최고의 학술대회인 SIGGRAPH가 새로운 흐름을 타고 떠오르고 있습니다. 지난 주 개최된 SIGGRAPH2024 컨퍼런스에서 최우수 논문 및 기타 수상작 중 상하이 과학기술대학교 MARS 연구소 팀이 최우수 논문에 대한 명예 후보 2개를 동시에 수상하는 등 연구 결과도 빠르게 움직이고 있습니다. 산업화를 향해. 저자는 생성 모델 방법을 사용하여 상상력을 복잡한 3D 모델로 직접 변환하는 새로운 방법을 제시합니다. 최우수 논문으로 지명된 두 논문인 CLAY와 DressCode는 각각 3D 생성과 3D 의류 생성에 관한 것입니다. SIGGAPH의 Real-TimeLive 세션에서 상하이 과학 기술 대학 팀은 이 두 작품을 기반으로 한 실시간 결과를 시연했습니다.
- 일체 포함 1080 2024-08-09 16:03:49
-
- 딥마인드 로봇이 탁구를 치는데 포핸드와 백핸드가 공중으로 미끄러져 인간 초보자를 완전히 제압했다.
- 하지만 공원에 있는 노인을 이길 수는 없을까요? 파리올림픽이 본격화되면서 탁구가 많은 주목을 받고 있다. 동시에 로봇은 탁구 경기에서도 새로운 돌파구를 마련했습니다. 방금 DeepMind는 탁구 경기에서 인간 아마추어 선수 수준에 도달할 수 있는 최초의 학습 로봇 에이전트를 제안했습니다. 논문 주소: https://arxiv.org/pdf/2408.03906 DeepMind 로봇은 탁구를 얼마나 잘 치나요? 아마도 인간 아마추어 선수들과 동등할 것입니다: 포핸드와 백핸드 모두: 상대는 다양한 플레이 스타일을 사용하고 로봇도 견딜 수 있습니다: 다양한 스핀으로 서브를 받습니다. 그러나 게임의 강도는 그만큼 강렬하지 않은 것 같습니다. 공원에 있는 노인. 로봇용, 탁구용
- 일체 포함 1450 2024-08-09 16:01:32
-
- 추측 샘플링이 대규모 언어 모델의 추론 정확도를 잃을까요?
- 추측 샘플링의 프로토타입 개념은 2018년 MitchellStern et al.에 의해 제안되었습니다. 이 접근 방식은 이후 LookaheadDecoding, REST, Medusa 및 EAGLE을 포함한 다양한 작업에 의해 더욱 개발되고 개선되었습니다. 여기서 추측 샘플링은 대규모 언어 모델(LLM)의 추론 프로세스 속도를 크게 향상시킵니다. 중요한 질문은 LLM의 추측 샘플링이 원래 모델의 정확성에 해를 끼치는가입니다. 대답부터 시작하겠습니다. 아니요. 표준 추측 샘플링 알고리즘은 무손실이며, 이 기사에서는 수학적 분석과 실험을 통해 이를 증명할 것입니다. 수학적으로, 추측적 샘플링 공식은 다음과 같이 정의될 수 있습니다. 여기서: ?는 균일 분포에서 샘플링된 실수입니다. 예측할 다음 토큰입니다. ?(?)는 초안 모델에 의해 제공됩니다.
- 일체 포함 1273 2024-08-09 13:09:05