- 방향:
- 모두 웹3.0 백엔드 개발 웹 프론트엔드 데이터 베이스 운영 및 유지보수 개발 도구 PHP 프레임워크 일일 프로그램 위챗 애플릿 일반적인 문제 다른 기술 CMS 튜토리얼 Java 시스템 튜토리얼 컴퓨터 튜토리얼 하드웨어 튜토리얼 모바일 튜토리얼 소프트웨어 튜토리얼 모바일 게임 튜토리얼
- 나누다:
-
- 어떤 인간 선호도 최적화 알고리즘이 더 낫습니까? DPO, IPO 및 KTO를 이해하려면 마스터를 따르십시오.
- 모델 생성 콘텐츠의 상대적 품질에 대한 인간 레이블을 수집하고 인간 피드백(RLHF)의 강화 학습을 통해 이러한 기본 설정에 맞게 감독되지 않는 대규모 언어 모델을 미세 조정하는 접근 방식이 대화형 AI의 개발을 크게 발전시켰습니다. 그러나 RLHF는 복잡하고 종종 불안정한 프로세스이기 때문에 인간의 선호도를 모델 결과와 일치시키기 위해 최적화 기능을 직접 사용하는 연구가 요즘 뜨거운 이슈가 되고 있습니다. 이 기사는 현재 널리 사용되는 세 가지 인간 선호도 최적화 알고리즘의 성능을 비교하는 Huggingface의 블로그입니다. 저자는 다양한 모델과 다양한 하이퍼파라미터를 사용하여 강화 학습(또는 선호도 조정) 없이 언어 모델을 조정하는 세 가지 가능한 방법을 평가하기 위해 광범위한 실험을 수행했습니다. 이것
- 일체 포함 727 2024-08-05 21:19:22
-
- Xiaohongshu의 11주년 기념 편지는 대기업의 질병을 인정합니다: 대규모 관료주의, 의사 결정 지연, 다시 시작해야 할 필요성
- 8월 2일 이 사이트의 소식. Sanyan Technology에 따르면 Xiaohongshu의 11주년을 맞아 회사 창립자인 Mao Wenchao(이름: Xingya)와 Qu Fang(이름: Mulan)이 11주년 기념 편지에서 고백한 바 있습니다. 회사의 소위 '대기업병'도 소홍서에 나타났다. 편지에는 지난해 샤오홍슈 사람들이 실시한 두 차례의 조직 조사에서 동급생들의 일일 피드백을 통해 창업의 원래 의도에서 벗어나 조직 소비만 증가시키는 나쁜 사례를 발견했다고 언급되어 있습니다. "예를 들어, 어떤 학생들은 매우 강력한 공식적 지위를 가지고 있고 스스로 관여하지 않습니다. 어려움에 직면하면 일선 학생들에게 일을 하도록 강요하고 문제를 해결합니다. 어떤 리더들은 매일 상위 수준의 의도를 분석하는 데 시간을 보냅니다. 한 마디 한 마디, 사용자 경험에 영향을 미친 문제에 대해서는 언급하지 마세요." "아직도 책임을 지지 않는 사람들이 있어요.
- IT산업 1045 2024-08-05 21:06:32
-
- '두 세계의 최고', 분자를 처음부터 설계, 화학 언어 모델링을 위한 딥 러닝 아키텍처 S4
- 편집자 | KX 생성적 딥 러닝은 약물 설계를 재편하고 있습니다. 분자를 일련의 분자로 생성하는 CLM(화학 언어 모델)은 이 프로세스에서 특히 중요합니다. 최근 네덜란드 Eindhoven University of Technology의 연구원들은 새로운 약물 설계에 최신 딥 러닝 아키텍처(S4)를 도입했습니다. S4(Structured State Space Sequence) 모델은 시퀀스의 전역 속성을 학습하는 데 탁월한 성능을 발휘합니다. 그렇다면 S4가 처음부터 설계된 화학 언어 모델링을 발전시킬 수 있을까요? 이 질문에 답하기 위해 연구자들은 다양한 약물 발견 작업에서 S4를 최신 CL과 체계적으로 비교했습니다.
- 일체 포함 923 2024-08-05 20:58:22
-
- 대형 모델의 압축 및 양자화 방식을 선택하는 방법은 무엇입니까? Wuwen Core Dome의 Qllm-Eval 정량화 방식에 대한 종합 평가: 다중 모델, 다중 매개변수, 다차원
- Transformer 아키텍처를 기반으로 한 대규모 언어 모델은 다양한 벤치마크 테스트에서 우수한 성능을 보여주었지만, 수백억, 수천억, 심지어는 수조 단위의 매개변수 규모로 인해 높은 서비스 비용이 발생하게 됩니다. 예를 들어 GPT-3는 1,750억 개의 매개변수를 갖고 FP16 스토리지를 사용하며 모델 크기는 약 350GB인 반면, Nvidia의 최신 B200 GPU도 다른 GPU 및 엣지 장치는 말할 것도 없이 메모리가 192GB에 불과합니다. 대형 모델 압축은 대형 모델을 "축소"하고 이를 리소스가 제한된 시나리오에 삽입하여 모델 저장, 메모리 액세스 및 컴퓨팅 오버헤드를 줄이는 것을 의미합니다. IoT 엣지 디바이스, 임베디드 로봇, 오프라인 모바일 애플리케이션 등에서 대형 모델을 사용할 수 있도록 모델 성능을 최대한 잃지 않으면서 대형 모델의 추론 처리량을 향상시킵니다.
- 일체 포함 604 2024-08-05 20:56:12
-
- 대규모 모델을 미세 조정하려면 인간 데이터에 의존해야 합니까? DeepMind: 피드백을 통한 자가 훈련이 더 좋습니다
- 인간이 생성한 데이터에 주로 의존하는 대규모 모델을 미세 조정하는 현재의 일반적인 관행에 직면하여 Google DeepMind는 이러한 의존성을 줄이기 위한 보다 효율적인 방법을 모색했습니다. 여러분과 제가 볼 수 있듯이, LLM(대형 언어 모델)은 딥 러닝 환경을 변화시키고 있으며 인간 수준의 텍스트를 생성하고 다양한 언어 작업을 해결하는 데 탁월한 기능을 보여줍니다. 업계에서는 인간이 수집한 데이터를 정밀 조정 감독하여 특정 작업에 대한 성과를 더욱 향상시켰지만, 고품질의 인간 데이터를 얻는 데에는 심각한 병목 현상이 발생합니다. 이는 복잡한 문제를 해결하고 상당한 자원과 전문 지식이 필요한 작업의 경우 특히 그렇습니다. 어떻게 해결하나요? 모델을 통해 생성된 합성 데이터는 데이터 품질이 유지되는 한 확장 가능하고 비용 효율적일 수 있는 잠재적인 대안입니다.
- 일체 포함 890 2024-08-05 20:48:40
-
- 새로운 품질과 컴퓨팅 성능의 공명 통합: Bose Quantum, 차세대 550 계산 큐비트 코히어런트 광학 양자 컴퓨터 출시
- 2024년 4월 18일, 베이징 Bose Quantum Technology Co., Ltd.(이하 "Bose Quantum")는 "새로운 품질과 공명의 통합"이라는 주제로 베이징 왕징에서 2024년 신제품 출시 컨퍼런스를 성공적으로 개최했습니다. 파운드는 550개의 계산 큐비트를 갖춘 차세대 응집성 광 양자 컴퓨터인 "Tiangong Quantum Brain 550W"와 양자 컴퓨팅과 AI의 통합을 완벽하게 보여주고 기술의 출발점이 되는 Kaiwu SDK 등 핵심 연구 결과를 발표했습니다. 실용적인 양자 컴퓨팅. 2024년에 양자 기술은 미래 산업 발전과 새로운 생산력의 중요한 부분이 될 것이며 베이징의 미래 산업 배치는 분명히 제안될 것입니다.
- 일체 포함 994 2024-08-05 20:43:00
-
- Apple은 대형 모델이 게으른 방법을 학습할 수 있도록 지원합니다. 첫 번째 토큰을 더 빠르게 생성하고 정확성을 유지합니다.
- 게으르면 일을 더 잘하게 됩니다. Llama 3.1이 방금 출시되었습니다. 아직 사용해 보셨나요? 개인용 컴퓨터가 최신 최고 구성이더라도 가장 작은 8B 버전을 실행하면 여전히 상당한 지연이 발생할 수 있습니다. 모델의 추론 효율성을 향상시키기 위해 연구자들은 다양한 방법을 고안해 냈지만 그 중 다수는 모델의 정확도를 어느 정도 희생하게 만들었습니다. 최근 Apple과 MetaAI 연구팀은 Llama2 사전 채우기 단계의 추론 속도를 2배 이상 높이면서 정확도가 크게 떨어지지 않는 새로운 방법을 제안했습니다. 이를 통해 Llama3.1 가속이 일부 향상될 수 있습니다. 영감. 그들은 이 접근 방식을 Lazy LLM(Lazy Large Language Model)이라고 부릅니다. 논문 제목: LazyL
- 일체 포함 563 2024-08-05 20:41:02
-
- 기술 어젯밤과 오늘 아침 0805: 세계 최초의 18650 칼륨 배터리가 출시되었습니다. Lalamove 드라이버는 시체 운송을 거부하여 불만을 토로했습니다. Avita 11/12 확장 버전은 9월에 출시됩니다.
- "기술 어젯밤과 오늘 아침" 시간, 안녕하세요 여러분, 2024년 8월 5일 월요일입니다. 오늘의 중요한 과학 기술 정보는 리튬 배터리를 대체할 수 있는 세계 최초의 18650 칼륨 이온 배터리가 출시되었다는 것입니다. Group1 회사는 발표했습니다. 세계 최초의 18650 칼륨 이온 배터리 출시. 18650 원통형 케이스 칼륨 이온 배터리는 기존 리튬 이온 배터리에 대한 지속 가능하고 비용 효율적인 대안을 제공할 것을 약속하는 획기적인 제품입니다. >>세부사항 보기 태국 총리는 Pinduoduo의 자회사 Temu에 대해 법을 준수하고 필요한 세금을 납부하는지에 대한 조사를 명령했습니다. Thaibsworld에 따르면 태국 총리 Srettha Thavisin은 디지털 경제 사회부에 명령을 내렸습니다. , 세무국, 경찰, 핀둬둬 전자상거래 업체 조사
- IT산업 1107 2024-08-05 20:38:50
-
- 네이처 서브저널, 10배 빠른 트랜스포머 기반 역단백질 서열 설계 방법
- Editor | Radish Skin 단백질 설계 및 엔지니어링은 딥 러닝의 발전 덕분에 전례 없는 속도로 발전하고 있습니다. 그러나 현재 모델은 설계 과정에서 비단백질 개체를 자연스럽게 설명할 수 없습니다. 여기서 스위스 EPFL(Ecole Polytechnique Fédérale de Lausanne)의 연구원들은 서로 다른 분자 서열에 의해 부과된 제약을 받는 백본 스캐폴드를 기반으로 단백질을 예측할 수 있는 원자 좌표 및 요소 이름의 기하학적 변환기를 기반으로 하는 딥 러닝 방법을 제안합니다. 이 방법을 사용하여 연구자들은 열 안정성이 높고 촉매 활성이 높은 효소를 높은 성공률로 생산할 수 있습니다. 이는 원하는 기능을 달성하기 위해 단백질 설계 파이프라인의 다양성을 높일 것으로 예상됩니다. 본 연구에서는 "Context-awaregeometricde"를 사용합니다.
- 일체 포함 934 2024-08-05 20:33:31
-
- Jeff Pu는 Apple의 첫 번째 폴더블 기기 대량 생산이 방해를 받고 있으며 2025년이나 2026년에는 달성하기 어려울 것이라고 말했습니다.
- 8월 3일 뉴스에 따르면, MacRumors는 최근 Haitong International Securities의 애널리스트 Jeff Pu가 투자자들에게 발표한 새로운 보고서를 입수했습니다. 이 보고서는 Apple의 첫 번째 폴더블 기기의 대량 생산 계획이 '지연'에 직면해 생산이 불가능할 수도 있다고 지적했습니다. 예상대로 2025년에 출시될 예정이다. 양산은 2026년이나 2026년에 달성될 예정이다. 이전에 Jeff Pu는 5월 보고서에서 Apple의 첫 번째 폴더블 장치가 2025년과 2026년에 대량 생산에 들어갈 것이라고 예측했습니다. 그는 당시 애플이 먼저 대화면 폴더블 아이패드나 맥북을 출시한 뒤 시장 잠재력이 더 큰 폴더블 아이폰을 출시할 수도 있다고 전망하기도 했다. 이러한 일련의 예측은 시장과 소비자로부터 광범위한 관심을 끌었습니다. 그러나 편집자의 이해에 따르면 최신 보고서는 다음과 같은 결과를 가져왔습니다.
- IT산업 387 2024-08-05 20:32:02
-
- Transformer의 저자는 Google로 돌아오고 사람들이 회사를 원하지 않는 한 Character.AI의 창립 팀은 '인수'됩니다.
- AI 스타트업은 결국 대기업으로 갈 것인가? 정신을 차려보니 생성AI '닭먹기대회'가 다시 위축되고 있었다. 스타트업 Character.AI는 Google과 Character.AI의 LLM(대형 언어 모델) 기술에 대한 비독점 라이선스 획득 계약을 체결했다고 금요일 발표했습니다. Google은 또한 Noam Shazeer와 Daniel DeFreitas의 재고용을 발표했습니다. 그중 NoamShazeer는 Character.AI의 창립자이자 CEO이며 Transformer 논문의 저자 중 한 명입니다. 그는 한때 Google의 수석 소프트웨어 엔지니어로 근무했습니다. Daniel DeFreitas는 Character.AI의 사장이자 Google의 수석 엔지니어로 근무했습니다.
- 일체 포함 820 2024-08-05 20:17:10
-
- 고화질 영상은 여러 장의 사진에 렌더링된 3D 장면으로 인해 진위 여부를 구별하기 어렵습니다.
- 위의 애니메이션은 여러 사진에서 렌더링된 완전히 3D 장면이라는 점에 유의하세요. 인간이 자신의 결점을 발견하는 것은 어렵습니다. 그럼 이 시나리오가 어떻게 구현되는지 살펴보겠습니다. 그리드와 포인트는 명시적이고 빠른 GPU/CUDA 기반 래스터화에 적합하기 때문에 3D 장면의 가장 일반적인 표현입니다. 이와 대조적으로, 최첨단 NeRF(Neural Radiation Field) 방법은 연속적인 장면 표현을 기반으로 구축되었으며, 종종 체적 광선 렌더링에 최적화된 다층 퍼셉트론(MLP)을 사용하여 캡처된 장면에 대한 새로운 관점을 합성합니다. 이러한 방법의 연속성은 최적화에 도움이 되지만 렌더링에 필요한 무작위 샘플링은 비용이 많이 들고 잡음이 많습니다. 프랑스 리비에라 대학 연구진은 두 가지 방법을 결합한 새로운 방법을 도입했다.
- 일체 포함 574 2024-08-05 20:15:51
-
- 차세대 RAG에서는 지연된 상호작용 모델이 표준인 이유는 무엇입니까?
- AIxiv 칼럼은 본 사이트에서 학술 및 기술 콘텐츠를 게재하는 칼럼입니다. 지난 몇 년 동안 이 사이트의 AIxiv 칼럼에는 전 세계 주요 대학 및 기업의 최고 연구실을 대상으로 한 2,000개 이상의 보고서가 접수되어 학술 교류 및 보급을 효과적으로 촉진하고 있습니다. 공유하고 싶은 훌륭한 작품이 있다면 자유롭게 기여하거나 보고를 위해 연락주시기 바랍니다. 제출 이메일: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Zhang Yingfeng: Infra의 공동 창립자로서 검색, AI 및 인프라 인프라 개발 분야에서 다년간의 경험을 갖고 있으며 현재 차세대 인프라 구축을 위해 노력하고 있습니다. RAG 핵심 제품. RAG 시스템 개발에 있어서 좋은 Reranker 모델은 없어서는 안 될 연결고리입니다.
- 일체 포함 1115 2024-08-05 20:15:22
-
- ECCV2024 | Harvard 팀, 도메인 간 의료 이미지 분할 및 분류의 공정성을 달성하기 위해 FairDomain 개발
- 편집자 | ScienceAI 작성자 | YuTian 팀 인공지능(AI), 특히 의료 AI 분야에서는 공정한 의료 결과를 보장하기 위해 공정성 문제를 해결하는 것이 중요합니다. 최근에는 공정성을 강화하려는 노력으로 새로운 방법과 데이터 세트가 도입되었습니다. 그러나 진료소에서 환자 진단을 위해 다양한 영상 기술(예: 다양한 망막 영상 방식)에 의존하는 경우가 많음에도 불구하고 영역 이전의 맥락에서 공정성 문제는 거의 조사되지 않았습니다. 본 논문에서는 도메인 이전에 따른 알고리즘 공정성에 대한 최초의 체계적인 연구인 FairDomain을 제안합니다. 편견이 서로 다른 영역 간에 어떻게 전달되는지.
- 일체 포함 1193 2024-08-05 20:04:36
-
- 이제부터 GitHub의 1억 명 이상의 개발자가 세계 최고의 대형 모델에 직접 액세스하여 AI 애플리케이션을 구축할 수 있습니다.
- GitHub가 출시한 새로운 기능인 "GitHubModels"는 AI 엔지니어 시대의 도래를 가속화할 것으로 예상됩니다. 무엇? 친숙한 코드 호스팅 플랫폼 GitHub가 다시 진화했습니다! 플랫폼은 플레이그로이드에도 대규모 AI 모델을 제공하기 시작했다. Microsoft의 Phi-3, OpenAI의 GPT-4o, Meta의 Llama3.1, Cohere의 CommandR+, MistralAI의 MistralLarge 등 이름을 지정할 수 있는 업계에서 널리 사용되는 모든 대형 모델을 대화형 샌드박스에서 시험해 볼 수 있습니다. 앞으로 몇 달 안에 Github에는 더 많은 언어, 시각적 모델 및 기타 유형의 모델이 추가될 예정입니다. 즉, 이 사진의 모델은
- 일체 포함 1087 2024-08-05 19:36:38