


LLM은 역사가 될까요? 오픈 소스 bGPT는 딥 러닝 패러다임을 뒤집을 수 있습니다. 바이너리를 직접 시뮬레이션하여 아날로그 디지털 세계의 새로운 시대를 열 수 있습니다!
Microsoft Research Asia에서 출시한 최신 bGPT 성과인 이 바이트 기반 Transformer 모델은 디지털 세계를 탐험할 수 있는 새로운 문을 열어줍니다.
기존의 어휘 기반 언어 모델과 달리 bGPT는 특정 형식이나 작업에 제한을 받지 않고 원시 바이너리 데이터를 직접 처리할 수 있다는 점에서 독특합니다. 디지털 세계를 완전히 시뮬레이션하여 모델 개발의 새로운 가능성을 여는 것을 목표로 합니다.
종이: https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6
https://www.php .cn/link/359499f804ea7988921bf86c9377fb95 모델:
https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad프로젝트 홈페이지:
https://www.php.cn/link/71af5961 4c 8b42af334933e9261e53be 연구 논문에서 연구팀은 모델링에 대한 bGPT의 엄청난 잠재력을 보여주었습니다. bGPT는 바이트 수준 처리를 수행함으로써 텍스트, 이미지 및 오디오를 생성할 수 있을 뿐만 아니라 형식 변환 알고리즘 및 CPU 상태 모델링을 포함한 컴퓨터 동작을 시뮬레이션할 수도 있습니다. 모든 데이터를 바이트 시퀀스로 처리하는 이러한 접근 방식을 통해 bGPT는 다양한 유형의 데이터를 동일한 프레임워크에 통합할 수 있습니다.
공개된 bGPT의 논문은 X(Twitter)에서 광범위한 토론을 불러일으켰으며, 딥 러닝 모델의 잠재적인 변화를 강조하고 모델이 디지털 세계의 다양한 활동을 진정으로 이해하고 시뮬레이션할 수 있는 새로운 가능성을 열었습니다.
바이너리 데이터: 디지털 세계를 구성하는 기본 DNA
바이너리 데이터는 우리가 매일 사용하는 컴퓨터 프로세서와 전자 제품의 운영 체제를 통해 실행되며 모든 것의 핵심입니다. 데이터, 장치 및 소프트웨어. 따라서 이러한 기반을 바탕으로 이진 데이터 시퀀스를 연구하여 디지털 시스템의 내부 논리를 이해하고 이를 통해 다양하고 복잡한 디지털 현상을 재구성하고 시뮬레이션하는 것이 bGPT의 목표입니다.
bGPT는 바이트 수준 처리를 통해 기존 AI 생성 및 작업 이해에 적용될 수 있을 뿐만 아니라 더 많은 비전통적 애플리케이션도 처리할 수 있습니다. 예를 들어, 이전 연구에서는 MIDI의 바이너리 특성으로 인해 직접 모델링을 피했던 음악 전송 및 저장을 위한 표준 형식인 MIDI를 직접 시뮬레이션할 수 있습니다.
하지만 bGPT는 당연히 이러한 작업에 적합하며 음악 데이터의 변환 알고리즘을 정확하게 시뮬레이션할 수 있어 ABC 표기법을 MIDI 형식으로 변환할 때 매우 낮은 오류율(0.0011 BPB)을 달성합니다.
실제 응용 프로그램에서 bGPT는 일반적으로 ABC 기호와 MIDI 파일 간의 변환을 정확하게 완료할 수 있으며 때로는 원본 파일의 오류를 수정하여 음악 변환을 더 정확하게 만들 수도 있습니다.
bGPT는 자동으로 ABC 표기법을 MIDI 형식으로 변환합니다(위). 원래 MIDI 데이터(아래)와 비교하면 주요 차이점이 강조됩니다. 원래 MIDI 데이터는 없지만 한 비트(아래 그림 참조) )로 인해 코드 반주의 연결이 끊기는 현상이 발생하지만, bGPT로 변환된 결과(위 그림 참조)가 이 간격을 올바르게 채워 코드 반주의 부드러움을 보장합니다.
연구팀은 또한 CPU 모델링을 하드웨어 동작 시뮬레이션의 대표적인 작업으로 간주합니다. 이 작업을 수행하려면 모델이 일련의 하위 수준 기계 명령을 입력으로 받아야 하며, 목표는 CPU 상태가 어떻게 되는지 정확하게 예측하는 것입니다. 프로그램이 중지될 때까지 각 명령이 실행된 후 업데이트됩니다.
이 작업에서 bGPT는 99.99% 이상의 정확도를 보여주어 기본 바이너리 데이터 처리에서 바이트 모델의 성능과 확장성을 입증했습니다.
프로그램과 초기 CPU 상태를 고려하면 bGPT는 프로그램이 종료될 때까지 CPU 실행의 전체 프로세스를 정확하게 예측할 수 있습니다. 이 예에서 bGPT는 모든 CPU 명령을 정확하게 처리합니다. 이해를 돕기 위해 실제 바이트 시퀀스는 더 읽기 쉬운 형식으로 변환됩니다.
바이트에서 모든 것까지: 경계를 허물고 통합 데이터 모델링으로 이동
bGPT는 기본 바이너리 데이터를 처리할 수 있을 뿐만 아니라 여러 데이터 유형을 통합 모델 아키텍처로 통합하여 모든 데이터를 바이트 시퀀스로 처리할 수 있습니다.
이 접근 방식은 데이터 모델링 프로세스를 단순화할 뿐만 아니라 특정 데이터 유형에 맞게 모델을 사용자 정의할 필요 없이 모든 데이터 소스로부터의 통합을 쉽게 만듭니다.
연구팀은 논문에 전통적인 텍스트, 이미지, 오디오 파일의 예를 제시하여 통합 데이터 모델링에서 bGPT의 능력을 입증했습니다. 그들이 훈련한 bGPT 모델에는 약 1억 개의 매개변수가 있습니다.
실험 결과 GPT-2(텍스트 모델), ViT(비주얼 모델), AST(오디오 모델)와 같은 크기의 모델과 비교했을 때 bGPT는 다양한 데이터 유형에서 비슷한 성능을 보이는 것으로 나타났습니다.
bGPT는 텍스트 생성에서 매우 뛰어난 성능을 발휘합니다. 바이트 수준 텍스트 인코딩 덕분에 모델은 어휘에 의존하지 않으므로 모든 언어를 지원할 수 있습니다.
계층화된 Transformer 아키텍처는 계산 오버헤드가 GPT-2와 유사하지만 최대 8KB의 텍스트를 생성할 수 있으며 이는 GPT-2의 길이 제한을 크게 초과합니다. Wikipedia 데이터에 대한 사전 학습 후 bGPT에서 생성된 텍스트는 스타일과 테마 모두에서 GPT-2와 유사하여 텍스트 생성에 있어 강력한 능력을 입증했습니다.
bGPT는 Wikipedia 데이터 세트에서 사전 훈련되었으며 생성된 텍스트 샘플의 품질과 주제 일관성은 GPT-2와 비슷합니다.
bGPT는 이미지 바이트 시퀀스에서 다음 바이트를 예측하여 이미지를 생성할 수 있습니다. 모델은 ImageNet 데이터 세트에서 사전 훈련되었으며 생성된 이미지의 해상도는 32x32픽셀입니다.
현재 규모에서는 바이트 시퀀스를 통해 이미지의 2차원 공간 관계를 정확하게 캡처하기 어렵기 때문에 생성된 이미지에 아티팩트와 노이즈가 발생하지만 텍스처와 빛 및 그림자 효과는 일반적으로 비교적 정확합니다.
또한 생성된 이미지는 정상적으로 BMP 파일로 디코딩될 수 있습니다. 연구팀은 OpenAI가 개발한 iGPT의 픽셀 시퀀스 모델링 방식과 유사하게 bGPT의 규모를 확장하면 더 높은 품질과 더 사실적인 영상 생성이 가능할 수 있다고 지적했다.
이러한 이미지는 ImageNet 데이터 세트에서 사전 훈련된 bGPT로 생성된 이미지 세트입니다. 이미지의 질감과 조명 효과는 일반적으로 정확하지만 생성된 이미지에서 주요 개체를 식별하는 것은 어려울 수 있습니다.
bGPT는 오디오 데이터를 바이트 시퀀스로 처리하고 8000Hz의 샘플링 속도로 1초 길이의 오디오 샘플을 생성할 수 있습니다.
이 모델은 LibriSpeech 데이터 세트에서 사전 훈련되었으며 Speech Commands v2 데이터 세트에서 더욱 미세 조정 및 시연되었습니다. bGPT에서 생성된 오디오 샘플은 높은 정확도를 유지하며 일부 샘플은 실제 오디오와 거의 구별할 수 없습니다. 다음은 오디오 생성 분야에서 bGPT의 기능을 보여주는 일련의 예입니다.
bGPT를 사용하여 바이트의 디지털 세계를 탐험하세요
전통 언어 모델은 아무리 강력하더라도 주로 자연어 텍스트 처리에 중점을 둡니다. bGPT 모델은 바이트 기반 처리 메커니즘을 통해 텍스트 처리의 한계를 깨고 새로운 데이터 처리 범주를 열었습니다.
이러한 발전을 통해 bGPT는 텍스트, 이미지, 오디오는 물론 알고리즘과 하드웨어의 기본 바이너리 데이터까지 포함한 다양한 데이터 유형을 원활하게 처리할 수 있게 되어 디지털 세계에 대한 포괄적인 시뮬레이션과 이해를 위한 기반을 마련하게 되었습니다.
bGPT는 강력한 기능을 보여주었지만 현재는 기존 그래픽 카드에서 최대 8KB의 바이트 시퀀스만 처리할 수 있는 등 계산 오버헤드 측면에서 한계가 있습니다. 데이터, 적용 측면에서는 분명한 한계가 있습니다. 향후 작업 계획은 보다 효율적인 알고리즘을 개발하고 하드웨어의 발전을 활용하는 데 중점을 두고 더 큰 데이터 시퀀스를 처리하는 능력을 향상시키는 것을 목표로 합니다.
전 세계의 기술 애호가들은 네트워크 가지치기 및 자체 학습 최적화부터 초대형 네트워크의 자체 재구성 기능에 이르기까지 bGPT의 미래 잠재력을 기대하기 시작했습니다. 공통 비전: bGPT는 결국 모든 유형의 바이트 데이터를 처리하고 출력할 수 있는 통합 모델을 실현하여 진정한 디지털 세계의 포괄적인 시뮬레이터가 될 수 있습니다.
연구팀은 bGPT의 코드와 모델을 오픈 소스로 공개했습니다. 이는 모델 아키텍처를 조정하지 않고도 자신의 데이터 세트에서 bGPT를 직접 훈련할 수 있고 디지털 분야에서 바이트 모델의 광범위한 전망을 탐색할 수 있음을 의미합니다.
위 내용은 LLM은 역사가 될까요? 오픈 소스 bGPT는 딥 러닝 패러다임을 뒤집을 수 있습니다. 바이너리를 직접 시뮬레이션하여 아날로그 디지털 세계의 새로운 시대를 열 수 있습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











jojplay 시뮬레이터는 매우 사용하기 쉬운 휴대폰 시뮬레이터입니다. 컴퓨터 게임을 지원하고 휴대폰에서 실행할 수 있으며 호환성이 매우 좋습니다. 아래 편집기에서 소개하겠습니다. 사용 방법. joiplay 시뮬레이터 사용 방법 1. 먼저 Joiplay 본체와 RPGM 플러그인을 다운로드해야 합니다. 본체 - 플러그인 순서대로 설치하는 것이 가장 좋습니다. apk 패키지는 Joiplay 바에서 얻을 수 있습니다. >>>를 얻으려면 클릭하세요). 2. 안드로이드가 완성되면 왼쪽 하단에서 게임을 추가할 수 있습니다. 3. 이름을 아무렇게나 입력하고, 실행 파일에서 CHOOSE를 누르면 해당 게임의 game.exe 파일이 선택됩니다. 4. 아이콘을 비워두거나 좋아하는 사진을 선택할 수 있습니다.

기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 마커를 활성화하는 데 사용됩니다. DeepSeek67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다. DeepSeek은 일반 인공지능을 연구하는 회사입니다.

이달 초 MIT와 기타 기관의 연구자들은 MLP에 대한 매우 유망한 대안인 KAN을 제안했습니다. KAN은 정확성과 해석성 측면에서 MLP보다 뛰어납니다. 그리고 매우 적은 수의 매개변수로 더 많은 수의 매개변수를 사용하여 실행되는 MLP보다 성능이 뛰어날 수 있습니다. 예를 들어 저자는 KAN을 사용하여 더 작은 네트워크와 더 높은 수준의 자동화로 DeepMind의 결과를 재현했다고 밝혔습니다. 구체적으로 DeepMind의 MLP에는 약 300,000개의 매개변수가 있는 반면 KAN에는 약 200개의 매개변수만 있습니다. KAN은 MLP와 같이 강력한 수학적 기반을 가지고 있으며, KAN은 Kolmogorov-Arnold 표현 정리를 기반으로 합니다. 아래 그림과 같이 KAN은

Life Restart Simulator는 매우 흥미로운 시뮬레이션 게임입니다. 이 게임은 최근 매우 인기를 끌었습니다. 아래에서 편집자가 Life Restart Simulator에 대한 전체 가이드를 가져왔습니다. 전략이 있나요? Life Restart Simulator 가이드 가이드 Life Restart Simulator의 특징 이것은 플레이어가 자신의 아이디어에 따라 플레이할 수 있는 매우 창의적인 게임입니다. 매일 완료해야 할 작업이 많으며 이 가상 세계에서 새로운 삶을 누릴 수 있습니다. 게임에는 많은 노래가 있으며, 다양한 삶이 여러분의 경험을 기다리고 있습니다. Life Restart Simulator 게임 콘텐츠 재능 그리기 카드: 재능: 불멸자가 되려면 신비한 작은 상자를 선택해야 합니다. 도중에 죽는 것을 방지하기 위해 다양한 작은 캡슐을 사용할 수 있습니다. 크툴루는 선택할 수 있다

무엇? 주토피아는 국내 AI로 현실이 되는 걸까? 영상과 함께 노출된 것은 '켈링'이라는 국산 대형 영상세대 신형 모델이다. Sora는 유사한 기술 경로를 사용하고 자체 개발한 여러 기술 혁신을 결합하여 크고 합리적인 움직임뿐만 아니라 물리적 세계의 특성을 시뮬레이션하고 강력한 개념적 결합 능력과 상상력을 갖춘 비디오를 제작합니다. 데이터에 따르면 Keling은 최대 1080p의 해상도로 30fps에서 최대 2분의 초장 영상 생성을 지원하며 다양한 화면비를 지원합니다. 또 다른 중요한 점은 Keling이 실험실에서 공개한 데모나 비디오 결과 시연이 아니라 단편 비디오 분야의 선두주자인 Kuaishou가 출시한 제품 수준 애플리케이션이라는 점입니다. 더욱이 백지 작성이 아닌 실용성에 중점을 두고, 출시되자마자 온라인에 진출하는 데 중점을 두고 있다. 콰이잉에서는 커링의 대형 모델이 출시됐다.

최근 군계는 미군 전투기가 이제 AI를 활용해 완전 자동 공중전을 완수할 수 있다는 소식에 충격을 받았다. 네, 얼마 전 미군의 AI 전투기가 최초로 공개되면서 그 미스터리가 드러났습니다. 이 전투기의 정식 명칭은 VISTA(Variable Stability Flight Simulator Test Aircraft)로 미 공군 장관이 직접 조종해 일대일 공중전을 모의 실험한 것이다. 5월 2일, 미 공군 장관 프랭크 켄달(Frank Kendall)이 X-62AVISTA를 타고 에드워드 공군 기지에서 이륙했습니다. 1시간의 비행 동안 모든 비행 작업은 AI에 의해 자동으로 완료되었습니다. Kendall은 "지난 수십 년 동안 우리는 자율 공대공 전투의 무한한 잠재력에 대해 생각해 왔지만 항상 도달할 수 없는 것처럼 보였습니다."라고 말했습니다. 그러나 지금은,

jojplay 시뮬레이터는 실제로 게임 글꼴을 사용자 정의할 수 있으며 텍스트에서 누락된 문자 및 상자 문자 문제를 해결할 수 있습니다. 아마도 많은 플레이어가 이를 작동하는 방법을 모르는 것 같습니다. jojplay 시뮬레이터의 글꼴을 소개합니다. joiplay 시뮬레이터 글꼴 설정 방법 1. 먼저 joiplay 시뮬레이터를 열고 오른쪽 상단에 있는 설정(점 3개)을 클릭하여 찾습니다. 2. RPGMSettings 열의 세 번째 행에서 CustomFont 사용자 정의 글꼴을 클릭하여 선택합니다. 3. 글꼴 파일을 선택하고 확인을 클릭합니다. 오른쪽 하단에 있는 "저장" 아이콘을 클릭하지 않도록 주의하세요. 그렇지 않으면 기본 설정이 복원됩니다. 4. 설립자 및 준원 간체 한자를 권장합니다(이미 Fuxing 및 Rebirth 게임 폴더에 있음). 조이

테슬라의 로봇 옵티머스(Optimus)의 최신 영상이 공개됐는데, 이미 공장에서 작동이 가능한 상태다. 정상 속도에서는 배터리(테슬라의 4680 배터리)를 다음과 같이 분류합니다. 공식은 또한 20배 속도로 보이는 모습을 공개했습니다. 작은 "워크스테이션"에서 따고 따고 따고 : 이번에 출시됩니다. 영상에는 옵티머스가 공장에서 이 작업을 전 과정에 걸쳐 사람의 개입 없이 완전히 자율적으로 완료하는 모습이 담겨 있습니다. 그리고 Optimus의 관점에서 보면 자동 오류 수정에 중점을 두고 구부러진 배터리를 집어 넣을 수도 있습니다. NVIDIA 과학자 Jim Fan은 Optimus의 손에 대해 높은 평가를 했습니다. Optimus의 손은 세계의 다섯 손가락 로봇 중 하나입니다. 가장 능숙합니다. 손은 촉각적일 뿐만 아니라
