기술 주변기기 일체 포함 BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

Apr 11, 2023 pm 11:04 PM
bert 바이트댄스 컨벌루션 신경망

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

컨벌루션 신경망에서 BERT를 어떻게 실행하나요?

SparK - Designing BERT for Convolutional Networks: Sparse and Hierarchical Masked Modeling을 ByteDance 기술팀이 제안하고 최근 인공지능으로 인정받은 것을 직접 사용할 수 있습니다 Spotlight 포커스 논문으로 포함:


BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

문서 링크:

https://www.php.c n/link/e38e37a99f7de1f45d169efc db288dd1

오픈 소스 코드:

https://www.php.cn/link/9dfcf16f0adbc5e2a55ef02db36bac7f

이것도 BERT의 첫 성공 CNN(컨볼루션 신경망). 먼저 사전 훈련에서 SparK의 성능을 경험해 보겠습니다.

완전하지 않은 사진 입력:


BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

강아지 복원:

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

또 다른 미완성 사진 :

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

베이글 샌드위치로 밝혀졌습니다.

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

다른 장면도 사진 복원이 가능합니다.

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

BERT와 Transformer A는 천국에서 이루어진 일치입니다.

"모든 위대한 행동과 생각에는 겸손한 시작이 있습니다."

BERT 사전 학습 알고리즘 뒤에는 단순하고 심오한 디자인이 있습니다. BERT는 "cloze"를 사용합니다. 문장에서 여러 단어를 무작위로 삭제하고 모델이 복구하는 방법을 학습하도록 합니다.

BERT는 NLP 분야인 Transformer의 핵심 모델에 크게 의존합니다.

Transformer는 당연히 가변 길이 시퀀스 데이터(예: 영어 문장)를 처리하는 데 적합하므로 BERT cloze의 "무작위 삭제"에 쉽게 대처할 수 있습니다.

시각계의 CNN도 BERT를 즐기고 싶습니다. 두 가지 과제는 무엇인가요?

컴퓨터 비전 개발의 역사를 되돌아보면 컨벌루션 신경망 모델은 병진 등분산, 다중 규모 구조 등 많은 고전 모델의 본질을 응축하고 있으며 주류라고 할 수 있습니다. 이력서 세계. 그러나 Transformer와 매우 다른 점은 CNN이 본질적으로 클로즈에 의해 "비어져 있고" "랜덤 홀"로 가득 찬 데이터에 적응할 수 없기 때문에 언뜻 보기에는 BERT 사전 훈련의 이점을 누릴 수 없다는 것입니다.


BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

위 그림 a는 MAE(Masked Autoencoders are Scalable Visual Learners)의 작업을 보여줍니다. CNN 모델 대신 Transformer 모델을 사용하기 때문입니다. 유연성 구멍이 있는 입력을 처리하는 것은 BERT와 "자연스러운 일치"입니다.

오른쪽 그림 b는 BERT와 CNN 모델을 융합하는 대략적인 방법을 보여줍니다. 즉, 모든 빈 영역을 "검게 만들고" 이 "검은 모자이크" 이미지를 CNN에 입력하면 결과를 상상할 수 있습니다. , 심각한 픽셀 강도 분포 이동 문제를 가져오고 성능이 매우 저하됩니다(나중에 확인됨). 이것이 CNN에서 BERT의 성공적인 적용을 방해하는

챌린지 1입니다. 또한 저자팀은 NLP 분야에서 유래한 BERT 알고리즘은 당연히 "멀티 스케일"의 특성을 갖지 않으며, 멀티 스케일 피라미드 구조는 다음과 같이 설명할 수 있다고 지적했습니다. 컴퓨터 비전의 오랜 역사에서 "황금 표준". 단일 스케일 BERT와 자연 다중 스케일 CNN의 충돌은

챌린지 2입니다. 솔루션 SparK: 희소 및 계층적 마스크 모델링


BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

저자 팀은 SparK(Spar se 및 계층적 마스크 모델링) 두 가지 문제를 해결하기 위해 이전 과제.

먼저 3차원 포인트 클라우드 데이터 처리에서 영감을 받아 저자 팀은 마스킹 연산(hollowing 연산) 후 조각난 이미지를 희소 포인트 클라우드로 처리하고 하위 다양체 희소 컨볼루션(Submanifold Sparse)을 사용하는 것을 제안했습니다. 컨볼루션)을 인코딩합니다. 이를 통해 컨벌루션 네트워크는 무작위로 삭제된 이미지를 처리할 수 있습니다.

두 번째로, 저자 팀은 UNet의 우아한 디자인에서 영감을 받아 다중 규모 기능이 모델의 여러 레벨 간에 흐를 수 있도록 측면 연결이 있는 인코더-디코더 모델을 자연스럽게 설계했습니다. 컴퓨터 비전의 멀티 스케일 표준.

이 시점에서 CNN(Convolutional Network)에 맞춰진 희소 다중 규모 마스크 모델링 알고리즘인 SparK가 탄생했습니다.

SparK는

일반: 구조를 수정하거나 추가 구성 요소를 도입하지 않고도 모든 컨볼루셔널 네트워크에 직접 적용할 수 있습니다. 친숙한 클래식 ResNet이든 최신 고급 모델인 ConvNeXt를 사용하면 SparK의 혜택을 직접 누릴 수 있습니다. ResNet에서 ConvNeXt로: 세 가지 주요 시각적 작업의 성능 향상

저자 팀은 두 가지 대표적인 컨볼루션 모델 계열인 ResNet과 ConvNeXt를 선택하여 이미지 분류에 사용했습니다. 대상 탐지 및 인스턴스 분할 작업에 대한 테스트가 수행되었습니다.

클래식 ResNet-50 모델에서 SparK는 유일한 생성 사전 훈련 역할을 하며

최첨단 수준에 도달:

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

ConvNeXt 모델에서는 SparK가 여전히 선두를 달리고 있습니다. 사전 훈련 전 ConvNeXt는 Swin-Transformer와 균등하게 일치했으며 사전 훈련 후 ConvNeXt는 세 가지 작업에서 Swin-Transformer를 압도적으로 능가했습니다.

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

SparK를 통해 전체 모델 계열에서 다음을 관찰할 수 있습니다.

모델이 크거나 작거나, 새롭거나 오래되었더라도 SparK의 이점을 누릴 수 있으며, 모델 크기/훈련 오버헤드가 증가할수록 증가율은 더욱 높아집니다. SparK 알고리즘의 스케일링 기능을 반영합니다.

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

마지막으로 저자 팀은 sparse 마스크 를 볼 수 있는 확인적 절제 실험도 설계했습니다. 계층적 구조 라인 3과 4)는 모두 매우 중요한 설계입니다. 일단 누락되면 심각한 성능 저하가 발생합니다.

BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.

위 내용은 BERT를 CNN에서도 사용할 수 있나요? ByteDance의 연구 결과가 ICLR 2023 Spotlight에 선정되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

ByteDance의 비디오 편집 앱 CapCut의 전 세계 사용자 지출액이 1억 달러를 초과했습니다. ByteDance의 비디오 편집 앱 CapCut의 전 세계 사용자 지출액이 1억 달러를 초과했습니다. Sep 14, 2023 pm 09:41 PM

ByteDance가 소유한 창의적인 비디오 편집 도구인 CapCut은 중국, 미국, 동남아시아에 많은 사용자를 보유하고 있습니다. 이 도구는 Android, iOS 및 PC 플랫폼을 지원합니다. 시장 조사 기관 data.ai의 최신 보고서에 따르면 2023년 9월 11일 현재 CapCut의 iOS 및 Google Play에 대한 총 사용자 지출액은 1억 달러를 초과했습니다(이 사이트에 대한 참고 사항: 현재 약 72억 8천만 달러), 스플라이스(2022년 하반기 1위)를 성공적으로 제치고 2023년 상반기에는 2022년 하반기 대비 180% 증가한 세계 최고 수익성의 영상 편집 애플리케이션으로 등극했다. 2023년 8월 현재 전 세계 4억 9천만 명이 iPhone 및 Android 휴대폰을 통해 CapCut을 사용하고 있습니다. 다

샤오미 바이트가 힘을 합쳤습니다! Xiao Ai의 Doubao 액세스 대형 모델: 휴대폰과 SU7에 이미 설치되어 있음 샤오미 바이트가 힘을 합쳤습니다! Xiao Ai의 Doubao 액세스 대형 모델: 휴대폰과 SU7에 이미 설치되어 있음 Jun 13, 2024 pm 05:11 PM

6월 13일 뉴스에 따르면 Byte의 'Volcano Engine' 공개 계정에 따르면 Xiaomi의 인공 지능 비서인 'Xiao Ai'가 Volcano Engine과 협력을 이루었습니다. 두 당사자는 beanbao 대형 모델을 기반으로 보다 지능적인 AI 상호 작용 경험을 달성할 것입니다. . ByteDance가 만든 대형 빈바오 모델은 매일 최대 1,200억 개의 텍스트 토큰을 효율적으로 처리하고 3,000만 개의 콘텐츠를 생성할 수 있는 것으로 알려졌습니다. Xiaomi는 Doubao 대형 모델을 사용하여 자체 모델의 학습 및 추론 능력을 향상시키고 사용자 요구를 보다 정확하게 파악할 뿐만 아니라 보다 빠른 응답 속도와 보다 포괄적인 콘텐츠 서비스를 제공하는 새로운 "Xiao Ai Classmate"를 만들었습니다. 예를 들어, 사용자가 복잡한 과학 개념에 대해 질문하면 &ldq

바이트댄스 모델 대규모 전개 실전 바이트댄스 모델 대규모 전개 실전 Apr 12, 2023 pm 08:31 PM

1. 배경 소개 ByteDance에서는 딥 러닝 기반 애플리케이션이 곳곳에서 피어나고 있습니다. 엔지니어는 모델 효과에도 주의를 기울여야 하지만 초기에는 온라인 서비스의 일관성과 성능에도 주의를 기울여야 했습니다. 알고리즘 전문가와 엔지니어링 전문가 간의 긴밀한 협력이 필요합니다. 이 모드는 diff 문제 해결 및 검증과 같은 비용이 상대적으로 높습니다. PyTorch/TensorFlow 프레임워크의 인기로 인해 딥 러닝 모델 훈련과 온라인 추론이 통합되었습니다. 개발자는 특정 알고리즘 논리에 주의를 기울이고 프레임워크의 Python API를 호출하여 훈련 검증 프로세스를 완료하면 됩니다. 모델은 쉽게 직렬화하고 내보낼 수 있으며, 통합된 고성능 C++ 엔진으로 추론 작업이 완료됩니다. 교육부터 배포까지 개발자 경험 개선

확산 모델 가속화, 가장 빠른 1단계로 SOTA 수준 이미지 생성, Byte Hyper-SD는 오픈 소스입니다. 확산 모델 가속화, 가장 빠른 1단계로 SOTA 수준 이미지 생성, Byte Hyper-SD는 오픈 소스입니다. Apr 25, 2024 pm 05:25 PM

최근 DiffusionModel은 이미지 생성 분야에서 상당한 발전을 이루었고, 이미지 생성 및 비디오 생성 작업에 전례 없는 개발 기회를 제공했습니다. 인상적인 결과에도 불구하고 확산 모델의 추론 프로세스에 내재된 다단계 반복 노이즈 제거 특성으로 인해 계산 비용이 높아집니다. 최근에는 확산 모델의 추론 프로세스를 가속화하기 위해 일련의 확산 모델 증류 알고리즘이 등장했습니다. 이러한 방법은 대략 두 가지 범주로 나눌 수 있습니다: i) 궤도 보존 증류, ii) 궤도 재구성 증류. 그러나 이 두 가지 유형의 방법은 제한된 효과 한계 또는 출력 도메인의 변경으로 인해 제한됩니다. 이러한 문제를 해결하기 위해 ByteDance 기술팀은 Hyper-SD라는 궤적 분할 합의를 제안했습니다.

심천 바이트댄스 호우하이 센터의 총 건축 면적은 77,400평방미터이며 주요 구조물은 꼭대기까지 마감되었습니다. 심천 바이트댄스 호우하이 센터의 총 건축 면적은 77,400평방미터이며 주요 구조물은 꼭대기까지 마감되었습니다. Jan 24, 2024 pm 05:27 PM

난산구 정부의 공식 WeChat 공개 계정 'Innovation Nanshan'에 따르면 최근 Shenzhen ByteDance Houhai Center 프로젝트가 중요한 진전을 이루었습니다. China Construction First Engineering Bureau Construction and Development Company에 따르면 프로젝트의 주요 구조는 예정보다 3일 일찍 마감되었습니다. 이 소식은 난산 호우하이(Nanshan Houhai) 핵심 지역에 새로운 랜드마크 건물이 들어서게 된다는 의미입니다. Shenzhen ByteDance Houhai Center 프로젝트는 Nanshan District Houhai의 핵심 지역에 위치하고 있습니다. 심천에 있는 Toutiao Technology Co., Ltd.의 본사 건물입니다. 총 건축면적은 77,400㎡, 높이 약 150m, 지하 4층, 지상 32층 규모다. 선전 ByteDance Houhai Center 프로젝트는 사무실, 엔터테인먼트, 케이터링 및 기타 기능을 통합한 혁신적인 초고층 건물이 될 것으로 보고되었습니다. 이 프로젝트는 심천이 인터넷 산업의 통합을 촉진하는 데 도움이 될 것입니다

NUS와 Byte는 업계 간 협력하여 모델 최적화를 통해 72배 더 빠른 교육을 달성하고 AAAI2023 Outstanding Paper를 수상했습니다. NUS와 Byte는 업계 간 협력하여 모델 최적화를 통해 72배 더 빠른 교육을 달성하고 AAAI2023 Outstanding Paper를 수상했습니다. May 06, 2023 pm 10:46 PM

최근 최고 국제 인공지능 컨퍼런스 AAAI2023이 선정 결과를 발표했다. 싱가포르 국립대학교(NUS)와 ByteDance 머신 러닝 팀(AML)이 공동 작업한 CowClip 기술 논문이 우수 논문(Distinguished Papers) 최종 후보에 올랐습니다. CowClip은 모델 정확도를 보장하면서 단일 GPU에서 모델 훈련 속도를 72배 높일 수 있는 모델 훈련 최적화 전략입니다. 관련 코드는 이제 오픈 소스입니다. ​논문 주소: https://arxiv.org/abs/2204.06240​오픈 소스 주소: https://github.com/bytedance/LargeBatchCTR​AAA

ByteDance는 글로벌 R&D 센터를 확장하고 캐나다, 호주 및 기타 지역에 엔지니어를 파견합니다. ByteDance는 글로벌 R&D 센터를 확장하고 캐나다, 호주 및 기타 지역에 엔지니어를 파견합니다. Jan 18, 2024 pm 04:00 PM

18일 IT하우스 뉴스에 따르면 최근 틱톡 국내 직원들이 해외로 전출했다는 소문이 돌자 바이트댄스 관계자들은 이 회사가 캐나다, 호주 등에 R&D 센터 건립을 준비하고 있다고 밝혔다. 현재 일부 R&D 센터는 약 반년 동안 시범 운영을 했으며, 앞으로 TikTok, CapCut, Lemon8 등 여러 해외 기업의 R&D를 지원할 예정이다. 바이트댄스는 현지 채용에 집중하고 소수의 주재원을 통해 관련 R&D 센터 설립을 지원할 계획이다. 지난 6개월간 회사는 미국, 중국, 싱가포르 등지에서 소수의 엔지니어를 선발해 준비에 참여한 것으로 알려졌다. 이 중 중국에서 제품, 연구개발(R&D), 운영직 등 두 곳의 연구개발센터에 총 120명이 파견됐다. 관계자들은 이번 조치가 해외사업 발전에 부응하고 보다 나은 방향으로 나아가기 위한 것이라고 말했다.

PICO 4 판매량은 예상보다 훨씬 낮으며 ByteDance가 차세대 VR 헤드셋 PICO 5를 취소할 것이라는 뉴스 보도가 있습니다. PICO 4 판매량은 예상보다 훨씬 낮으며 ByteDance가 차세대 VR 헤드셋 PICO 5를 취소할 것이라는 뉴스 보도가 있습니다. Dec 15, 2023 am 09:34 AM

12월 13일 본 웹사이트의 뉴스에 따르면, The Information에 따르면 ByteDance는 현재 PICO4의 판매량이 예상보다 훨씬 낮기 때문에 PICO 차세대 VR 헤드셋 PICO5를 폐지할 준비를 하고 있습니다. 올해 10월 EqualOcean의 기사에 따르면 ByteDance는 점차 PICO를 종료하고 Metaverse 분야를 포기하고 있다고 합니다. 기사에서는 ByteDance가 PICO가 위치한 하드웨어 분야가 전문 지식이 아니며, 지난 몇 년간의 성과가 기대에 미치지 못했으며, 당시 담당자는 미래에 대한 희망이 부족하다고 믿고 있다고 지적했습니다. 바이트댄스 관계자는 "PICO 사업을 점진적으로 포기한다"는 루머에 대해 "사실이 아니다"라고 반박했다. 피코의 사업은 여전히 ​​정상적으로 운영되고 있으며, 장기적으로는 확장현실에 투자할 것이라고 밝혔습니다.

See all articles