웨이보는 왜 중독성이 있나요? 숨은 추천 알고리즘 복호화
2021년 7월 13일, 하루 고생한 청년들은 누워서 휴대폰을 꺼내 익숙한 샤오포잔 앱을 열고, 클릭 한 번으로 좋아하는 호스트의 최신 영상에 접속하려 합니다.
그 결과 갑자기 시야가 어두워졌습니다.
1년 후, 스테이션 B는 마침내 비밀을 밝혔습니다: "음모 0".
그런데 이 웨이보가 엄청난 이용자 유입에도 불구하고 왜 망하지 않았는지 생각해보신 적 있으신가요?
AI와 웨이보의 관계는 무엇인가요?
이 미스터리를 풀기 전에 먼저 인공지능 개발부터 시작해야 합니다.
7월 27일, 중국 인터넷 사회가 주도하고 웨이보와 시나 뉴스가 주최하는 "통합 생태와 가치 공동 창조" 2022 뉴 와이즈 컨퍼런스가 성공적으로 개최되었습니다.
"지능이 모든 것을 주도합니다: AI는 만물 인터넷의 가속화된 도래를 촉진합니다"라는 주제에서 Sina Mobile CEO이자 Sina AI 미디어 연구소 소장인 Wang Weibo COO는 "클라우드가 모든 것을 강화합니다"라는 주제로 연설했습니다. 디지털 인텔리전스 기술의 통합 및 응용' '마이크로블로그의 복잡한 비즈니스 시나리오에 대한 능력'에 대한 기조연설.
Wang Wei는 머신러닝의 개발 역사를 되돌아보면 AI의 전반적인 개발 추세를 알 수 있다고 말했습니다. 훈련 데이터의 대규모 정량화 및 다양화, 복잡성 및 AI 모델의 복잡성 컴퓨팅 성능의 일반화, 효율성 및 규모.
첫 번째는 다중 모드 데이터 융합입니다.
5G의 급속한 발전과 함께 온라인 콘텐츠에서 이미지와 동영상 형태의 모달 콘텐츠가 차지하는 비중이 점점 높아지고 있어 모달 융합이 매우 필요합니다.
웨이보의 경우 텍스트, 사진, 동영상의 멀티모달 융합을 동시에 수행할 수 있다면 이 웨이보의 내용을 더 잘 이해할 수 있습니다.
둘째, 초대형 그래프 컴퓨팅입니다.
다른 기계 학습 모델과 비교할 때 초대형 그래프 컴퓨팅에는 특별한 이점이 있습니다. 즉, 네트워크에서 정보 전송을 통해 정보의 흐름, 집계 및 통합을 촉진합니다.
예를 들어, 행동이 거의 없는 초기 사용자의 경우 팔로우 목록에 있는 사람들과 이 사람들이 게시한 콘텐츠를 통한 정보 전파를 통해 사용자의 관심사를 추론할 수 있습니다.
세 번째는 AI가 개발한 덤벨 모드입니다.
현재 AI 연구개발의 초점은 슈퍼모델의 대형화와 모델 소형화 기술입니다.
우리 모두는 모델 매개변수 규모가 점점 더 커지면서 모델 효과가 점점 더 좋아지고 고정밀 모델이 계속 증가하고 있다는 것을 알고 있습니다. 예를 들어 Google의 Bert가 2018년에 처음 나왔을 때입니다. , 모델 모수 규모는 3억으로 그리 큰 수치는 아니지만, 이후 이 수치는 급속히 증가하고 있습니다.
OpenAI가 개발한 GPT-2 모델의 매개변수 크기는 15억개, GPT-3 모델의 매개변수 크기는 1750억개이며, 2021년 Google이 출시한 Switch Transformer에서는 매개변수 크기가 1.6에 이르렀습니다. 일조.
한편, 모델이 클수록 효과는 좋지만, 모델이 너무 크기 때문에 실제 적용이 불가능할 때도 있습니다. 따라서 연구 개발의 또 다른 초점은 모델 증류, 모델 가지치기 및 기타 기술과 같은 대형 모델을 소형화하고 경량화하는 것입니다.
넷째, AI 모델은 전문 모델에서 일반 모델로 이동하고 있습니다.
Google은 2021년 하반기에 Pathways 모델 프레임워크를 공개했습니다. 일반적인 대형 모델을 구축하여 "하나의 모델로 수천만 가지 일을 할 수 있다"는 목표를 달성하기 위해 이 아이디어를 처음 제안했습니다.
구체적인 아이디어는 다양한 작업 데이터가 입력된 후 라우팅 알고리즘을 통해 신경망 경로의 일부가 선택되어 모델 출력 계층에 도달한다는 것입니다. 다양한 작업에는 매개변수 공유와 작업별 모델 매개변수가 모두 있습니다.
10억 개의 노드 + 100억 개의 모서리로 구성된 매우 큰 그래프
왜 오랫동안 머신러닝에 대해 이야기해 오셨나요? 왜냐하면 다음에는 “Weibo 추천 추천 시스템”이 나올 것이기 때문입니다.
우리 모두 알고 있듯이 중국 최대 소셜 미디어 네트워크인 Weibo의 현재 월간 활성 사용자는 5억 8,200만 명에 달했습니다! 이러한 대규모 사용자 규모는 필연적으로 Weibo의 네트워크 환경을 매우 복잡하게 만들 것입니다.
높은 적시성 및 다양한 콘텐츠와 함께 오늘날의 주요 인터넷 이벤트는 Weibo에서 즉시 폭발적으로 증가할 것입니다.
또한 Weibo는 다양한 시나리오에 직면하고 관계 흐름, 핫스팟 흐름, 비디오 흐름 등 여러 시나리오에서 사용자에게 관심 있는 콘텐츠를 배포해야 합니다.
손가락 없이는 살 수 있지만 휴대폰 없이는 살 수 없습니다.
복잡한 비즈니스 시나리오에 직면한 Weibo는 AI와 빅 데이터를 어떻게 활용하여 적응할 수 있는 추천 시스템을 만듭니다. 변화하는 상황에?
Wang Wei는 Weibo 추천 시스템이 콘텐츠 이해, 사용자 이해, 추천 시스템의 세 부분으로 구성되어 있다고 소개했습니다.
우선 내용 이해입니다.
Weibo가 말하는 내용을 이해하려면 단순히 텍스트 내용을 이해하는 것만으로는 충분하지 않습니다. 블로그 게시물, 사진, 동영상 및 기타 미디어 정보를 통합하려면 다중 모드 이해 기술을 사용해야 합니다.
이를 위해 Weibo는 "대조 학습"을 통해 자체적인 Weibo 다중 모드 사전 훈련 모델을 훈련시켰으며, 이 자기 지도 학습 방법을 사용하여 다중 모드 사전 훈련을 수행했습니다.
아래 예는 Weibo가 자체 "주제"를 사용하여 훈련 데이터를 자동으로 구성하는 방법을 보여줍니다.
예를 들어, "Rashford in training"이라는 두 개의 Weibo 게시물을 긍정적인 예로 선택하고, 서로 다른 주제를 가진 일부 Weibo 게시물을 부정적인 예로 무작위로 선택하여 자동으로 훈련 데이터를 구성할 수 있습니다.
특정 Weibo의 경우 텍스트 콘텐츠는 Bert로 인코딩되고, 이미지와 동영상 콘텐츠는 ViT로 인코딩된 후 융합 서브 네트워크를 통해 정보가 융합되어 Weibo의 임베딩 인코딩을 형성합니다. 사전 훈련 과정입니다.
사전 학습 후 잘 학습된 Weibo 인코더를 사용하여 새로운 Weibo 콘텐츠를 다중 모달 방식으로 인코딩하여 임베딩을 형성할 수 있으며 이는 추천과 같은 다운스트림 작업에 사용할 수 있습니다.
둘째, 사용자 이해 측면에서 Weibo는 사용자의 독서 관심 분야를 더 잘 이해하기 위해 초대형 그래프 컴퓨팅을 사용합니다. 결국 웨이보에는 고유한 소셜 미디어 속성이 있어서 자연스럽게 대규모 그래프 컴퓨팅과 잘 어울립니다.
사용자와 블로그 게시물을 그래프의 노드로 사용하고 사용자, 사용자와 블로그 게시물 읽기, 다시 댓글 달기 및 좋아요 누르기 등의 관심 관계를 기반으로 그래프의 가장자리를 구성하여 Weibo는 10억 개의 노드, 100억 개의 모서리가 있는 매우 큰 그래프.
대규모 그래프 컴퓨팅에서의 정보 전파, 집계 및 통합을 통해 사용자 관심 사항을 나타내는 임베딩 벡터가 형성되고 사용자 관심 사항을 더 잘 이해할 수 있습니다.
이를 통해 사용자 간의 다음 관계, 사용자 및 블로그 게시물의 덧글과 좋아요 등을 동시에 처리할 수 있습니다.
Weibo 추천 시스템은 사용자가 말하는 내용을 이해하고 Weibo 사용자의 관심사를 이해한 후 관심 있는 사용자에게 맞춤화된 방식으로 고품질의 Weibo 게시물을 배포합니다.
그렇다면 이렇게 복잡한 시나리오에서 효율적인 추천 시스템을 어떻게 구축할 수 있을까요?
Weibo는 다중 장면 모델링 접근 방식을 채택합니다. 이상적인 상황은 하나의 추천 모델만 구축하고 이를 사용하여 여러 시나리오를 제공하는 것입니다.
그렇다면 장면 간의 공통성과 개성을 어떻게 표현해야 할까요? 네트워크 매개변수는 장면 간에 공유될 수 있으며, 장면은 장면의 공통성과 개별성을 반영하기 위해 독점적인 사설 네트워크 매개변수를 가질 수 있습니다.
예를 들어, 이 모델 다이어그램에서 모델의 기본 기능 입력 레이어와 네트워크 중간에 있는 "전문가 하위 네트워크"의 일부에서 이러한 네트워크 매개변수는 각 네트워크에서 공유됩니다. 다른 하위 네트워크 매개변수는 장면에 고유한 반면
이러한 방식으로 하나의 모델은 여러 장면을 제공하고 모델 리소스를 절약할 수 있습니다.
당산 사건: 교통량이 두 배로 늘면 어떻게 해야 하나요?
이제 원래의 "서스펜스"로 돌아갑니다.
완전히 보호되지 않으면 '폭발'할 이 핫스팟은 웨이보에게 늘 큰 도전이었습니다.
예를 들어 최근 전국적인 관심을 끌었던 "당산 사건"은 사건 당일의 뜨거운 교통량으로 인해 일일 교통 최고치의 두 배에 달했습니다.
이와 관련하여 Wang Wei는 Weibo가 마이크로서비스 + Docker 컨테이너화 기술을 매우 일찍 적용하여 서비스 운영 및 유지 관리의 효율성을 향상시킬 뿐만 아니라 서비스의 동적 확장 및 축소 기능을 실현했다고 말했습니다. 현재 웨이보는 10분 안에 10,000개 이상의 서버를 예약할 수 있는 용량을 갖추고 있으며 핫 트래픽을 처리할 만큼 충분한 서버를 보유하고 있습니다.
또한 Weibo는 핫스팟 모니터링 메커니즘과 핫스팟 연결 시스템을 구축했으며 Weibo가 개발한 Weibo Mesh 기술을 통해 서로 다른 서비스 간의 효율적인 교차 언어 통화를 실현하고 전체 서비스 성능을 향상하며 연계 확장의 효율성.
마침내 Weibo는 오프라인 실시간 하이브리드 배포 기술을 채택했습니다. CPU 실시간 선점형 스케줄링 기술과 컨테이너화 기술의 결합은 Weibo 서비스의 오프라인 실시간 하이브리드 배포 기능을 구현하는 데 사용됩니다.
위 작업을 결합한 후 핫 트래픽이 발생하면 몇 초 만에 핵심 서비스의 핫 트래픽을 장악할 수 있습니다. 마지막으로 인터넷의 발전사를 살펴보자.
PC 인터넷이 온라인 세계의 시작이라면, 모바일 인터넷의 등장으로 보이지 않는 정보 공간을 주머니에 넣을 수 있게 되었습니다. 빅데이터, 클라우드 컴퓨팅, 인공지능 등의 기술이 모바일 인터넷과 중첩, 통합되면서 우리는 지능정보 시대로 진입했습니다.
지금 가장 핫한 화두는 멀티버스입니다. 메타버스는 지난해부터 디지털 트윈, 디지털 피플, XR, 블록체인 기술 등 폭넓은 논의를 불러일으켰다.
Wang Wei는 AI, 블록체인, XR과 같은 최첨단 기술을 기반으로 한 현재 애플리케이션 시나리오가 이미 메타버스의 일부 프로토타입을 반영했다고 믿습니다. 게임, 소셜 네트워킹과 같은 분야는 메타버스에 대한 매우 좋은 응용 시나리오이며, 이는 모든 사람의 메타버스 참여에 대한 열정을 불러일으킬 것입니다.
위 내용은 웨이보는 왜 중독성이 있나요? 숨은 추천 알고리즘 복호화의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











위에 작성 및 저자의 개인적인 이해: 현재 전체 자율주행 시스템에서 인식 모듈은 중요한 역할을 합니다. 자율주행 시스템의 제어 모듈은 적시에 올바른 판단과 행동 결정을 내립니다. 현재 자율주행 기능을 갖춘 자동차에는 일반적으로 서라운드 뷰 카메라 센서, 라이더 센서, 밀리미터파 레이더 센서 등 다양한 데이터 정보 센서가 장착되어 다양한 방식으로 정보를 수집하여 정확한 인식 작업을 수행합니다. 순수 비전을 기반으로 한 BEV 인식 알고리즘은 하드웨어 비용이 저렴하고 배포가 용이하며, 출력 결과를 다양한 다운스트림 작업에 쉽게 적용할 수 있어 업계에서 선호됩니다.

네트워크 데이터 전송에서 IP 프록시 서버는 사용자가 실제 IP 주소를 숨기고 개인정보를 보호하며 액세스 속도를 향상시키는 데 도움을 주는 중요한 역할을 합니다. 이 기사에서는 PHP를 사용하여 IP 프록시 서버를 구축하는 방법에 대한 모범 사례 가이드를 소개하고 구체적인 코드 예제를 제공합니다. IP 프록시 서버란 무엇입니까? IP 프록시 서버는 사용자와 대상 서버 사이에 위치한 중간 서버로서 사용자와 대상 서버 사이의 전송 스테이션 역할을 하며 사용자의 요청과 응답을 전달합니다. IP 프록시 서버를 사용하여

DHCP 릴레이의 역할은 두 서버가 서로 다른 서브넷에 있더라도 수신된 DHCP 패킷을 네트워크의 다른 DHCP 서버로 전달하는 것입니다. DHCP 릴레이를 사용하면 네트워크 센터에 중앙 집중식 DHCP 서버를 배포하고 이를 사용하여 모든 네트워크 서브넷/VLAN에 IP 주소를 동적으로 할당할 수 있습니다. Dnsmasq는 네트워크에서 동적 호스트 구성을 관리하는 데 도움이 되도록 DHCP 릴레이 서버로 구성할 수 있는 일반적으로 사용되는 DNS 및 DHCP 프로토콜 서버입니다. 이 기사에서는 dnsmasq를 DHCP 릴레이 서버로 구성하는 방법을 보여줍니다. 내용 항목: 네트워크 토폴로지 중앙 집중식 DHCP 서버의 DHCP 릴레이 D에서 고정 IP 주소 구성

C++의 기계 학습 알고리즘이 직면하는 일반적인 과제에는 메모리 관리, 멀티스레딩, 성능 최적화 및 유지 관리 가능성이 포함됩니다. 솔루션에는 스마트 포인터, 최신 스레딩 라이브러리, SIMD 지침 및 타사 라이브러리 사용은 물론 코딩 스타일 지침 준수 및 자동화 도구 사용이 포함됩니다. 실제 사례에서는 Eigen 라이브러리를 사용하여 선형 회귀 알고리즘을 구현하고 메모리를 효과적으로 관리하며 고성능 행렬 연산을 사용하는 방법을 보여줍니다.

C++정렬 함수의 맨 아래 계층은 병합 정렬을 사용하고 복잡도는 O(nlogn)이며 빠른 정렬, 힙 정렬 및 안정 정렬을 포함한 다양한 정렬 알고리즘 선택을 제공합니다.

에픽서버가 오프라인 상태일 때 게임에 접속할 수 없으면 어떻게 해야 하나요? 이 문제는 많은 친구들이 겪었을 것입니다. 이 메시지가 나타나면 정품 게임을 시작할 수 없습니다. 이 문제는 일반적으로 네트워크 및 보안 소프트웨어의 간섭으로 인해 발생합니다. 이 문제의 편집자는 어떻게 설명합니까? 저는 여러분과 솔루션을 공유하고 싶습니다. 오늘의 소프트웨어 튜토리얼이 문제 해결에 도움이 되기를 바랍니다. 에픽 서버가 오프라인일 때 게임에 들어갈 수 없는 경우 해결 방법: 1. 게임 플랫폼과 보안 소프트웨어의 방해를 받을 수 있습니다. 2. 두 번째는 네트워크 변동이 너무 심하다는 것입니다. 라우터를 다시 시작하여 작동하는지 확인해보세요. 조건이 괜찮다면 5g 모바일 네트워크를 사용해 작동해 보세요. 3. 그럼 더 있을 수도 있겠네요

01 전망 요약 현재로서는 탐지 효율성과 탐지 결과 간의 적절한 균형을 이루기가 어렵습니다. 우리는 광학 원격 탐사 이미지에서 표적 감지 네트워크의 효과를 향상시키기 위해 다층 특징 피라미드, 다중 감지 헤드 전략 및 하이브리드 주의 모듈을 사용하여 고해상도 광학 원격 감지 이미지에서 표적 감지를 위한 향상된 YOLOv5 알고리즘을 개발했습니다. SIMD 데이터 세트에 따르면 새로운 알고리즘의 mAP는 YOLOv5보다 2.2%, YOLOX보다 8.48% 우수하여 탐지 결과와 속도 간의 균형이 더 잘 이루어졌습니다. 02 배경 및 동기 원격탐사 기술의 급속한 발전으로 항공기, 자동차, 건물 등 지구 표면의 많은 물체를 묘사하기 위해 고해상도 광학 원격탐사 영상이 활용되고 있다. 원격탐사 이미지 해석에서 물체 감지

서버에 PHPFFmpeg 확장을 설치하는 방법은 무엇입니까? 서버에 PHPFFmpeg 확장을 설치하면 PHP 프로젝트에서 오디오 및 비디오 파일을 처리하고 오디오 및 비디오 파일의 인코딩, 디코딩, 편집 및 처리와 같은 기능을 구현하는 데 도움이 될 수 있습니다. 이 기사에서는 서버에 PHPFFmpeg 확장을 설치하는 방법과 구체적인 코드 예제를 소개합니다. 먼저, PHP와 FFmpeg가 서버에 설치되어 있는지 확인해야 합니다. FFmpeg가 설치되어 있지 않은 경우 아래 단계에 따라 FFmpe를 설치할 수 있습니다.
