이 문서에서는 CTR 추정에서 기능 향상 및 개인화의 고전적인 방법과 효과 비교를 요약합니다.
CTR 추정에서 주류 방법은 기능이 매우 중요한 기능 임베딩+MLP를 사용합니다. 그러나 동일한 기능의 경우 다른 샘플에서 표현이 동일합니다. 이러한 방식으로 다운스트림 모델에 입력하면 모델의 표현 능력이 제한됩니다.
이 문제를 해결하기 위해 CTR 추정 분야에서 기능 향상 모듈이라고 하는 일련의 관련 작업이 제안되었습니다. 특징 강화 모듈은 다양한 샘플의 특징 표현에 적응하고 모델의 표현 능력을 향상시키기 위해 다양한 샘플을 기반으로 임베딩 레이어의 출력 결과를 수정합니다.
최근 푸단대학교와 Microsoft Research Asia는 다양한 기능 향상 모듈의 구현 방법과 효과를 비교하는 기능 향상 작업에 대한 리뷰를 공동으로 발표했습니다. 이제 여러 기능 향상 모듈의 구현 방법과 본 기사에서 수행한 관련 비교 실험을 소개하겠습니다
논문 제목: CTR 예측을 위한 기능 개선 모듈의 종합 요약 및 평가
다운로드 주소: https:/ / arxiv.org/pdf/2311.04625v1.pdf
1. 특징 강화 모델링 아이디어
특징 강화 모듈은 CTR 예측 모델에서 Embedding 레이어의 표현 능력을 향상시키고, 동일한 특징을 서로 다른 모델에서 차별화할 수 있도록 설계되었습니다. 견본. . 기능 강화 모듈은 다음과 같은 통일된 수식으로 표현할 수 있으며 원본 Embedding을 입력하고 함수를 전달한 후 본 샘플의 개인화된 Embedding을 생성할 수 있습니다.
Pictures
이 방법의 일반적인 아이디어는 각 특징의 초기 임베딩을 얻은 후 샘플 자체의 표현을 사용하여 특징 임베딩을 변환하여 현재 샘플의 개인화된 임베딩을 얻는 것입니다. 여기서는 몇 가지 고전적인 기능 향상 모듈 모델링 방법을 소개합니다.
2. 기능 향상을 위한 고전적인 방법
희소 예측을 위한 입력 인식 인수 분해 기계(IJCAI 2019) 이 기사에서는 임베딩 레이어 뒤에 재가중 레이어를 추가하고 샘플의 초기 임베딩을 MLP에 입력하여 표현을 얻습니다. 샘플의 벡터는 소프트맥스를 사용하여 정규화됩니다. Softmax 뒤의 각 요소는 특성에 해당하며 이 특성의 중요성을 나타냅니다. 이 소프트맥스 결과에 해당 특성의 초기 임베딩을 곱하여 샘플 세분성에서 특성 임베딩 가중치를 얻습니다.
Pictures
FiBiNET: 기능 중요도와 2차 기능 상호 작용을 결합한 클릭률 예측 모델(RecSys 2019)도 비슷한 아이디어를 채택합니다. 모델은 각 샘플에 대한 특성의 개인화된 가중치를 학습합니다. 전체 과정은 압착, 추출, 재중량의 세 단계로 나누어집니다. 스퀴징 단계에서는 풀링 방법을 통해 각 특징의 임베딩 벡터를 통계적 스칼라로 얻습니다. 추출 단계에서 이러한 스칼라는 다층 퍼셉트론(MLP)에 입력되어 각 특징의 가중치를 얻습니다. 마지막으로, 이러한 가중치에 각 특징의 임베딩 벡터를 곱하여 가중치 임베딩 결과를 얻습니다. 이는 샘플 수준에서 특징 중요도를 필터링하는 것과 동일합니다
Picture
CTR 예측을 위한 이중 입력 인식 인수분해 기계( IJCAI 2020)은 이전 기사와 유사하며, self-attention을 사용하여 기능을 향상시킵니다. 전체는 벡터 방식과 비트 방식의 두 가지 모듈로 나뉩니다. 벡터 방식은 각 기능의 포함을 시퀀스의 요소로 처리하고 이를 Transformer에 입력하여 융합된 기능 표현을 얻습니다. 비트 방식 부분은 다층 MLP를 사용하여 원래 기능을 매핑합니다. 두 부분의 입력 결과를 더한 후 각 특징 요소의 가중치를 구하고, 해당 원래 특징의 각 비트를 곱하여 향상된 특징을 얻습니다.
Image
GateNet: 클릭률 예측을 위한 향상된 Gated Deep Network(2020) 각 기능의 초기 임베딩 벡터를 활용하여 MLP 및 시그모이드 함수를 통해 독립적인 기능 가중치 점수를 생성하는 동시에 MLP를 사용하여 결합합니다. 모든 기능은 비트별 가중치 점수에 매핑되고 두 기능이 결합되어 입력 기능에 가중치를 부여합니다. 피처 레이어 외에도 MLP의 히든 레이어에서도 비슷한 방법을 사용하여 각 히든 레이어의 입력에 가중치를 부여합니다
picture
Hierarchical Attention을 통한 해석 가능한 클릭률 예측(WSDM 2020)도 self-attention을 사용하여 기능 변환을 달성하지만 고차 기능 생성을 추가합니다. 여기서는 계층적 self-attention이 사용됩니다. self-attention의 각 레이어는 이전 self-attention 레이어의 출력을 입력으로 사용합니다. 각 레이어는 계층적 다중 차수 특징 추출을 달성하기 위해 1차 고차 특징 조합을 추가합니다. 구체적으로, 각 레이어가 self-attention을 수행한 후 생성된 새로운 특징 행렬을 소프트맥스를 통해 각 특징의 가중치를 구한 후, 원래 특징의 가중치에 따라 새로운 특징에 가중치를 부여한 후 내적을 수행합니다. 원래 기능을 사용하여 하나의 기능 수준을 증가시킵니다.
Pictures
ContextNet: A Click-Through Rate Prediction Framework Using Contextual information to Refine Feature Embedding(2021)도 MLP를 사용하여 모든 기능을 각 기능 임베딩 크기의 차원으로 매핑하는 유사한 접근 방식입니다. 원래 기능의 크기가 조정되고 각 기능에 개인화된 MLP 매개변수가 사용됩니다. 이러한 방식으로 각 기능은 샘플의 다른 기능을 상위 및 하위 비트로 사용하여 향상됩니다.
Pictures
컨텍스트 인식 기능 표현 학습(SIGIR 2022)으로 CTR 예측 향상은 기능 향상을 위해 self-attention을 사용합니다. 일련의 입력 기능에 대해 각 기능이 다른 기능에 미치는 영향 정도는 다릅니다. 셀프 어텐션을 통해 각 특징의 임베딩에 대해 셀프 어텐션을 수행하여 샘플 내 특징 간의 정보 상호 작용을 달성합니다. 기능 간의 상호 작용 외에도 이 기사에서는 비트 수준 정보 상호 작용을 위해 MLP도 사용합니다. 위에서 생성된 새로운 임베딩은 게이트 네트워크를 통해 원래 임베딩과 병합되어 최종적으로 정제된 특징 표현을 얻습니다.
Pictures
3. 실험 결과
다양한 기능 향상 방법의 효과를 비교한 후 종합적인 결론에 도달했습니다. 많은 기능 향상 모듈 중에서 GFRL, FRNet-V 및 FRNetB가 가장 성능이 좋았으며, 다른 기능 강화 방법보다 효과가 더 좋습니다
Pictures
위 내용은 이 문서에서는 CTR 추정에서 기능 향상 및 개인화의 고전적인 방법과 효과 비교를 요약합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제










![WLAN 확장 모듈이 중지되었습니다. [수정]](https://img.php.cn/upload/article/000/465/014/170832352052603.gif?x-oss-process=image/resize,m_fill,h_207,w_330)
Windows 컴퓨터의 WLAN 확장 모듈에 문제가 있는 경우 인터넷 연결이 끊어질 수 있습니다. 이러한 상황은 종종 좌절감을 주지만 다행히도 이 문서에서는 이 문제를 해결하고 무선 연결이 다시 제대로 작동하도록 하는 데 도움이 될 수 있는 몇 가지 간단한 제안 사항을 제공합니다. WLAN 확장성 모듈 복구가 중지되었습니다. Windows 컴퓨터에서 WLAN 확장성 모듈의 작동이 중지된 경우 다음 제안에 따라 문제를 해결하십시오. 네트워크 및 인터넷 문제 해결사를 실행하여 무선 네트워크 연결을 비활성화했다가 다시 활성화하십시오. WLAN 자동 구성 서비스 다시 시작 전원 옵션 수정 수정 고급 전원 설정 네트워크 어댑터 드라이버 재설치 일부 네트워크 명령 실행 이제 자세히 살펴보겠습니다.

이 문서에서는 무선 LAN 확장 모듈을 시작할 수 없음을 나타내는 이벤트 ID10000을 해결하는 방법을 자세히 설명합니다. 이 오류는 Windows 11/10 PC의 이벤트 로그에 나타날 수 있습니다. WLAN 확장성 모듈은 IHV(독립 하드웨어 공급업체) 및 ISV(독립 소프트웨어 공급업체)가 사용자에게 맞춤형 무선 네트워크 기능을 제공할 수 있도록 하는 Windows의 구성 요소입니다. Windows 기본 기능을 추가하여 기본 Windows 네트워크 구성 요소의 기능을 확장합니다. WLAN 확장성 모듈은 운영 체제가 네트워크 구성 요소를 로드할 때 초기화의 일부로 시작됩니다. 무선 LAN 확장 모듈에 문제가 발생하여 시작할 수 없는 경우 이벤트 뷰어 로그에 오류 메시지가 표시될 수 있습니다.

1. sys 모듈 소개 앞서 소개한 os 모듈은 주로 운영 체제용이지만, 이 글의 sys 모듈은 주로 Python 인터프리터용입니다. sys 모듈은 Python과 함께 제공되는 모듈입니다. Python 인터프리터와 상호 작용하기 위한 인터페이스입니다. sys 모듈은 Python 런타임 환경의 다양한 부분을 처리하기 위한 많은 함수와 변수를 제공합니다. 2. sys 모듈에서 일반적으로 사용되는 메서드 dir() 메서드를 통해 sys 모듈에 어떤 메서드가 포함되어 있는지 확인할 수 있습니다. import sys print(dir(sys))1.sys.argv-get 명령줄 매개변수 sys. argv는 프로그램 외부에서 명령을 구현하는 데 사용됩니다. 프로그램에 매개변수가 전달되고 명령줄 매개변수 열을 얻을 수 있습니다.

서문 이 기사에서는 계속해서 Python 컬렉션 모듈을 소개합니다. 이번에는 그 안에 있는 명명된 튜플, 즉 명명된 튜플의 사용을 주로 소개합니다. 더 이상 고민할 필요 없이 시작하겠습니다. 좋아요, 팔로우 및 전달을 기억하세요~ ^_^네임드 튜플 생성하기 Python 컬렉션의 네임드 튜플 클래스인 Tuples는 튜플의 각 위치에 의미를 부여하고 코드의 가독성을 향상시킵니다. 일반 튜플이 사용되는 모든 곳에서 사용할 수 있으며 위치 인덱스가 아닌 이름으로 필드에 액세스하는 기능을 추가합니다. 이는 Python 내장 모듈 컬렉션에서 나옵니다. 사용되는 일반 구문은 다음과 같습니다. import collections XxNamedT

안녕하세요. 제 이름은 somenzz입니다. Zheng 형제라고 불러주세요. Python의 가져오기는 매우 직관적이지만 그럼에도 불구하고 패키지가 거기에 있음에도 불구하고 여전히 ModuleNotFoundError가 발생하는 경우가 있습니다. 상대 경로는 분명히 매우 정확하지만 ImportError:attemptedrelativeimportwithnoknownparentpackage 오류는 동일한 디렉터리에서 모듈을 가져오고 이 글은 가져오기를 사용할 때 자주 발생하는 몇 가지 문제를 분석하여 가져오기를 쉽게 처리하는 데 도움이 됩니다.

모든 데이터에는 처음에 "DOB"(생년월일)가 자동으로 할당됩니다. 따라서 어느 시점에서는 데이터를 처리할 때 날짜와 시간 데이터를 마주치는 것이 불가피합니다. 이 튜토리얼에서는 Python의 datetime 모듈과 pandas 및 pytz와 같은 일부 주변 라이브러리를 사용하는 방법을 안내합니다. Python에서 날짜 및 시간과 관련된 모든 것은 datetime 모듈에 의해 처리되며, 이 모듈은 모듈을 5개의 다른 클래스로 더 나눕니다. 클래스는 단순히 객체에 해당하는 데이터 유형입니다. 다음 그림은 일반적으로 사용되는 속성 및 예제와 함께 Python의 5개 날짜/시간 클래스를 요약합니다. 3가지 유용한 조각 1. datet를 사용하여 문자열을 날짜/시간 형식으로 변환합니다.

Ansible의 작동 원리는 위 그림에서 이해할 수 있습니다. 관리 측에서는 관리 측에 연결하기 위해 로컬, SSH 및 zeromq의 세 가지 방법을 지원합니다. 기본값은 SSH 기반 연결을 사용하는 것입니다. 위의 아키텍처 다이어그램에서는 HostInventory(호스트 목록) 분류가 다른 방식으로 수행될 수 있습니다. 관리 노드는 단일 모듈 및 단일 명령의 일괄 실행을 구현합니다. -hoc; 관리 노드는 플레이북을 통해 웹 서비스 설치 및 배포, 데이터베이스 서버 일괄 백업 등과 같은 여러 작업 모음을 구현할 수 있습니다. 우리는 플레이북을 시스템이 통과하는 것으로 간단히 이해할 수 있습니다.

CTR 추정에서는 특성이 매우 중요한 특성 임베딩+MLP를 사용하는 주류 방법이 있습니다. 그러나 동일한 기능의 경우 다른 샘플에서 표현이 동일합니다. 이러한 방식으로 다운스트림 모델에 입력하면 모델의 표현 능력이 제한됩니다. 이러한 문제를 해결하기 위해 CTR 추정 분야에서는 Feature Enhancement Module이라 불리는 일련의 관련 연구가 제안되었다. 특징 강화 모듈은 다양한 샘플의 특징 표현에 적응하고 모델의 표현 능력을 향상시키기 위해 다양한 샘플을 기반으로 임베딩 레이어의 출력 결과를 수정합니다. 최근 Fudan University와 Microsoft Research Asia는 다양한 기능 향상 모듈의 구현 방법과 효과를 비교하는 기능 향상 작업에 대한 리뷰를 공동으로 발표했습니다. 이제 한 가지를 소개하겠습니다.
