ㅋㅋㅋ
잠깐만요 탄생 일련의 새로운 프로그래밍 언어와 정보 검색 기술의 활발한 발전도 하이라이트입니다. 인터넷 최초의 순수기술 비즈니스 모델은 구글과 바이두로 대표되는 검색엔진 기술이었다. 그러나 모두가 기대하지 않는 것은 추천 시스템이 탄생한 지 오래되었다는 점이다. 이르면 1992년 , 인류 역사상 최초의 추천 시스템이 논문 형태로 발표되었습니다. 이때는 아직 구글과 바이두가 탄생하지 않은 때였습니다.
은 검색 엔진처럼 꼭 필요한 요소로 간주되지 않으며, 많은 유니콘이 곧 탄생했습니다. 추천 시스템을 핵심 기술로 하는 기술 회사는 2010 시대에 Toutiao와 Douyin이 등장하기 전까지는 나타나지 않을 것입니다. Toutiao와 Douyin이 추천 시스템에서 가장 성공적인 대표 기업이 되었다는 것은 의심의 여지가 없습니다. 1세대 정보검색기술 검색엔진이 미국인들이 선점했다면, 2세대 정보검색기술 추천시스템은 중국이 확고히 장악하고 있는 셈이다. 그리고 이제 우리는 3세대 정보 검색 기술인 —— 대규모 언어 모델 기반 정보 검색을 접하게 됩니다. 현재 퍼스트무버는 유럽과 미국이지만, 현재 중국과 미국이 함께 나아가고 있다. 최근 몇 년간, 추천 시스템 분야의 권위있는 회의
은 자주 권장 권장 사항 ( secientatement wesomeation
)에 대한 최고의 종이 상을 자주 수여했습니다. 이는 이 분야가 수직적 응용에 점점 더 많은 관심을 기울이고 있음을 보여줍니다. 이렇게 중요한 추천 시스템의 수직적 적용이 있지만 아직까지는 큰 파장을 일으키지 못했습니다. 이 분야는CARS라고 불리는 시나리오 기반 추천(Context-aware Recommendation)입니다. 가끔 CARS 에서 Workshop을 볼 수 있지만 이러한 Workshop 에서는 매년 10 개 이상의 논문을 생산하지 않으며 이는 매우 적은 수입니다. CARS 무엇에 사용할 수 있나요? 우선 CARS 는 이미 버거킹 같은 패스트푸드 회사에서 사용되고 있습니다. 또한, 사용자가 운전하는 동안의 장면을 바탕으로 사용자에게 음악을 추천할 수도 있습니다. 또한, 기상 상황에 따라 사용자에게 여행 계획을 추천하는 것이 가능한지 생각해 볼 수 있습니다. 아니면 사용자의 신체 상태에 따라 식사를 추천하시겠습니까? 사실, 상상력을 마음껏 발휘하는 한, 우리는 언제나 CARS 에 대한 다양한 실용적인 응용 프로그램을 찾을 수 있습니다.
그러나CARS 이 널리 사용되는데 왜 논문을 출판하는 사람이 그렇게 적습니까? 그 이유는 간단합니다. CARS 에 사용할 수 있는 공개 데이터 세트가 거의 없기 때문입니다. 현재 CARS 의 최고의 공개 데이터세트는 슬로베니아의
LDOS-CoMoDa데이터세트입니다. 이 외에도 다른 데이터 세트를 찾기가 어렵습니다. LDOS-CoMoDa 는 영화 감상 시 사용자 장면 데이터를 설문조사 형태로 제공하여 연구자들이 CARS 연구에 참여할 수 있도록 해줍니다. 데이터 공개 시점은 2012년 ~2013년 정도이지만 현재 이 데이터 수집에 대해 아는 사람은 거의 없습니다. 본론으로 돌아가서, 이 글에서는 주로 MatMat / MovieMat 알고리즘과 PowerMat 알고리즘을 소개합니다. 이러한 알고리즘은 CARS 문제를 해결하기 위한 강력한 도구입니다. 먼저
MatMat이 CARS 문제를 어떻게 정의하는지 살펴보겠습니다. 먼저 사용자 평가 행렬을 재정의하고 사용자 평가 행렬의 각 평가 값을 정사각형 행렬로 바꿉니다. 정사각형 행렬의 대각선 요소는 원래 점수 값이고 비대각선 요소는 장면 정보입니다. 아래에서 MatMat 알고리즘의 손실 함수를 정의합니다. 이는 고전적인 행렬 분해 손실 함수를 수정하고 다음과 같은 형식을 갖습니다. 여기서 U 및 V 은 모두 행렬입니다. 이러한 방식으로 원래 행렬 분해에서 벡터 내적을 변경합니다. 벡터 점 곱셈을 행렬 곱셈으로 바꿉니다. 다음 예를 들어보겠습니다. MovieLens Small Dataset 에 대한 성능 비교 실험을 수행한 결과 다음과 같은 결과를 얻었습니다. 보시다시피 MatMat 알고리즘의 효과는 기존 행렬 분해 알고리즘보다 우수합니다. 추천 시스템의 공정성을 다시 확인해 보겠습니다. 공정성 지표 측면에서 MatMat 이 여전히 동일하게 우수한 성능을 보이는 것을 볼 수 있습니다. MatMat의 해결 과정은 상대적으로 복잡합니다. 알고리즘을 발명한 저자도 파생 과정을 논문에 쓰지 않았습니다. 하지만 속담처럼 선형대수를 잘 배우면 전 세계를 여행하는 것이 두렵지 않을 것입니다. 똑똑한 독자라면 관련 공식을 도출하고 이 알고리즘을 구현할 수 있을 것이라고 믿습니다. Almatmat 알고리즘 용지의 원래 주소는 다음 링크에서 찾을 수 있습니다. 본 논문은 국제학술대회 IEEE ICISCAE 2021 최우수논문보고서상입니다. MatMat 알고리즘은 장면 기반 영화 추천 분야에 적용됩니다. 이 알고리즘의 영화 인스턴스 이름은 MovieMat입니다. MovieMat 의 평가 매트릭스는 다음과 같이 정의됩니다. 그런 다음 저자는 LDOS-CoMoDa 에서 에 대한 비교 실험을 수행했습니다. 데이터 세트, 은 기존 행렬 분해보다 훨씬 높은 성능을 달성합니다. 공정성 평가 결과를 살펴보겠습니다. 공정성 측면에서 고전적인 행렬 분해는 MovieMat 보다 더 나은 결과를 얻었습니다. MovieMat 의 원본 논문은 다음 링크에서 확인할 수 있습니다: https://www.php.cn/link/f4ec6380c50a68a7c35d109bec48aebf . 우리는 가끔 이런 문제에 직면합니다. 새로운 위치에 도착했는데 장면 데이터만 있고 사용자 평가 데이터가 없다면 어떻게 해야 할까요? 상관없어요, Ratidar Technologies LLC(Beijing Daping Qizhi Network Technology Co., Ltd. ) 는 제로샷 학습을 기반으로 한 CARS 알고리즘인 PowerMat을 발명했습니다. PowerMat 의 원본 논문은 다음 링크에서 보실 수 있습니다: https://www.php.cn/link/1514f187930072575629709336826443 . PowerMat 의 발명가는 MAP 및 DotMat을 빌려 다음 MAP 함수를 정의했습니다. 어디 U 사용자는 특징 벡터, V 는 항목 특징 벡터, 은 사용자 평점 값, C 은 장면 변수입니다. 구체적으로 다음 공식을 얻습니다. 이 문제를 해결하기 위해 확률적 경사하강법을 사용하면 다음 공식을 얻습니다. 관찰을 통해 이 공식 집합에는 입력 데이터 관련 변수가 없다는 것을 알았으므로 PowerMat 은 시나리오에만 관련된 제로샷 학습 알고리즘입니다. 이 알고리즘은 다음과 같은 시나리오에 적용될 수 있습니다. 관광객은 특정 장소로 여행을 계획하지만 그곳에 가본 적이 없으므로 날씨와 같은 장면 데이터만 가지고 있습니다. PowerMat 을 사용하여 체크인 명소를 추천할 수 있습니다. 관광객 등 다음은 PowerMat 과 다른 알고리즘 간의 비교 데이터입니다. 이 사진을 통해 PowerMat 과 MovieMat를 찾습니다. flag 드럼 소리가 꽤, 아님 비교 가능하며 결과는 기존 행렬 분해 알고리즘보다 낫습니다. 아래 그림은 공정성 측면에서도 지수 , PowerMat 가 여전히 강력한 성능을 발휘하고 있음을 보여줍니다. 비교 실험을 통해 PowerMat 이 우수하다는 것을 확인했습니다 자동차 알고리즘. 인터넷 데이터 엔지니어들은 종종 데이터가 무엇보다 중요하다고 말합니다. 그리고 2010년 시대에는 데이터에 대해 낙관적이고 알고리즘에 대해 약세를 보이는 강한 추세가 인터넷에 있었습니다. CARS 가 좋은 예입니다. 대다수의 사람들이 관련 데이터에 접근할 수 없기 때문에 이 분야의 발전은 크게 제한되었습니다. LDOS-CoMoDa 데이터 수집을 공개한 슬로베니아 연구원들에게 감사드립니다. 우리는 이 분야를 발전시킬 수 있는 기회를 얻었습니다. 또한 점점 더 많은 사람들이 cars, cars 착륙 및 cars ... 에 대해 걱정하길 바랍니다.
위 내용은 선형 대수학을 잘 배우고 추천 시스템을 사용해 보세요.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!