腾讯数十亿广告的秘密武器：利用大数据实时精准推荐-tutoriel mysql-php.cn

Maison

base de données

tutoriel mysql

腾讯数十亿广告的秘密武器：利用大数据实时精准推荐

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:04 PM

利用实时广告推荐数据 bras 秘密 Précis 腾讯

在过去几年，你在腾讯做了什么来推动大数据的应用？过去三年，我一直在坚持一件事：推动大数据的实时应用。现在从国外数据中心的数据，一秒钟可以达到深圳数据中心，这就是腾讯具备的数据能力。有了这个能力，就可以做很多商业化行为的模式。目前腾讯收集

在过去几年，你在腾讯做了什么来推动大数据的应用？

过去三年，我一直在坚持一件事：推动大数据的实时应用。现在从国外数据中心的数据，一秒钟可以达到深圳数据中心，这就是腾讯具备的数据能力。有了这个能力，就可以做很多商业化行为的模式。

腾讯数十亿广告的秘密武器：实时精准推荐

目前腾讯收集的数据已经超过了1万亿条，计算机规模已经超过了8千8百台。这么庞大的数据如果能实时处理，就能发挥出巨大的商业价值。这个商业价值就是精准推荐。

每年腾讯几十亿的广告，其基础来自于数据的精准推荐。实时数据推荐还可以用于视频的推荐，腾讯音乐推荐，新闻客户端的推荐，游戏道具的推荐，等等。

目前我们做到从数据进来到投放数据，延时不会超过50毫秒。有这个技术基础，腾讯的精准推荐才有了基础。

从内部管理而言，实时也降低了成本。因为实时数据处理可以用足“每一秒”。传统的数据仓库一般从晚上零点到第二天早上八点，做数据截断、抽取和处理，因为早上九点老板就要看数据报告了。数据处理的时间只有一天之中的三分之一，其他时间都是空闲的。

当我们把数据做到实时处理的事后，实际意义是将分析时间成本分摊到全天，成本更低。同时这也有利于控制风险，因为只要一出错马上可以监控，迅速回滚。

腾讯数十亿广告的秘密武器：实时精准推荐

所以你将大部分精力放在了“实时”上，你为什么认定“实时”会为腾讯增加更多的商业价值？

数据首先是有时效性的，一秒钟前的行为和一秒钟后的行为有着天差地别。

以往我们通过统计数据，得出规律，找到用户喜好。而现在实时变得更为重要。前一秒你看了母婴内容，那么几秒内就应该推送相关广告，转化率会比较高。如果你还在推送几天前，这个用户看足球的数据信息，这个生意就很难做下去了。

在腾讯，我们分三个领域各自研究精准推荐：数据整理、实时计算、算法研究。我深知，实时计算是关键核心。

在我的脑海中，一切数据必须以消息为中心，实时处理、提炼瓜分。实在解决不了的数据，再做离线分析。

比如一张照片，在数据处理端口肯定首先被实时过滤，这张照片是在哪里拍的？其中几个人，通过什么方式拍摄的？在所有数据收集处理完之后，我可能还需要找这张图片与其他图片的关联关系，这时才会做离线处理。

腾讯基本上90%以上的数据都是在线实时处理。我一直在坚持将腾讯的数据集中起来，放在一个平台体系之下，这其实是来自阿里巴巴的教训。（蒋杰原来在支付宝数据部门工作）阿里巴巴的数据直到今天还是四分五裂。

其实，我对于数据的实时经验也是在支付宝时期积累的。当时我学到的一点是，如果没有搜索引擎的支撑，就根本无法做数据分析。当时很多人都说，没有办法让数据在6秒内被搜索出来，而我坚持认为可以达到。

实际上，现在在腾讯，一万五千个字段，在3秒之内所有的数据交叉都可以实现。这是一个做技术的本分。

在实时这个领域，技术上的难点是什么？

我一直在慢慢弱化数据仓库，逐步走向实时数据仓库。其中最大的问题是，如何实现数据实时获取？

数据实时处理的前提，首先是实时采集。我的办法是一方面和业务部门谈好，另一方面我将数据采集文件部署到所有的机器里，从安装操作系统的时候就写入数据采集文件。这样，腾讯所有40万台机器都可以协同操作。

过去两年，腾讯从原来的一小时响应，到现在一秒钟精准推送，CTR （点击率）能提升20%。规模越大效果越明显。

精准推荐有三大要素，第一是数据，第二是实时，第三是算法。

首先要有强大的数据，如果数据缺失什么都干不了；第二，效果明显的是实时，第三才是优化算法。这是整个精准推荐体系的核心。实时在其中排在第二，我们的实践证明，在什么都没变的情况下，频率改变带来了整体收入的提升。

腾讯数十亿广告的秘密武器：实时精准推荐

在解决了获取数据之后，数据底层所遭遇的最大困难是什么？

眼下的挑战在于深度学习。大数据时代，腾讯有200PB的图片数据，如何去挖掘图片数据的价值？如何去挖掘语音数据的价值？

我们正在做的是从结构化数据分析转向非结构化数据。如何从非结构化数据中提炼商业价值？这包括了深度学习的DNN和CNN技术，包括如何做文本之间相似度的关系。这都是需要突破的点。

微信所有的语音训练都是深度学习的办法来处理。比如，每当你在用微信放语音的时候，机器自动翻译成文字，就是靠深度学习网络来训练的。但目前，计算能力依然是一个门槛，这个能力并非我们想象这么轻松，需要更多计算技术来改进。

未来数据处理会有剧烈的改变么？

硬件决定了数据的能效。数据规模越大，数据展现的方式会越多，未来实时计算的处理需求会越来越旺盛。相信未来，能贴合更多应用场景的高效计算引擎会出现，这是我对未来的判断。

很明显的是，如果当前一秒的数据没有处理完整，提炼清楚，随后的分析成本就会越来越高，而数据的价值则越来越低。所以，在未来，高效计算引擎和存储引擎的出现，会对大数据发展有突飞猛进的效用。

后记：

在蒋杰看来，没什么比实时更重要。在腾讯，他敏感意识到实时数据对于广告的价值，所以把大部分精力放到实时处理数据以及如何优化广告投放上。

今天很多公司的数据仓库是离线的，也因此数据距离实际业务很遥远，这个距离不仅仅是无法实时反应，更多在于无法保证数据的稳定和质量。

以此而言，数据实时化是业务与数据的结合的关键。

但实时数据并非终点。

每秒都在生产新数据，新数据与既有数据之间的关系如何梳理？假如我们一直通过数据收集、分析得知，电脑前坐着的是一只狗，但假如某天的数据收集显示，它会猫叫。那么我们能判断电脑前的其实是一只猫么？

这不仅仅是数据更新变化这么简单，而关系到我们如何判断和分析。

所以，此时，延时判断变得很重要。

如何在庞大数据面前，做出延时判断？尽管你有实时数据分析的能力。

这可能是下一个更有趣的话题。

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

Économie dans R.E.P.O. Expliqué (et enregistrer des fichiers)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Comment trouver le forgeron et déverrouiller les armes et la personnalisation des armes

3 Il y a quelques semaines By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7562

Tutoriel CakePHP

1384

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

L'application de grands modèles Tencent Yuanbao est en ligne ! Hunyuan est mis à niveau pour créer un assistant IA complet pouvant être transporté n'importe où Jun 09, 2024 pm 10:38 PM

Le 30 mai, Tencent a annoncé une mise à niveau complète de son modèle Hunyuan. L'application « Tencent Yuanbao » basée sur le modèle Hunyuan a été officiellement lancée et peut être téléchargée sur les magasins d'applications Apple et Android. Par rapport à la version de l'applet Hunyuan lors de la phase de test précédente, Tencent Yuanbao fournit des fonctionnalités de base telles que la recherche IA, le résumé IA et l'écriture IA pour les scénarios d'efficacité du travail ; pour les scénarios de la vie quotidienne, le gameplay de Yuanbao est également plus riche et fournit de multiples fonctionnalités d'application IA. , et de nouvelles méthodes de jeu telles que la création d'agents personnels sont ajoutées. « Tencent ne s'efforcera pas d'être le premier à créer un grand modèle. » Liu Yuhong, vice-président de Tencent Cloud et responsable du grand modèle Tencent Hunyuan, a déclaré : « Au cours de l'année écoulée, nous avons continué à promouvoir les capacités de Tencent. Grand modèle Tencent Hunyuan. Dans la technologie polonaise riche et massive dans des scénarios commerciaux tout en obtenant un aperçu des besoins réels des utilisateurs.

Open source! Au-delà de ZoeDepth ! DepthFM : estimation rapide et précise de la profondeur monoculaire ! Apr 03, 2024 pm 12:04 PM

0. À quoi sert cet article ? Nous proposons DepthFM : un modèle d'estimation de profondeur monoculaire génératif de pointe, polyvalent et rapide. En plus des tâches traditionnelles d'estimation de la profondeur, DepthFM démontre également des capacités de pointe dans les tâches en aval telles que l'inpainting en profondeur. DepthFM est efficace et peut synthétiser des cartes de profondeur en quelques étapes d'inférence. Lisons ce travail ensemble ~ 1. Titre des informations sur l'article : DepthFM : FastMonocularDepthEstimationwithFlowMatching Auteur : MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Vitesse Internet lente des données cellulaires sur iPhone : correctifs May 03, 2024 pm 09:01 PM

Vous êtes confronté à un décalage et à une connexion de données mobile lente sur iPhone ? En règle générale, la puissance de l'Internet cellulaire sur votre téléphone dépend de plusieurs facteurs tels que la région, le type de réseau cellulaire, le type d'itinérance, etc. Vous pouvez prendre certaines mesures pour obtenir une connexion Internet cellulaire plus rapide et plus fiable. Correctif 1 – Forcer le redémarrage de l'iPhone Parfois, le redémarrage forcé de votre appareil réinitialise simplement beaucoup de choses, y compris la connexion cellulaire. Étape 1 – Appuyez simplement une fois sur la touche d’augmentation du volume et relâchez-la. Ensuite, appuyez sur la touche de réduction du volume et relâchez-la à nouveau. Étape 2 – La partie suivante du processus consiste à maintenir le bouton sur le côté droit. Laissez l'iPhone finir de redémarrer. Activez les données cellulaires et vérifiez la vitesse du réseau. Vérifiez à nouveau Correctif 2 – Changer le mode de données Bien que la 5G offre de meilleures vitesses de réseau, elle fonctionne mieux lorsque le signal est plus faible

La vitalité de la super intelligence s'éveille ! Mais avec l'arrivée de l'IA qui se met à jour automatiquement, les mères n'ont plus à se soucier des goulots d'étranglement des données. Apr 29, 2024 pm 06:55 PM

Je pleure à mort. Le monde construit à la folie de grands modèles. Les données sur Internet ne suffisent pas du tout. Le modèle de formation ressemble à « The Hunger Games », et les chercheurs en IA du monde entier se demandent comment nourrir ces personnes avides de données. Ce problème est particulièrement important dans les tâches multimodales. À une époque où rien ne pouvait être fait, une équipe de start-up du département de l'Université Renmin de Chine a utilisé son propre nouveau modèle pour devenir la première en Chine à faire de « l'auto-alimentation des données générées par le modèle » une réalité. De plus, il s’agit d’une approche à deux volets, du côté compréhension et du côté génération, les deux côtés peuvent générer de nouvelles données multimodales de haute qualité et fournir un retour de données au modèle lui-même. Qu'est-ce qu'un modèle ? Awaker 1.0, un grand modèle multimodal qui vient d'apparaître sur le Forum Zhongguancun. Qui est l'équipe ? Moteur Sophon. Fondé par Gao Yizhao, doctorant à la Hillhouse School of Artificial Intelligence de l’Université Renmin.

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

L'US Air Force présente son premier avion de combat IA de grande envergure ! Le ministre a personnellement effectué l'essai routier sans intervenir pendant tout le processus, et 100 000 lignes de code ont été testées 21 fois. May 07, 2024 pm 05:00 PM

Récemment, le milieu militaire a été submergé par la nouvelle : les avions de combat militaires américains peuvent désormais mener des combats aériens entièrement automatiques grâce à l'IA. Oui, tout récemment, l’avion de combat IA de l’armée américaine a été rendu public pour la première fois, dévoilant ainsi son mystère. Le nom complet de ce chasseur est Variable Stability Simulator Test Aircraft (VISTA). Il a été personnellement piloté par le secrétaire de l'US Air Force pour simuler une bataille aérienne en tête-à-tête. Le 2 mai, le secrétaire de l'US Air Force, Frank Kendall, a décollé à bord d'un X-62AVISTA à la base aérienne d'Edwards. Notez que pendant le vol d'une heure, toutes les actions de vol ont été effectuées de manière autonome par l'IA ! Kendall a déclaré : "Au cours des dernières décennies, nous avons réfléchi au potentiel illimité du combat air-air autonome, mais cela a toujours semblé hors de portée." Mais maintenant,

Le document multimodal Alibaba 7B comprenant le grand modèle remporte le nouveau SOTA Apr 02, 2024 am 11:31 AM

Nouveau SOTA pour des capacités de compréhension de documents multimodaux ! L'équipe Alibaba mPLUG a publié le dernier travail open source mPLUG-DocOwl1.5, qui propose une série de solutions pour relever les quatre défis majeurs que sont la reconnaissance de texte d'image haute résolution, la compréhension générale de la structure des documents, le suivi des instructions et l'introduction de connaissances externes. Sans plus tarder, examinons d’abord les effets. Reconnaissance et conversion en un clic de graphiques aux structures complexes au format Markdown : Des graphiques de différents styles sont disponibles : Une reconnaissance et un positionnement de texte plus détaillés peuvent également être facilement traités : Des explications détaillées sur la compréhension du document peuvent également être données : Vous savez, « Compréhension du document " est actuellement un scénario important pour la mise en œuvre de grands modèles linguistiques. Il existe de nombreux produits sur le marché pour aider à la lecture de documents. Certains d'entre eux utilisent principalement des systèmes OCR pour la reconnaissance de texte et coopèrent avec LLM pour le traitement de texte.

See all articles