


L'algorithme CVM révolutionnaire résout plus de 40 ans de problèmes de comptage ! Un informaticien lance une pièce de monnaie pour trouver le mot unique pour « Hamlet »
Compter semble simple, mais il est très difficile à mettre en pratique.
Imaginez que vous soyez envoyé dans une forêt tropicale humide vierge pour effectuer un recensement de la faune. Chaque fois que vous voyez un animal, prenez une photo.
L'appareil photo numérique enregistre uniquement le nombre total d'animaux suivis, mais vous êtes intéressé par le nombre d'animaux uniques, mais il n'y a pas de statistiques.
Alors, quelle est la meilleure façon de mettre la main sur cet animal unique ?
À ce stade, vous devez vous dire, commencez à compter à partir de maintenant, et enfin comparez chaque nouvelle espèce de la photo à la liste.
Cependant, cette méthode de comptage courante n'est parfois pas adaptée aux informations pouvant atteindre des milliards d'entrées.
Des informaticiens de l'Institut indien de statistique, UNL, et de l'Université nationale de Singapour ont proposé un nouvel algorithme-CVM.
Il peut se rapprocher du nombre d'éléments différents dans une longue liste et n'a besoin de mémoriser qu'un petit nombre d'éléments.
Adresse papier : https://arxiv.org/pdf/2301.10191
Cet algorithme convient à toute liste dans laquelle un élément apparaît à la fois, comme le texte d'un discours, les biens sur un tapis roulant, ou des voitures sur l'autoroute.
L'algorithme CVM doit son nom aux premières lettres des trois auteurs et a fait des progrès significatifs dans la résolution du « problème des différents éléments ».
Ce problème préoccupe les informaticiens depuis plus de 40 ans.
Cela nécessite un moyen efficace de surveiller un flux d'éléments (dont le nombre total peut dépasser la mémoire disponible) et d'estimer le nombre d'éléments uniques qu'il contient.
Alors, comment l'algorithme CVM résout-il le problème ?
Algorithme CVM pionnier, le secret réside dans la "randomisation"
Supposons que vous écoutiez le livre audio "Hamlet".
Ce drame compte un total de 30557 mots, combien sont différents ?
Pour trouver la réponse, vous pouvez faire une pause pendant l'écoute, écrire chaque mot par ordre alphabétique, puis sauter les mots déjà sur la liste, et enfin, simplement compter chaque mot de la liste.
Cette méthode est réalisable, mais elle teste trop la « mémoire ».
Le chercheur Vinodchandran Variyam a déclaré : « Dans une situation typique de flux de données, il peut y avoir des millions d'éléments à suivre. Vous ne souhaiterez peut-être pas stocker toutes les informations.
Il s'agit d'un serveur cloud où les algorithmes peuvent fournir plus méthodes".
L'astuce est la "randomisation".
Vinodchandran Variyam a aidé à inventer un algorithme CVM pour estimer le nombre d'éléments distincts dans un flux de données
Combien de mots uniques y a-t-il dans "Hamlet" ? Coin Flip Challenge
Retour à "Hamlet", en supposant que votre "mémoire effective" ne peut contenir que 100 mots.
Une fois la lecture audio commencée, vous écrivez les 100 premiers mots que vous entendez et sautez les mots répétés.
Lorsque vous avez fini d'enregistrer 100 mots, il ne vous reste plus qu'à lancer une pièce pour chaque mot –
Tête, gardez le mot. Si c'est le verso, supprimez-le.
Après ce tour préliminaire, il vous restera environ 50 mots différents.
Maintenant, vous passez à ce que l'équipe appelle le premier tour, en continuant à lire Hamlet et en ajoutant de nouveaux mots.
Si vous rencontrez à nouveau un mot qui figure déjà sur la liste, lancez à nouveau la pièce jusqu'à ce que vous ayez 100 mots dans votre tableau blanc en mémoire.
Ensuite, environ la moitié des mots sont à nouveau supprimés au hasard en fonction des résultats de 100 tirages au sort. Le premier tour se termine ici.
Ensuite, entrez dans le deuxième tour du tour 2.
Comme au premier tour, nous allons augmenter la difficulté d'un mot - lorsque vous rencontrez un mot répété, lancez à nouveau la pièce.
La condition est que si c'est une queue, supprimez-la comme avant. Mais si c’est face, lancez à nouveau la pièce. Le mot n'est conservé que lorsqu'il apparaît face pour la deuxième fois.
Une fois le tableau blanc mémoire plein, terminez le tour, puis supprimez à nouveau environ la moitié des mots en fonction des résultats de 100 lancers.
Au tour 3, vous devez lancer une pièce de monnaie trois fois de suite pour tenir un mot.
Au quatrième tour, gardez un mot au recto quatre fois de suite, et ainsi de suite.
Enfin, au kième tour, vous écouterez l'intégralité de la pièce "Hamlet".
Le but de cet exercice est de s'assurer que chaque mot a la même probabilité d'occurrence : 1/2 (k).
Supposons qu'à la fin de l'audio Hamlet, vous ayez 61 mots dans votre liste et qu'il vous ait fallu six tours pour la terminer.
Vous pouvez estimer le nombre de mots différents en divisant 61 par probabilité 1/2 (6) - le résultat final de ce jeu est 3904.
La précision de l'algorithme est proportionnelle à la quantité de mémoire
Les chercheurs Chakraborty, Variyam et Meel ont prouvé mathématiquement que la précision de l'algorithme CVM est proportionnelle à la quantité de mémoire.
Et Hamlet possède 3967 mots uniques. (Par méthode de comptage ordinaire)
Dans l'expérience utilisant une mémoire de 100 mots, l'estimation moyenne des 5 séries de résultats expérimentaux est de 3955 mots.
Avec 1000 mots en mémoire, la capacité moyenne de mémoire est passée à 3964.
Variyam a déclaré : « Si (la mémoire) est suffisamment grande pour accueillir tous les mots, alors nous pouvons atteindre une précision de 100 %. »
William Kuszmau de l'Université Harvard a déclaré : "C'est un excellent exemple de la façon dont même pour des problèmes très fondamentaux et largement étudiés, il peut parfois y avoir des solutions simples mais pas évidentes à découvrir."
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Memebox 2.0 redéfinit la gestion des actifs cryptographiques grâce à une architecture innovante et à des percées de performance. 1) Il résout trois principaux points de douleur: les silos d'actifs, la désintégration du revenu et le paradoxe de la sécurité et de la commodité. 2) Grâce à des pôles d'actifs intelligents, à la gestion des risques dynamiques et aux moteurs d'amélioration du rendement, la vitesse de transfert croisée, le taux de rendement moyen et la vitesse de réponse aux incidents de sécurité sont améliorés. 3) Fournir aux utilisateurs la visualisation des actifs, l'automatisation des politiques et l'intégration de la gouvernance, réalisant la reconstruction de la valeur utilisateur. 4) Grâce à la collaboration écologique et à l'innovation de la conformité, l'efficacité globale de la plate-forme a été améliorée. 5) À l'avenir, les pools d'assurance-contrat intelligents, l'intégration du marché des prévisions et l'allocation d'actifs axés sur l'IA seront lancés pour continuer à diriger le développement de l'industrie.

Les dix principales plates-formes de trading de crypto-monnaie au monde comprennent Binance, Okx, Gate.io, Coinbase, Kraken, Huobi Global, BitFinex, Bittrex, Kucoin et Poloniex, qui fournissent toutes une variété de méthodes de trading et de puissantes mesures de sécurité.

Les fluctuations des prix de Bitcoin aujourd'hui sont affectées par de nombreux facteurs tels que la macroéconomie, les politiques et le sentiment du marché. Les investisseurs doivent prêter attention à une analyse technique et fondamentale pour prendre des décisions éclairées.

Les dix premiers échanges de devises numériques tels que Binance, OKX, Gate.io ont amélioré leurs systèmes, des transactions diversifiées efficaces et des mesures de sécurité strictes.

L'utilisation de la bibliothèque Chrono en C peut vous permettre de contrôler plus précisément les intervalles de temps et de temps. Explorons le charme de cette bibliothèque. La bibliothèque Chrono de C fait partie de la bibliothèque standard, qui fournit une façon moderne de gérer les intervalles de temps et de temps. Pour les programmeurs qui ont souffert de temps et ctime, Chrono est sans aucun doute une aubaine. Il améliore non seulement la lisibilité et la maintenabilité du code, mais offre également une précision et une flexibilité plus élevées. Commençons par les bases. La bibliothèque Chrono comprend principalement les composants clés suivants: std :: chrono :: system_clock: représente l'horloge système, utilisée pour obtenir l'heure actuelle. std :: chron

Plate-forme de trading de devises numériques fiables recommandées: 1. Okx, 2. Binance, 3. Coinbase, 4. Kraken, 5. Huobi, 6. Kucoin, 7. Bitfinex, 8. Gemini, 9. Bitstamp, 10. Poloniex, ces plates-formes sont connu

Le prix de Bitcoin varie de 20 000 $ à 30 000 $. 1. Le prix de Bitcoin a radicalement fluctué depuis 2009, atteignant près de 20 000 $ en 2017 et près de 60 000 $ en 2021. 2. Les prix sont affectés par des facteurs tels que la demande du marché, l'offre et l'environnement macroéconomique. 3. Obtenez des prix en temps réel via les échanges, les applications mobiles et les sites Web. 4. Le prix du bitcoin est très volatil, tiré par le sentiment du marché et les facteurs externes. 5. Il a une certaine relation avec les marchés financiers traditionnels et est affecté par les marchés boursiers mondiaux, la force du dollar américain, etc. 6. La tendance à long terme est optimiste, mais les risques doivent être évalués avec prudence.

Les dix premiers échanges de crypto-monnaie au monde en 2025 incluent Binance, Okx, Gate.io, Coinbase, Kraken, Huobi, Bitfinex, Kucoin, Bittrex et Poloniex, qui sont tous connus pour leur volume et leur sécurité commerciaux élevés.
