Comment interroger la valeur quantile dans MySQL-tutoriel mysql-php.cn

Table des matières

Contexte

Contexte commercial

Pensée

Effet

Maison

base de données

tutoriel mysql

Comment interroger la valeur quantile dans MySQL

王林

May 27, 2023 pm 04:36 PM

mysql

Contexte

Le concept de valeur quantile

Dans les statistiques et l'analyse des données, les quantiles (ou quartiles) sont souvent utilisés pour décrire les caractéristiques statistiques de la distribution des données. Généralement, la valeur du quantile est divisée en quatre parties égales, à savoir le premier quantile (Q1), le deuxième quantile (Q2) (c'est-à-dire la médiane), le troisième quantile (Q3) et la différence extrême (IQR). Parmi eux, 1/4 des données sont inférieurs au premier quantile, 1/4 des données sont supérieurs au troisième quantile et les 50 % intermédiaires des données se situent entre le premier quantile et le troisième quantile. En statistiques, le premier quantile fait référence au nombre se trouvant dans les 25 % supérieurs de la séquence entière après qu'un ensemble de données a été classé par ordre de taille ; le deuxième quantile fait référence à un ensemble de données classé par ordre de taille en dernier, le nombre. en position médiane ; et le troisième quantile fait référence au nombre dans les 25 % inférieurs de la séquence entière après qu'un ensemble de données a été classé par ordre de taille. La médiane est le deuxième quartile. Dans l'analyse des données, les valeurs quantiles peuvent nous aider à comprendre la distribution des données et à déterminer si les données sont biaisées d'un côté ou dans quelle mesure elles sont dispersées. Lorsque la distribution des données est inégale, les valeurs quantiles peuvent représenter plus précisément les différences entre les données.

Contexte commercial

La plage de distribution des coupures émises par les commerçants est de [1, 20], et chaque coupon sera marqué de sa dénomination correspondante. Pour contrôler avec précision le coût des coupons, il est nécessaire de comprendre l'émission des coupons en temps réel afin de procéder à une évaluation plus précise. Grâce à la surveillance en temps réel du montant des coupons émis, du montant moyen des coupons émis et de la valeur quantile du montant émis (compréhension du montant moyen des coupons émis à différents intervalles), vous pouvez avoir une compréhension plus claire de l'émission de bons de réduction.

Actuellement, l'entreprise a trié les indicateurs suivants et les étudiants qui ont besoin de données les fourniront. Tous les indicateurs sont basés sur une granularité statistique minutieuse :

Montant émis : montant total des coupons émis

Montant moyen des coupons émis : montant total. émis/montant total émis

Coupons émis Montant 0,1 centile moyen : le nombre de coupons émis par minute est trié par dénomination, avec les dénominations les plus grandes devant et les dénominations plus petites plus tard. Calculez la valeur moyenne des 10 % des coupons émis par minute. minute [par exemple, l'ordre des dénominations des coupons est : 10, 9, 8, 8, 6, 5, 4, 4, 2, 2, alors la moyenne du quantile 0,1 est 10]

La moyenne du quantile 0,2 du montant du coupon : le nombre de coupons émis par minute est basé sur la dénomination. Triez par taille, avec les coupures les plus grandes devant et les coupures plus petites ensuite. Calculez la valeur moyenne des 20 % les plus élevés des coupons émis par minute [par exemple, l'ordre de coupure des coupons). émis est : 10,9,8,8, 6, 5, 4, 4, 2, 2, alors la moyenne du 0,2 percentile est (10+9)/2=9,5]

Indicateurs tels que le volume d'émission et la moyenne le montant du coupon peut être implémenté à l'aide de MySQL, alors comment implémenter et utiliser Qu'en est-il de l'interrogation des valeurs quantiles dans MySQL ?

Pensée

MySQL implémente le tri

row_number() over ( partition by a1.min order by metric_value desc) as orderNum

Copier après la connexion

metric_value représente le nombre de coupons émis Grâce à la fonction ci-dessus, il peut être trié par le nombre de coupons émis, et les données des coupons émis par minute sont triées par le montant

MySQL. implémente topN

SELECT * FROM sales ORDER BY amount DESC LIMIT 10;

Copier après la connexion

C'est évident, cette méthode topN ne peut pas réaliser un tri par minutes, et les N% supérieurs sont pris en compte. Afin de connaître le montant de N%, nous devons d’abord déterminer le montant total, nous devons donc d’abord calculer le montant total par minute. Multipliez-le ensuite par N% pour savoir de quelle quantité de données nous avons besoin pour extraire N%.

select hour,min, count(1) as cn 
from table  
where dt=20230423 and hour=11 and min>=0 and min<=30 
group by hour,min

Copier après la connexion

Ensuite, nous multiplions les résultats statistiques par N%

select dt,a2.hour,a2.min as min,metric_value, round(cn*N%) as cn, orderNum 
from ( 
	select dt,hour,a1.min as min, 
	metric_value, row_number() over ( partition by a1.min order by metric_value desc) as orderNum 
	from table a1 
	where dt=20230423 and hour=11 and min>=0 and min<=30 
	) as a2 
inner join ( 
	select hour,min , count(1) as cn 
	from table c 
	where dt=20230423 and hour=11 and min>=0 and min<=30  
	group by hour,min ) a3
on a2.hour=a3.hour and a2.min=a3.min

Copier après la connexion

De cette façon, nous pouvons l'obtenir en comparant la taille de cn (la quantité de données nécessaire pour calculer la valeur du quantile) et orderNum (l'ordre dans lequel le courant les coupons sont triés par dénomination) Obtenez les premiers N% des données, puis effectuez un traitement moyen sur cette partie des données pour obtenir les données de valeur quantile.

Ajustez la logique de calcul et fusionnez-la pour obtenir le SQL de la valeur centile comme suit :

select dt,hour,min, round(avg(metric_value)) as metric_value 
from ( 
	select dt,a2.hour,a2.min as min,metric_value, round(cn*?) as cn, orderNum 
from ( 
	select dt,hour,a1.min as min,
	metric_value, row_number() over ( partition by a1.min order by metric_value desc) as orderNum 
	from table a1 
	where dt=20230423 and hour=11 and min>=0 and min<=30 
	) as a2 
inner join ( 
	select hour,min, count(1) as cn 
	from table a1 
	where dt=20230423 and hour=11 and min>=0 and min<=30 
	) as a3
on a2.hour=a3.hour and a2.min=a3.min ) as q 
where cn>orderNum 
group by dt,hour,min 
order by dt,hour,min

Copier après la connexion

Ces données sont dans la plage de calcul des statistiques de valeur centile si cn > orderNum.. Afin de calculer la valeur centile de 0,1, les premiers 10 % des données d'émission de coupons par minute doivent être collectés. Après tri par dénomination et regroupement par minutes, chaque enregistrement sera marqué du rang du disque. Le nombre total de coupons émis par minute est multiplié par 10 % pour obtenir cnt. Cette valeur est la quantité de données requise pour calculer la moyenne de 0,1 minute de cette minute. Lorsque cnt

Explication Avant d'utiliser MySQL pour calculer la valeur du quantile, la valeur du quantile était toujours implémentée en interrogeant les données d'émission de coupons par minute via un programme Java, puis en triant et en calculant la moyenne. Le plus gros problème de la mise en œuvre du programme est que si le nombre de coupons émis est relativement important, il faudra alors interroger les indicateurs de valeur quantile pour une période donnée, ce qui exercera une forte pression sur le programme. En fait, nous rencontrons ce problème dans notre activité actuelle. Chaque fois que vous interrogez 2 heures de données de valeur quantile, plus d'un million de données seront chargées dans le programme Java, ce qui est extrêmement effrayant pour les services de requête de données. Afin de résoudre ce problème, nous devons implémenter la requête de valeurs quantiles via MySQL.

Effet

Les données détaillées sont interrogées par le programme pour calculer la valeur du quantile --> MySQL implémente une requête directe de la valeur du quantile

La performance est de >1 min --> dans les 15 secondes ; amélioré

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Commandes de chat et comment les utiliser

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7529

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

MySQL: Concepts simples pour l'apprentissage facile Apr 10, 2025 am 09:29 AM

MySQL est un système de gestion de base de données relationnel open source. 1) Créez une base de données et des tables: utilisez les commandes CreateDatabase et CreateTable. 2) Opérations de base: insérer, mettre à jour, supprimer et sélectionner. 3) Opérations avancées: jointure, sous-requête et traitement des transactions. 4) Compétences de débogage: vérifiez la syntaxe, le type de données et les autorisations. 5) Suggestions d'optimisation: utilisez des index, évitez de sélectionner * et utilisez les transactions.

Comment ouvrir phpmyadmin Apr 10, 2025 pm 10:51 PM

Vous pouvez ouvrir PHPMYADMIN via les étapes suivantes: 1. Connectez-vous au panneau de configuration du site Web; 2. Trouvez et cliquez sur l'icône PHPMYADMIN; 3. Entrez les informations d'identification MySQL; 4. Cliquez sur "Connexion".

Comment créer Navicat Premium Apr 09, 2025 am 07:09 AM

Créez une base de données à l'aide de NAVICAT Premium: Connectez-vous au serveur de base de données et entrez les paramètres de connexion. Cliquez avec le bouton droit sur le serveur et sélectionnez Créer une base de données. Entrez le nom de la nouvelle base de données et le jeu de caractères spécifié et la collation. Connectez-vous à la nouvelle base de données et créez le tableau dans le navigateur d'objet. Cliquez avec le bouton droit sur le tableau et sélectionnez Insérer des données pour insérer les données.

Comment créer une nouvelle connexion à MySQL dans Navicat Apr 09, 2025 am 07:21 AM

Vous pouvez créer une nouvelle connexion MySQL dans NAVICAT en suivant les étapes: ouvrez l'application et sélectionnez une nouvelle connexion (CTRL N). Sélectionnez "MySQL" comme type de connexion. Entrez l'adresse Hostname / IP, le port, le nom d'utilisateur et le mot de passe. (Facultatif) Configurer les options avancées. Enregistrez la connexion et entrez le nom de la connexion.

MySQL et SQL: Compétences essentielles pour les développeurs Apr 10, 2025 am 09:30 AM

MySQL et SQL sont des compétences essentielles pour les développeurs. 1.MySQL est un système de gestion de base de données relationnel open source, et SQL est le langage standard utilisé pour gérer et exploiter des bases de données. 2.MySQL prend en charge plusieurs moteurs de stockage via des fonctions de stockage et de récupération de données efficaces, et SQL termine des opérations de données complexes via des instructions simples. 3. Les exemples d'utilisation comprennent les requêtes de base et les requêtes avancées, telles que le filtrage et le tri par condition. 4. Les erreurs courantes incluent les erreurs de syntaxe et les problèmes de performances, qui peuvent être optimisées en vérifiant les instructions SQL et en utilisant des commandes Explication. 5. Les techniques d'optimisation des performances incluent l'utilisation d'index, d'éviter la numérisation complète de la table, d'optimiser les opérations de jointure et d'améliorer la lisibilité du code.

MySQL: une introduction à la base de données la plus populaire au monde Apr 12, 2025 am 12:18 AM

MySQL est un système de gestion de la base de données relationnel open source, principalement utilisé pour stocker et récupérer les données rapidement et de manière fiable. Son principe de travail comprend les demandes des clients, la résolution de requête, l'exécution des requêtes et les résultats de retour. Des exemples d'utilisation comprennent la création de tables, l'insertion et la question des données et les fonctionnalités avancées telles que les opérations de jointure. Les erreurs communes impliquent la syntaxe SQL, les types de données et les autorisations, et les suggestions d'optimisation incluent l'utilisation d'index, les requêtes optimisées et la partition de tables.

Comment utiliser un seul fileté redis Apr 10, 2025 pm 07:12 PM

Redis utilise une architecture filetée unique pour fournir des performances élevées, une simplicité et une cohérence. Il utilise le multiplexage d'E / S, les boucles d'événements, les E / S non bloquantes et la mémoire partagée pour améliorer la concurrence, mais avec des limites de limitations de concurrence, un point d'échec unique et inadapté aux charges de travail à forte intensité d'écriture.

Comment récupérer les données après que SQL supprime les lignes Apr 09, 2025 pm 12:21 PM

La récupération des lignes supprimées directement de la base de données est généralement impossible à moins qu'il n'y ait un mécanisme de sauvegarde ou de retour en arrière. Point clé: Rollback de la transaction: Exécutez Rollback avant que la transaction ne s'engage à récupérer les données. Sauvegarde: la sauvegarde régulière de la base de données peut être utilisée pour restaurer rapidement les données. Instantané de la base de données: vous pouvez créer une copie en lecture seule de la base de données et restaurer les données après la suppression des données accidentellement. Utilisez la déclaration de suppression avec prudence: vérifiez soigneusement les conditions pour éviter la suppression accidentelle de données. Utilisez la clause WHERE: Spécifiez explicitement les données à supprimer. Utilisez l'environnement de test: testez avant d'effectuer une opération de suppression.

See all articles