Lorsque nous utilisons les outils BI, les questions que nous rencontrons souvent sont : "Comment pouvons-nous produire et traiter des données si nous ne connaissons pas SQL ? Pouvons-nous faire de l'analyse minière si nous ne connaissons pas les algorithmes ?" L'équipe d'algorithmes professionnels effectue l'exploration de données, l'analyse et la visualisation des données apparaîtront également relativement fragmentées. Réaliser les travaux de modélisation d’algorithmes et d’analyse de données de manière rationalisée est également un bon moyen d’améliorer l’efficacité.
Dans le même temps, pour les équipes professionnelles d'entrepôt de données, le contenu des données avec le même thème est confronté au problème de « construction répétée, utilisation et gestion relativement dispersées » : existe-t-il un moyen de produire des données avec le même thème et un contenu différent en même temps ? en même temps dans une tâche ? L’ensemble de données produit peut-il être utilisé comme entrée pour participer à nouveau à la construction des données ?
1. La capacité de modélisation visuelle de DataWind est là
Les utilisateurs peuvent simplifier le processus complexe de traitement et de modélisation des données en un processus de canevas clair et facile à comprendre grâce à des opérations visuelles de glisser, d'extraire et de connexion. Tous les types d'utilisateurs peuvent effectuer la production et le traitement des données selon l'idée de. Ce qu'ils veulent, c'est ce qu'ils obtiennent, réduisant ainsi le seuil d'acquisition de données.
Canvas prend en charge la création de plusieurs ensembles de processus de canevas en même temps. Une image peut réaliser la construction de plusieurs tâches de modélisation de données, améliorer l'efficacité de la construction de données et réduire les coûts de gestion des tâches. De plus, Canvas intègre et encapsule plus de 40 ; types d'algorithmes de nettoyage de données et d'ingénierie de fonctionnalités. Il couvre les capacités de production de données de base à avancées et ne nécessite pas de codage pour compléter les capacités de données complexes.
2. Outils SQL à seuil zéro
Pour les utilisateurs non techniques, il existe un certain seuil pour l'utilisation de la syntaxe SQL. Dans le même temps, les fichiers locaux ne peuvent pas être mis à jour régulièrement, ce qui nécessite de refaire manuellement le tableau de bord à chaque fois. La main-d'œuvre technique requise pour obtenir les données doit souvent être planifiée, et la rapidité et la satisfaction de l'acquisition des données sont considérablement réduites. Il est donc particulièrement important d'utiliser des outils de construction de données sans code.
Voici deux scénarios typiques sur la façon dont le traitement des données à seuil zéro est appliqué au travail.
2.1 [Scénario 1] Ce que vous pensez est ce que vous obtenez, le processus de traitement des données est terminé visuellement
Si vous souhaitez obtenir le nombre de commandes et le montant de la commande en fonction de la date et de la granularité de la ville, et obtenir les données de la ville des 10 principales données du montant de la consommation quotidienne, le fonctionnement est le suivant :
Processus général de traitement des données |
Processus de modélisation visuelle |
|
|
Dans le processus de traitement des données, plusieurs sources de données doivent être combinées et utilisées. Il est difficile de maîtriser un niveau élevé. Vlookup et d'autres algorithmes via Excel, et prend beaucoup de temps. Dans le même temps, lorsque la quantité de données est importante, les performances de l'ordinateur peuvent ne pas être en mesure de terminer le calcul combiné des données.
S'il existe deux données de commande avec une quantité de données relativement importante et un tableau d'informations sur les attributs du client, le montant du bénéfice doit être calculé en fonction du montant de la facture et du montant du coût, puis les 100 principales informations de commande des utilisateurs sont prises en fonction de la contribution aux bénéfices
Processus général de traitement des données |
Processus de traitement de modélisation visuelle |
|
|
Lorsque le nettoyage de base des données ne peut plus satisfaire la construction et l'analyse des données, la prise en charge de l'algorithme d'IA est nécessaire pour extraire davantage de valeurs cachées dans les données. Les étudiants de l'équipe d'algorithmes peuvent souffrir de l'incapacité de bien travailler avec des graphiques visuels et ne peuvent pas produire de bonnes données pouvant être appliquées rapidement, tandis que les utilisateurs ordinaires peuvent être directement supprimés par le seuil élevé du code de l'IA pour supprimer le développement de cet algorithme. augmenter la demande mais craindre la demande. C'est trop superficiel et la valeur ne peut pas être bien évaluée. À l'heure actuelle, l'extraction d'algorithmes devient un luxe.
La modélisation visuelle de DataWind encapsule plus de 30 types de capacités courantes d'opérateur d'IA. Les utilisateurs doivent uniquement comprendre le rôle de l'algorithme et configurer les cibles d'entrée et de formation de l'opérateur d'algorithme via la configuration pour terminer la formation du modèle en fonction de la prédiction Get configurée. résultats rapidement pour d’autres contenus de données.
Ce qui suit prendra deux scénarios typiques comme exemples pour vous montrer comment réaliser l'exploration de données en Python.
Le travail quotidien des utilisateurs n'implique fondamentalement pas l'écriture de Python, mais il existe des scénarios de demande pour l'exploration de données. Il doit effectuer une exploration des intentions des clients sur la base d'échantillons de clients existants à forte intention. À ce stade, le processus d'exploration de données peut être construit via une modélisation visuelle :
Les utilisateurs doivent créer un modèle de rachat d'utilisateurs basé sur les données existantes. Lors de la création du modèle, il est nécessaire d'utiliser un arbre d'amplification de gradient pour créer un modèle de prédiction après le nettoyage des données et la conversion du format. À ce stade, le processus de modèle de rachat peut être construit sur la base d'une modélisation visuelle :
En tant qu'analyste de données, vous avez également beaucoup de travail quotidien pour construire des ensembles de données et construire des tableaux de bord de données. Mais généralement, le tableau du bas obtenu à partir de l'entrepôt de données sera un tableau large. Sur cette base, différentes tâches d'ensemble de données sont construites en fonction des différentes exigences du scénario.
Lors des utilisations ultérieures, nous rencontrons souvent de plus en plus d'ensembles de données similaires, mais la logique spécifique ne peut pas être bien comparée et confirmée. À l'heure actuelle, ce serait formidable si toute la logique de l'ensemble de données était configurée et générée dans un seul ensemble de données, et que chaque ensemble de données puisse être jugé et défini via le processus de tâche.
Pour ce scénario, les capacités de modélisation visuelle de DataWind peuvent également être très bien complétées. La fonction de modélisation visuelle prend en charge un seul ensemble de données devant être traité par plusieurs processus logiques en même temps pour générer plusieurs ensembles de données. Prenons l'exemple du traitement des données de commande et des données utilisateur :
5. À propos de nous
Volcano Engine Intelligent Data Insights DataWindest une plate-forme ABI améliorée qui prend en charge l'analyse en libre-service au niveau détaillé du Big Data. De l'accès aux données, à l'intégration des données, en passant par les requêtes et l'analyse, elles sont enfin présentées aux utilisateurs professionnels sous la forme de portails de données visuels, de grands écrans numériques et de cockpits de gestion, permettant aux données d'exercer de la valeur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!