


Comment utiliser des ensembles Python pour des données uniques?
Cet article explique Python Sets, une structure de données pour stocker des éléments uniques. Il détaille la création de définir, d'ajouter / d'éliminer les éléments, de définir des opérations (union, intersection, etc.), et leur utilisation efficace dans le nettoyage des données (suppression en double, identification
Comment utiliser des ensembles Python pour des données uniques?
Les ensembles Python sont une puissante structure de données spécialement conçue pour stocker des éléments uniques. Contrairement aux listes ou aux tuples, les ensembles ne permettent pas de valeurs en double. Cela les rend incroyablement utiles pour les tâches impliquant une identification et une manipulation uniques des données. Voici comment les utiliser:
Création d'un ensemble: Vous pouvez créer un ensemble à l'aide de Broly Braces {}
ou du constructeur set()
. Par exemple:
<code class="python"># Using curly braces my_set = {1, 2, 3, 3, 4, 5} # Duplicates are automatically removed print(my_set) # Output: {1, 2, 3, 4, 5} # Using the set() constructor my_list = [1, 2, 2, 3, 4, 4, 5] my_set = set(my_list) print(my_set) # Output: {1, 2, 3, 4, 5}</code>
Ajout et supprimer des éléments: vous pouvez ajouter des éléments à l'aide de la méthode add()
et supprimer les éléments à l'aide des méthodes remove()
ou discard()
. remove()
soulève une KeyError
si l'élément n'est pas trouvé, tandis que discard()
ne le fait pas.
<code class="python">my_set.add(6) print(my_set) # Output: {1, 2, 3, 4, 5, 6} my_set.remove(3) print(my_set) # Output: {1, 2, 4, 5, 6} my_set.discard(7) # No error even though 7 is not present print(my_set) # Output: {1, 2, 4, 5, 6}</code>
Opérations de set: les ensembles de python prennent en charge diverses opérations de jeu mathématique comme Union ( |
), Intersection ( &
), Différence ( -
) et Symmét Difference ( ^
). Ceux-ci sont très efficaces pour les tâches comme trouver des éléments communs ou des éléments uniques entre les ensembles.
<code class="python">set1 = {1, 2, 3} set2 = {3, 4, 5} union_set = set1 | set2 # or set1.union(set2) print(union_set) # Output: {1, 2, 3, 4, 5} intersection_set = set1 & set2 # or set1.intersection(set2) print(intersection_set) # Output: {3} difference_set = set1 - set2 # or set1.difference(set2) print(difference_set) # Output: {1, 2} symmetric_difference_set = set1 ^ set2 # or set1.symmetric_difference(set2) print(symmetric_difference_set) # Output: {1, 2, 4, 5}</code>
Quels sont les cas d'utilisation courants pour les ensembles de python dans le nettoyage des données?
Les ensembles Python sont inestimables dans le nettoyage des données en raison de leur capacité à gérer efficacement les valeurs uniques. Voici quelques cas d'utilisation courants:
- Suppression des doublons: il s'agit de l'application la plus simple. La conversion d'une liste ou d'une autre séquence en un ensemble supprime automatiquement les doublons.
- Identifier les valeurs uniques: les ensembles vous permettent de déterminer rapidement les éléments uniques présents dans un ensemble de données, fournissant des informations sur la composition des données.
- Trouver des valeurs manquantes: en comparant les ensembles représentant des valeurs attendues et des valeurs observées, vous pouvez facilement identifier les points de données manquants.
- Comparaison des ensembles de données: les ensembles facilitent les comparaisons entre les ensembles de données, la révélation des éléments communs, les éléments uniques à chaque ensemble de données et les éléments présents dans l'un mais pas l'autre.
- Déduplication des données: Dans les ensembles de données plus importants, les ensembles peuvent être utilisés pour identifier et supprimer efficacement des enregistrements en double basés sur des champs de clés spécifiques.
Dans quelle mesure les ensembles de Python sont-ils efficaces par rapport aux autres structures de données pour trouver des éléments uniques?
Les ensembles Python sont très efficaces pour trouver des éléments uniques par rapport à d'autres structures de données comme les listes ou les dictionnaires. Cette efficacité découle de leur implémentation sous-jacente à l'aide de tables de hachage.
- Temps de recherche: La vérification de l'existence d'un élément dans un ensemble a une complexité de temps moyenne d'O (1) (temps constant), ce qui signifie que le temps pris n'augmente pas considérablement avec la taille de l'ensemble. Les listes, en revanche, nécessitent O (n) (temps linéaire) pour la recherche.
- Temps d'insertion: l'ajout d'un élément à un ensemble prend également O (1) en moyenne. L'insertion d'une liste prend o (n) dans le pire des cas (si vous devez insérer au début).
- Utilisation de la mémoire: Bien que les ensembles puissent utiliser plus de mémoire que les listes pour les petits ensembles de données, leur efficacité dans les grands ensembles de données les rend plus éconergétiques plus économes en mémoire pour une identification unique des éléments.
Puis-je utiliser des ensembles Python avec différents types de données simultanément?
Non, vous ne pouvez pas utiliser directement des ensembles Python avec différents types de données immuables simultanément. Un ensemble doit contenir des éléments du même type immuable. Cette restriction est due à la façon dont les tables de hachage fonctionnent en interne. La fonction de hachage a besoin d'un moyen cohérent de cartographier les éléments à leurs emplacements dans la table de hachage, et cette cohérence est plus facile à garantir lorsque les éléments sont de même type immuable (comme les entiers, les cordes, les tuples de la même structure). Essayer de mélanger différents types immuables se traduira par une TypeError
.
Cependant, vous pouvez utiliser des ensembles de tuples si vous avez besoin de stocker des collections de différents types de données ensemble. Par exemple:
<code class="python">my_set = {(1, 'a'), (2, 'b'), (3, 'c')} # This is allowed.</code>
Dans ce cas, chaque élément de l'ensemble est un tuple, en maintenant la cohérence de type dans l'ensemble. Vous ne pouvez cependant pas mélanger les tuples avec des entiers directement dans le même ensemble.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Comment éviter d'être détecté lors de l'utilisation de FiddlereVerywhere pour les lectures d'homme dans le milieu lorsque vous utilisez FiddlereVerywhere ...

Lorsque vous utilisez la bibliothèque Pandas de Python, comment copier des colonnes entières entre deux frames de données avec différentes structures est un problème courant. Supposons que nous ayons deux dats ...

Comment Uvicorn écoute-t-il en permanence les demandes HTTP? Uvicorn est un serveur Web léger basé sur ASGI. L'une de ses fonctions principales est d'écouter les demandes HTTP et de procéder ...

Fastapi ...

Utilisation de Python dans Linux Terminal ...

Comment enseigner les bases de la programmation novice en informatique dans les 10 heures? Si vous n'avez que 10 heures pour enseigner à l'informatique novice des connaissances en programmation, que choisissez-vous d'enseigner ...

Comprendre la stratégie anti-rampe d'investissement.com, Beaucoup de gens essaient souvent de ramper les données d'actualités sur Investing.com (https://cn.investing.com/news/latest-news) ...
