Table des matières
Comment utiliser des ensembles Python pour des données uniques?
Quels sont les cas d'utilisation courants pour les ensembles de python dans le nettoyage des données?
Dans quelle mesure les ensembles de Python sont-ils efficaces par rapport aux autres structures de données pour trouver des éléments uniques?
Puis-je utiliser des ensembles Python avec différents types de données simultanément?
Maison développement back-end Tutoriel Python Comment utiliser des ensembles Python pour des données uniques?

Comment utiliser des ensembles Python pour des données uniques?

Mar 10, 2025 pm 05:14 PM

Cet article explique Python Sets, une structure de données pour stocker des éléments uniques. Il détaille la création de définir, d'ajouter / d'éliminer les éléments, de définir des opérations (union, intersection, etc.), et leur utilisation efficace dans le nettoyage des données (suppression en double, identification

Comment utiliser des ensembles Python pour des données uniques?

Comment utiliser des ensembles Python pour des données uniques?

Les ensembles Python sont une puissante structure de données spécialement conçue pour stocker des éléments uniques. Contrairement aux listes ou aux tuples, les ensembles ne permettent pas de valeurs en double. Cela les rend incroyablement utiles pour les tâches impliquant une identification et une manipulation uniques des données. Voici comment les utiliser:

Création d'un ensemble: Vous pouvez créer un ensemble à l'aide de Broly Braces {} ou du constructeur set() . Par exemple:

 <code class="python"># Using curly braces my_set = {1, 2, 3, 3, 4, 5} # Duplicates are automatically removed print(my_set) # Output: {1, 2, 3, 4, 5} # Using the set() constructor my_list = [1, 2, 2, 3, 4, 4, 5] my_set = set(my_list) print(my_set) # Output: {1, 2, 3, 4, 5}</code>
Copier après la connexion

Ajout et supprimer des éléments: vous pouvez ajouter des éléments à l'aide de la méthode add() et supprimer les éléments à l'aide des méthodes remove() ou discard() . remove() soulève une KeyError si l'élément n'est pas trouvé, tandis que discard() ne le fait pas.

 <code class="python">my_set.add(6) print(my_set) # Output: {1, 2, 3, 4, 5, 6} my_set.remove(3) print(my_set) # Output: {1, 2, 4, 5, 6} my_set.discard(7) # No error even though 7 is not present print(my_set) # Output: {1, 2, 4, 5, 6}</code>
Copier après la connexion

Opérations de set: les ensembles de python prennent en charge diverses opérations de jeu mathématique comme Union ( | ), Intersection ( & ), Différence ( - ) et Symmét Difference ( ^ ). Ceux-ci sont très efficaces pour les tâches comme trouver des éléments communs ou des éléments uniques entre les ensembles.

 <code class="python">set1 = {1, 2, 3} set2 = {3, 4, 5} union_set = set1 | set2 # or set1.union(set2) print(union_set) # Output: {1, 2, 3, 4, 5} intersection_set = set1 & set2 # or set1.intersection(set2) print(intersection_set) # Output: {3} difference_set = set1 - set2 # or set1.difference(set2) print(difference_set) # Output: {1, 2} symmetric_difference_set = set1 ^ set2 # or set1.symmetric_difference(set2) print(symmetric_difference_set) # Output: {1, 2, 4, 5}</code>
Copier après la connexion

Quels sont les cas d'utilisation courants pour les ensembles de python dans le nettoyage des données?

Les ensembles Python sont inestimables dans le nettoyage des données en raison de leur capacité à gérer efficacement les valeurs uniques. Voici quelques cas d'utilisation courants:

  • Suppression des doublons: il s'agit de l'application la plus simple. La conversion d'une liste ou d'une autre séquence en un ensemble supprime automatiquement les doublons.
  • Identifier les valeurs uniques: les ensembles vous permettent de déterminer rapidement les éléments uniques présents dans un ensemble de données, fournissant des informations sur la composition des données.
  • Trouver des valeurs manquantes: en comparant les ensembles représentant des valeurs attendues et des valeurs observées, vous pouvez facilement identifier les points de données manquants.
  • Comparaison des ensembles de données: les ensembles facilitent les comparaisons entre les ensembles de données, la révélation des éléments communs, les éléments uniques à chaque ensemble de données et les éléments présents dans l'un mais pas l'autre.
  • Déduplication des données: Dans les ensembles de données plus importants, les ensembles peuvent être utilisés pour identifier et supprimer efficacement des enregistrements en double basés sur des champs de clés spécifiques.

Dans quelle mesure les ensembles de Python sont-ils efficaces par rapport aux autres structures de données pour trouver des éléments uniques?

Les ensembles Python sont très efficaces pour trouver des éléments uniques par rapport à d'autres structures de données comme les listes ou les dictionnaires. Cette efficacité découle de leur implémentation sous-jacente à l'aide de tables de hachage.

  • Temps de recherche: La vérification de l'existence d'un élément dans un ensemble a une complexité de temps moyenne d'O (1) (temps constant), ce qui signifie que le temps pris n'augmente pas considérablement avec la taille de l'ensemble. Les listes, en revanche, nécessitent O (n) (temps linéaire) pour la recherche.
  • Temps d'insertion: l'ajout d'un élément à un ensemble prend également O (1) en moyenne. L'insertion d'une liste prend o (n) dans le pire des cas (si vous devez insérer au début).
  • Utilisation de la mémoire: Bien que les ensembles puissent utiliser plus de mémoire que les listes pour les petits ensembles de données, leur efficacité dans les grands ensembles de données les rend plus éconergétiques plus économes en mémoire pour une identification unique des éléments.

Puis-je utiliser des ensembles Python avec différents types de données simultanément?

Non, vous ne pouvez pas utiliser directement des ensembles Python avec différents types de données immuables simultanément. Un ensemble doit contenir des éléments du même type immuable. Cette restriction est due à la façon dont les tables de hachage fonctionnent en interne. La fonction de hachage a besoin d'un moyen cohérent de cartographier les éléments à leurs emplacements dans la table de hachage, et cette cohérence est plus facile à garantir lorsque les éléments sont de même type immuable (comme les entiers, les cordes, les tuples de la même structure). Essayer de mélanger différents types immuables se traduira par une TypeError .

Cependant, vous pouvez utiliser des ensembles de tuples si vous avez besoin de stocker des collections de différents types de données ensemble. Par exemple:

 <code class="python">my_set = {(1, 'a'), (2, 'b'), (3, 'c')} # This is allowed.</code>
Copier après la connexion

Dans ce cas, chaque élément de l'ensemble est un tuple, en maintenant la cohérence de type dans l'ensemble. Vous ne pouvez cependant pas mélanger les tuples avec des entiers directement dans le même ensemble.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Comment résoudre le problème des autorisations rencontré lors de la visualisation de la version Python dans le terminal Linux? Comment résoudre le problème des autorisations rencontré lors de la visualisation de la version Python dans le terminal Linux? Apr 01, 2025 pm 05:09 PM

Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Comment éviter d'être détecté par le navigateur lors de l'utilisation de Fiddler partout pour la lecture de l'homme au milieu? Comment éviter d'être détecté par le navigateur lors de l'utilisation de Fiddler partout pour la lecture de l'homme au milieu? Apr 02, 2025 am 07:15 AM

Comment éviter d'être détecté lors de l'utilisation de FiddlereVerywhere pour les lectures d'homme dans le milieu lorsque vous utilisez FiddlereVerywhere ...

Comment copier efficacement la colonne entière d'une dataframe dans une autre dataframe avec différentes structures dans Python? Comment copier efficacement la colonne entière d'une dataframe dans une autre dataframe avec différentes structures dans Python? Apr 01, 2025 pm 11:15 PM

Lorsque vous utilisez la bibliothèque Pandas de Python, comment copier des colonnes entières entre deux frames de données avec différentes structures est un problème courant. Supposons que nous ayons deux dats ...

Comment Uvicorn écoute-t-il en permanence les demandes HTTP sans servir_forever ()? Comment Uvicorn écoute-t-il en permanence les demandes HTTP sans servir_forever ()? Apr 01, 2025 pm 10:51 PM

Comment Uvicorn écoute-t-il en permanence les demandes HTTP? Uvicorn est un serveur Web léger basé sur ASGI. L'une de ses fonctions principales est d'écouter les demandes HTTP et de procéder ...

Comment enseigner les bases de la programmation novice en informatique dans le projet et les méthodes axées sur les problèmes dans les 10 heures? Comment enseigner les bases de la programmation novice en informatique dans le projet et les méthodes axées sur les problèmes dans les 10 heures? Apr 02, 2025 am 07:18 AM

Comment enseigner les bases de la programmation novice en informatique dans les 10 heures? Si vous n'avez que 10 heures pour enseigner à l'informatique novice des connaissances en programmation, que choisissez-vous d'enseigner ...

Comment obtenir des données d'information en contournant le mécanisme anti-frawler d'Investing.com? Comment obtenir des données d'information en contournant le mécanisme anti-frawler d'Investing.com? Apr 02, 2025 am 07:03 AM

Comprendre la stratégie anti-rampe d'investissement.com, Beaucoup de gens essaient souvent de ramper les données d'actualités sur Investing.com (https://cn.investing.com/news/latest-news) ...

See all articles