


Ajoutez dynamiquement des attributs et générez des objets dans les classes Python
Cet article résoudra le problème un par un à travers les aspects suivants
1. Principales fonctions du programme
2. Mise en œuvre process
3. Définition de la classe
4. Utiliser le générateur pour mettre à jour dynamiquement chaque objet et renvoyer l'objet
5. Utiliser strip pour supprimer les caractères inutiles
6. rematcher la chaîne correspondante
7. Utilisez timestrptime pour extraire la chaîne et la convertir en un objet temporel
8. Code complet
Principales fonctions du programme
Il existe désormais un document sous forme de tableau qui stocke les informations utilisateur : la première ligne est Attributs, chaque attribut est séparé par des virgules (,). À partir de la deuxième ligne, chaque ligne est la valeur correspondant à chaque attribut, et chaque ligne représente un utilisateur. Comment lire ce document et générer un objet utilisateur par ligne ?
Il y a aussi 4 petites exigences :
Chaque document est très volumineux. Si autant d'objets générés par toutes les lignes sont stockés dans une liste et renvoyés en même temps, la mémoire s'effondrera. Un seul objet généré par ligne peut être stocké dans le programme à la fois.
Chaque chaîne séparée par des virgules peut être précédée ou suivie de guillemets doubles (") ou de guillemets simples ('). Par exemple, "Zhang San", les guillemets doivent être supprimés ; si c'est un nombre, il peut être quelque chose comme 000000001.24 , vous devez supprimer tous les chiffres et 0 précédents et extraire 1.24
Il y a une heure dans le document, qui peut être sous la forme du 29/10/2013, ou elle peut être sous la forme du 29/10/2013 2:23:56, Pour convertir une telle chaîne en un type d'heure
il existe de nombreux documents de ce type, chacun avec des attributs différents. Par exemple, il s'agit d'informations utilisateur, et il s'agit des enregistrements d'appels, donc les attributs spécifiques de la classe sont qui doivent être générés dynamiquement en fonction de la première ligne du document
Processus de mise en œuvre
1. Définition de la classe
et <.>. De plus, utilisez une liste updateAttributes()
pour stocker les attributs et les dictionnaires updatePairs()
Mappage de stockage. La fonction attributes
est un constructeur avant attrilist
indique une variable privée et ne peut pas être appelée directement à l'extérieur. Il suffit de init()
__attributes
a=UserInfo()
class UserInfo(object): 'Class to restore UserInformation' def __init__ (self): self.attrilist={} self.__attributes=[] def updateAttributes(self,attributes): self.__attributes=attributes def updatePairs(self,values): for i in range(len(values)): self.attrilist[self.__attributes[i]]=values[i]
. Le générateur est équivalent à une fonction qui ne doit être initialisée qu'une seule fois et peut être exécutée automatiquement plusieurs fois, renvoyant un résultat à chaque fois. Cependant, la fonction utilise
pour renvoyer le résultat, tandis que le générateur utilise
, et l'exécution suivante commence après return
. Par exemple, nous implémentons la séquence de Fibonacci en utilisant des fonctions et des générateurs : yield
<🎜. >yield
yield
def fib(max): n, a, b = 0, 0, 1 while n < max: print(b) a, b = b, a + b n = n + 1 return 'done'
>>> fib(6) 1 1 2 3 5 8 'done'
C'est tout :
print
yield
def fib(max): n, a, b = 0, 0, 1 while n < max: yield b a, b = b, a + b n = n + 1
>>> f = fib(6) >>> f <generator object fib at 0x104feaaa0> >>> for i in f: ... print(i) ... 1 1 2 3 5 8 >>>
Dans mon programme, le code de la pièce du générateur est le suivant : yield
generator.next()
.
où,def ObjectGenerator(maxlinenum): filename='/home/thinkit/Documents/usr_info/USER.csv' attributes=[] linenum=1 a=UserInfo() file=open(filename) while linenum < maxlinenum: values=[] line=str.decode(file.readline(),'gb2312')#linecache.getline(filename, linenum,'gb2312') if line=='': print'reading fail! Please check filename!' break str_list=line.split(',') for item in str_list: item=item.strip() item=item.strip('\"') item=item.strip('\'') item=item.strip('+0*') item=catchTime(item) if linenum==1: attributes.append(item) else: values.append(item) if linenum==1: a.updateAttributes(attributes) else: a.updatePairs(values) yield a.attrilist #change to ' a ' to use linenum = linenum +1
Instanciation Parce que le document est encodé en gb2312, la méthode de décodage correspondante est utilisée ci-dessus Puisque la première ligne est l'attribut, il existe une fonction pour. stockez la liste d'attributs dans
, c'est-à-dire que les lignes après doivent stocker les attributs. -Les paires de valeurs sont lues dans un dictionnaire et stockées. Le dictionnaire dans a=UserInfo()
est équivalent à une carte.<🎜. >UserInfo
UserInfo
updateAttributes();
3. Utilisez strip pour supprimer les caractères inutiles p.s.python
À partir du code ci-dessus, vous pouvez voir que l'utilisation de peut supprimer le caractères avant et après str.
peut être un symbole ou une expression régulière, comme ci-dessus :
str.strip(somechar)
somechar
somechar
item=item.strip()#除去字符串前后的所有转义字符,如\t,\n等 item=item.strip('\"')#除去前后的" item=item.strip('\'') item=item.strip('+0*')#除去前后的+00...00,*表示0的个数可以任意多,也可以没有
Syntaxe de la fonction :
Description du paramètre de fonction :
re.match(pattern, string, flags=0)
Paramètres Description
pattern Expression régulière correspondante
string La chaîne à rechercher.
flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
若匹配成功re.match方法返回一个匹配的对象,否则返回None。`
>>> s='2015-09-18'
>>> matchObj=re.match(r'\d{4}-\d{2}-\d{2}',s, flags= 0)
>>> print matchObj
<_sre.SRE_Match object at 0x7f3525480f38>
1
2
3
4
5
5.使用time.strptime提取字符串转化为时间对象
在time
模块中,time.strptime(str,format)
可以把str
按照format
格式转化为时间对象,format
中的常用格式有:
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
此外,还需要使用re
模块,用正则表达式,对字符串进行匹配,看是否是一般时间的格式,如YYYY/MM/DD H:M:S, YYYY-MM-DD
等
在上面的代码中,函数catchTime就是判断item是否为时间对象,是的话转化为时间对象。
代码如下:
import time import re def catchTime(item): # check if it's time matchObj=re.match(r'\d{4}-\d{2}-\d{2}',item, flags= 0) if matchObj!= None : item =time.strptime(item,'%Y-%m-%d') #print "returned time: %s " %item return item else: matchObj=re.match(r'\d{4}/\d{2}/\d{2}\s\d+:\d+:\d+',item,flags=0 ) if matchObj!= None : item =time.strptime(item,'%Y/%m/%d %H:%M:%S') #print "returned time: %s " %item return item
完整代码:
import collections import time import re class UserInfo(object): 'Class to restore UserInformation' def __init__ (self): self.attrilist=collections.OrderedDict()# ordered self.__attributes=[] def updateAttributes(self,attributes): self.__attributes=attributes def updatePairs(self,values): for i in range(len(values)): self.attrilist[self.__attributes[i]]=values[i] def catchTime(item): # check if it's time matchObj=re.match(r'\d{4}-\d{2}-\d{2}',item, flags= 0) if matchObj!= None : item =time.strptime(item,'%Y-%m-%d') #print "returned time: %s " %item return item else: matchObj=re.match(r'\d{4}/\d{2}/\d{2}\s\d+:\d+:\d+',item,flags=0 ) if matchObj!= None : item =time.strptime(item,'%Y/%m/%d %H:%M:%S') #print "returned time: %s " %item return item def ObjectGenerator(maxlinenum): filename='/home/thinkit/Documents/usr_info/USER.csv' attributes=[] linenum=1 a=UserInfo() file=open(filename) while linenum < maxlinenum: values=[] line=str.decode(file.readline(),'gb2312')#linecache.getline(filename, linenum,'gb2312') if line=='': print'reading fail! Please check filename!' break str_list=line.split(',') for item in str_list: item=item.strip() item=item.strip('\"') item=item.strip('\'') item=item.strip('+0*') item=catchTime(item) if linenum==1: attributes.append(item) else: values.append(item) if linenum==1: a.updateAttributes(attributes) else: a.updatePairs(values) yield a.attrilist #change to ' a ' to use linenum = linenum +1 if __name__ == '__main__': for n in ObjectGenerator(10): print n #输出字典,看是否正确
总结
以上就是这篇文章的全部内容,希望能对大家的学习或者工作带来一定帮助,如果有疑问大家可以留言交流,谢谢大家对PHP中文网的支持。
更多在python的类中动态添加属性与生成对象相关文章请关注PHP中文网!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds



Solution aux problèmes d'autorisation Lors de la visualisation de la version Python dans Linux Terminal Lorsque vous essayez d'afficher la version Python dans Linux Terminal, entrez Python ...

Cet article explique comment utiliser la belle soupe, une bibliothèque Python, pour analyser HTML. Il détaille des méthodes courantes comme find (), find_all (), select () et get_text () pour l'extraction des données, la gestion de diverses structures et erreurs HTML et alternatives (Sel

Le module statistique de Python fournit de puissantes capacités d'analyse statistique de données pour nous aider à comprendre rapidement les caractéristiques globales des données, telles que la biostatistique et l'analyse commerciale. Au lieu de regarder les points de données un par un, regardez simplement des statistiques telles que la moyenne ou la variance pour découvrir les tendances et les fonctionnalités des données d'origine qui peuvent être ignorées et comparer les grands ensembles de données plus facilement et efficacement. Ce tutoriel expliquera comment calculer la moyenne et mesurer le degré de dispersion de l'ensemble de données. Sauf indication contraire, toutes les fonctions de ce module prennent en charge le calcul de la fonction moyenne () au lieu de simplement additionner la moyenne. Les nombres de points flottants peuvent également être utilisés. Importer au hasard Statistiques d'importation de fracTI

Cet article compare TensorFlow et Pytorch pour l'apprentissage en profondeur. Il détaille les étapes impliquées: préparation des données, construction de modèles, formation, évaluation et déploiement. Différences clés entre les cadres, en particulier en ce qui concerne le raisin informatique

L'article traite des bibliothèques Python populaires comme Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask et Demandes, détaillant leurs utilisations dans le calcul scientifique, l'analyse des données, la visualisation, l'apprentissage automatique, le développement Web et H et H

Cet article guide les développeurs Python sur la construction d'interfaces de ligne de commande (CLI). Il détaille à l'aide de bibliothèques comme Typer, Click et Argparse, mettant l'accent sur la gestion des entrées / sorties et promouvant des modèles de conception conviviaux pour une meilleure convivialité par la CLI.

Lorsque vous utilisez la bibliothèque Pandas de Python, comment copier des colonnes entières entre deux frames de données avec différentes structures est un problème courant. Supposons que nous ayons deux dats ...

L'article traite du rôle des environnements virtuels dans Python, en se concentrant sur la gestion des dépendances du projet et l'évitement des conflits. Il détaille leur création, leur activation et leurs avantages pour améliorer la gestion de projet et réduire les problèmes de dépendance.
