Série utilisant l'analyse de données Pandas

P粉469731340
Libérer: 2022-07-22 15:53:20
original
170 Les gens l'ont consulté

1. Préparation de l'outil

Un bon outil pour l'analyse des données : anaconda Ce tutoriel consiste à utiliser l'outil jupyter anaconda3 dans le système win10, qui s'exécute dans le navigateur.

  1. URL de téléchargement : https://www.anaconda.com/

  2. Méthode de démarrage

  • Menu Démarrer, ouvrez la fenêtre de ligne de commande d'invite anaconda

  • Entrez le répertoire dans lequel se trouve le projet se trouve, le Définissez le répertoire vous-même

  • Utilisez la commande jupyter notebook pour ouvrir le navigateur

2. Type de série

Une fois l'index créé, les valeurs à l'intérieur ne peuvent pas être modifiées individuellement

1. Créer un objet série

  • Créer un objet via une liste ou un tableau

import pandas as pd
import numpy as np
users=['张三','李四','王老五']
series1=pd.Series(users)
print(series1)
Copier après la connexion

Le résultat du code ci-dessus :

0     张三
1     李四
2    王老五
dtype: object
Copier après la connexion
  • Créer un objet série via un dictionnaire

users={'张三':20,'李四':25,'王五':21}
series2=pd.Series(users)
print(series2)
Copier après la connexion

Ce qui précède résultat du code :

张三    20
李四    25
王五    21
dtype: int64
Copier après la connexion

2. Obtenez la séquence de la série

print(series2.index)
Copier après la connexion

Le résultat du code ci-dessus :

Index(['张三', '李四', '王五'], dtype='object')
Copier après la connexion

3. Obtenez la valeur de la série

print(series2.values)
Copier après la connexion

Le résultat du code ci-dessus :

.
[20 25 21]
Copier après la connexion

4. Obtenez une certaine valeur

print(series2.values)
print(series2[1])
print(series2['王五'])
Copier après la connexion

Le résultat du code ci-dessus :

25
21
Copier après la connexion

Les deux ci-dessus La valeur de la série peut être obtenue par l'une des méthodes

5.

pd.date_range('2022-10-01',periods=4,freq='M')
Copier après la connexion
  • périodes : divisées en plusieurs intervalles

  • freq : divisée par année, mois, jour, semaine, heure, etc.

6. Indice d'intervalle de temps

pd.TimedeltaIndex([10,12,14,16],unit="D")
Copier après la connexion

Le résultat du code ci-dessus :

TimedeltaIndex(['10 days', '12 days', '14 days', '16 days'], dtype='timedelta64[ns]', freq=None)
Copier après la connexion
  • La valeur de l'unité peut être remplacée par Y, W, H, etc.

7.索引取值

import numpy as np
import pandas as pd
pd=pd.DataFrame(np.random.randint(1,100,(4,5)),index=['A','B','C','D'])
# pd['A':'C']#通过索引名称取值,结果包含最后一个
pd[0:3]#通过索引下标取值,结果不包含最后一个
Copier après la connexion

8. 条件索引

conditon=series>50
series[conditon]
或
series[series>50]
Copier après la connexion

以上代码结果:

	0	1	2	3	4
A	84.0	63.0	76.0	72.0	77.0
B	NaN	96.0	NaN	65.0	NaN
C	NaN	NaN	NaN	81.0	NaN
D	74.0	89.0	NaN	NaN	53.0
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
1
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal