Python BOT extrait une longue colonne d'une feuille Excel et crée un dataframe pour cataloguer certains numéros d'un autre fichier

WBOY
Libérer: 2024-02-10 18:00:06
avant
718 Les gens l'ont consulté

Python BOT 从 Excel 工作表中提取长列并创建一个数据框来对另一个文件中的一些数字进行编目

Contenu de la question

Je dois créer un robot Python pour extraire la colonne C du fichier Excel 1, feuille 1 et la cataloguer dans le fichier 2 et calculer de 0,00 à 0,99, de 1,00 à 1,99 etc. Somme des nombres. 12. Tous les nombres supérieurs à 12 sont codés dans la dernière ligne. Ensuite, je dois calculer la somme de tous les nombres.

J'ai essayé d'écrire du code mais il n'a rien écrit sur le fichier Excel.


Bonne réponse


Vous pouvez essayer les méthodes suivantes :

  1. Lisez le fichier de données Excel (fichier Excel 1) et sélectionnez uniquement les colonnes requises (« colonne c »).
  2. Créez un tableau de valeurs 0,00 - 0,99, 1,00 - 1,99, 2,00 - 2,99, 3,00 - 3,99 (jusqu'à 12) et utilisez-le pour créer un nouveau dataframe (df_write), regroupant les valeurs du dataframe dans le plage de tableau. Obtenez le nombre pour chaque plage.
  3. Comptez les valeurs supérieures à 12 et ajoutez-les à df_write en tant que nouvelles lignes.
  4. Sommez toutes les valeurs du dataframe et ajoutez-les en tant que nouvelles lignes à df_write.
  5. Écrivez un bloc de données pour Excel. Dans l'exemple, xlsxwriter est utilisé comme moteur, ce qui signifie que le classeur (fichier catalogue) est créé/écrasé à chaque fois que le code est exécuté.
  6. D’autres données/formats peuvent être inclus dans le tableau. Par exemple, modifiez le texte dans la cellule et ajoutez une formule pour calculer le nombre total de toutes les valeurs de plage regroupées, qui doit être égal au nombre total de lignes lues à partir du fichier de données Excel (fichier de données).
import pandas as pd

datafile = "Excel File 1.xlsx"
catalogfile = 'Excel File 2.xlsx'
column = 'column C'

### Read specific column (column) from Excel Sheet
df_read = pd.read_excel(datafile, index_col=None, na_values=['NA'], usecols=[column])
# print(df_read)

### Create the dataframe of values within specified ranges to write to Excel
### Group ranges 0.00 - 0.99 in increments of 1 and make a count of each up to a max (12)
df_write = df_read.groupby(pd.cut(df_read[column], [float(i) - 0.01 for i in range(0, 13)])).count()

### Count values greater than 12 and add as row to the dataframe
df_write.loc['12+'] = df_read[df_read > 12].count()

### Sum all values in the column and add as row to the dataframe
df_write.loc[len(df_write.index) + 1] = df_read.sum()

### Rename Index Header
df_write.index.name = 'Range Totals'
### Rename Column Header
df_write.columns = ['Values Count']

### Write dataframe to Excel
### Using default engine Xlsxwriter so new workbook is created (any existing workbook is overwritten)
with pd.ExcelWriter(catalogfile) as writer:
    df_write.to_excel(writer, sheet_name='Sheet1', index=True)

    ### Xlsxwriter formatting
    workbook = writer.book
    cell_format = workbook.add_format()
    cell_format.set_bold(True)

    ws = writer.sheets['Sheet1']
    ### Rename Row Header and add formula to count the totals for each range 
    ### (should equal the total number of data rows read from Excel)
    ws.write(df_write.size, 0, 'Column Total', cell_format)
    ws.write_row(df_write.size + 1, 0, ['Total Rows', '=SUM(B2:B14)'], cell_format)

    ws.autofit()
Copier après la connexion

Exemple de ce à quoi ressemble une feuille de calcul Excel pour une colonne contenant 100 lignes de données (c'est-à-dire hors hader) lues à partir d'un fichier de données.
La colonne Range Total est une colonne d’index dans le bloc de données. Le texte de la plage est déterminé par le bloc de données, mais couvre en réalité les plages 0,00 - 0,99, 1,00 - 1,99, 2,00 - 2,99, 3,00 - 3,99, etc.
Si nécessaire, vous pouvez supprimer la colonne d'index du dataframe lors de l'écriture dans Excel et utiliser xlsxwriter pour écrire du texte personnalisé dans la colonne ou utiliser un modèle avec des en-têtes existants (dans ce cas, Excelwriter nécessite un schéma supplémentaire et openpyxl lorsque le moteur écrit dans un classeur existant) .

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:stackoverflow.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!