プログラミングの世界では、Python はすでにインターネット上の有名人です。かつて、中国語を勉強している大学院生が、Python の学習方法を私に尋ねました。その授業レポートでは、テキスト分析を使用し、Python を使用してデータを実行する必要があったからです。 2日以内に文法を読めば仕事を始められるよ、分からないなら調べてね、と伝えました。その後、この同級生はPythonを使って半月で紙データを完成させました。
つまり、Python の最大の利点は、学習が容易であり、Java や C よりも敷居がはるかに低いことです。Python は、プログラマーでない人でもコードを操作できる可能性を提供します。もちろん、Python が人気のプログラミング ツールになる可能性があります。これは、学習が簡単であるだけでなく、Python にはあらゆる分野に広がる何千ものツールキットがあるためでもあります。
官公庁の一般的な例を 12 個挙げると、Python はそれらを効率的に処理できます。
#pandas、xlwings、openpyxl およびその他のパッケージを使用して、追加、削除、変更、確認、フォーマット、調整などを行うことができます。 Excel. Python 関数を使用して Excel データを分析することもできます。
Excel テーブルの読み取り:
import xlwings as xw wb = xw.Book()# this will create a new workbook wb = xw.Book('FileName.xlsx')# connect to a file that is open or in the current working directory wb = xw.Book(r'C:pathtofile.xlsx')# on Windows: use raw strings to escape backslashes
matplotlib 図面を Excel テーブルに書き込み:
import matplotlib.pyplot as plt import xlwings as xw fig = plt.figure() plt.plot([1, 2, 3]) sheet = xw.Book().sheets[0] sheet.pictures.add(fig, name='MyPlot', update=True)
PDF はほぼ最も一般的なテキスト形式であり、多くの人が PDF を処理するためにさまざまなニーズを持っています。 PDF の作成、テキストの取得、写真の取得、表の取得など。 Python には、これらのニーズを簡単に満たす PyPDF、pdfplumber、ReportLab、PyMuPDF などのパッケージがあります。
PDF テキストの抽出:
import PyPDF2 pdfFile = open('example.pdf','rb') pdfReader = PyPDF2.PdfFileReader(pdfFile) print(pdfReader.numPages) page = pdfReader.getPage(0) print(page.extractText()) pdfFile.close()
PDF テーブルの抽出:
# 提取pdf表格 import pdfplumber with pdfplumber.open("example.pdf") as pdf: page01 = pdf.pages[0] #指定页码 table1 = page01.extract_table()#提取单个表格 # table2 = page01.extract_tables()#提取多个表格 print(table1)
Python ではメールライブラリと smtplib を併用することでメールの自動送信が実現でき大変便利です。
import smtplib import email # 负责将多个对象集合起来 from email.mime.multipart import MIMEMultipart from email.header import Header # SMTP服务器,这里使用163邮箱 mail_host = "smtp.163.com" # 发件人邮箱 mail_sender = "******@163.com" # 邮箱授权码,注意这里不是邮箱密码,如何获取邮箱授权码,请看本文最后教程 mail_license = "********" # 收件人邮箱,可以为多个收件人 mail_receivers = ["******@qq.com","******@outlook.com"] mm = MIMEMultipart('related') # 邮件正文内容 body_content = """你好,这是一个测试邮件!""" # 构造文本,参数1:正文内容,参数2:文本格式,参数3:编码方式 message_text = MIMEText(body_content,"plain","utf-8") # 向MIMEMultipart对象中添加文本对象 mm.attach(message_text) # 创建SMTP对象 stp = smtplib.SMTP() # 设置发件人邮箱的域名和端口,端口地址为25 stp.connect(mail_host, 25) # set_debuglevel(1)可以打印出和SMTP服务器交互的所有信息 stp.set_debuglevel(1) # 登录邮箱,传递参数1:邮箱地址,参数2:邮箱授权码 stp.login(mail_sender,mail_license) # 发送邮件,传递参数1:发件人邮箱地址,参数2:收件人邮箱地址,参数3:把邮件内容格式改为str stp.sendmail(mail_sender, mail_receivers, mm.as_string()) print("邮件发送成功") # 关闭SMTP对象 stp.quit()
データベースは私たちの一般的なオフィス アプリケーションです。Python にはさまざまなデータベース ドライバー インターフェイス パッケージがあり、追加、削除、変更をサポートしています。データベースのクエリや運用保守管理業務たとえば、pymysql パッケージは MySQL に対応し、psycopg2 パッケージは PostgreSQL に対応し、pymssql パッケージは sqlserver に対応し、cxoracle パッケージは Oracle に対応し、PyMongo パッケージは MongoDB に対応します。
MySQL への接続クエリ
import pymysql # 打开数据库连接 db = pymysql.connect(host='localhost', user='testuser', password='test123', database='TESTDB') # 使用 cursor() 方法创建一个游标对象 cursor cursor = db.cursor() # 使用 execute()方法执行 SQL 查询 cursor.execute("SELECT VERSION()") # 使用 fetchone() 方法获取单条数据. data = cursor.fetchone() print ("Database version : %s " % data) # 关闭数据库连接 db.close()
多くのオフィス シナリオでは、ファイルのバッチ処理は常に汚い仕事であり、Python はその仕事から抜け出すのに役立ちます。 Python には、sys、os、shutil、glob、path.py など、システム ファイルを処理するパッケージが多数あります。
異なるフォルダーにある同じ名前のフォルダーを一括で削除:
import os,shutil import sys import numpy as np def arrange_file(dir_path0): for dirpath,dirnames,filenames in os.walk(dir_path0): if 'my_result' in dirpath: # print(dirpath) shutil.rmtree(dirpath)
ファイルのサフィックスを一括で変更:
import os def file_rename(): path = input("请输入你需要修改的目录(格式如'F:\test'):") old_suffix = input('请输入你需要修改的后缀(需要加点.):') new_suffix = input('请输入你要改成的后缀(需要加点.):') file_list = os.listdir(path) for file in file_list: old_dir = os.path.join(path, file) print('当前文件:', file) if os.path.isdir(old_dir): continue if old_suffix != os.path.splitext(file)[1]: continue filename = os.path.splitext(file)[0] new_dir = os.path.join(path, filename + new_suffix) os.rename(old_dir, new_dir) if __name__ == '__main__': file_rename()
これは、マウスの自動制御を実現し、ソフトウェア テストなどの組立ライン作業を行うために、多くの人が必要としています。
Python には、マウスを任意に制御できる pyautogui ライブラリがあります。
マウスの左クリック/右クリック/ダブルクリック機能を制御し、ソース コードをテストします:
# 获取鼠标位置 import pyautogui as pg try: while True: x, y = pg.position() print(str(x) + " " + str(y))#输出鼠标位置 if 1746 < x < 1800 and 2 < y < 33: pg.click()#左键单击 if 1200 < x < 1270 and 600 < y < 620: pg.click(button='right')#右键单击 if 1646 < x < 1700 and 2 < y < 33: pg.doubleClick()#左键双击 except KeyboardInterrupt: print("n")
同样的,Python也可以通过pyautogui控制键盘。
键盘写入:
import pyautogui #typewrite()无法输入中文内容,中英文混合的只能输入英文 #interval设置文本输入速度,默认值为0 pyautogui.typewrite('你好,world!',interval=0.5)
压缩文件是办公中常见的操作,一般压缩会使用压缩软件,需要手动操作。
Python中有很多包支持文件压缩,可以让你自动化压缩或者解压缩本地文件,或者将内存中的分析结果进行打包。比如zipfile、zlib、tarfile等可以实现对.zip、.rar、.7z等压缩文件格式的操作。
压缩文件:
import zipfile try: with zipfile.ZipFile("c://test.zip",mode="w") as f: f.write("c://test.txt")#写入压缩文件,会把压缩文件中的原有覆盖 except Exception as e: print("异常对象的类型是:%s"%type(e)) print("异常对象的内容是:%s"%e) finally: f.close()
解压文件:
import zipfile try: with zipfile.ZipFile("c://test.zip",mode="a") as f: f.extractall("c://",pwd=b"root") ##将文件解压到指定目录,解压密码为root except Exception as e: print("异常对象的类型是:%s"%type(e)) print("异常对象的内容是:%s"%e) finally: f.close()
python爬虫应该是最受欢迎的功能,也是广大Python爱好者们入坑的主要的原因。
Python中有非常多的包支持爬虫,而爬虫包又分为抓取、解析两种。
比如说requests、urllib这种是网络数据请求工具,也就是抓取包;xpath、re、bs4这种会对抓取下来的网页内容进行解析,称为解析包。
爬取百度首页图片,并保存到本地:
# 导入urlopen from urllib.request import urlopen # 导入BeautifulSoup from bs4 import BeautifulSoup as bf # 导入urlretrieve函数,用于下载图片 from urllib.request import urlretrieve # 请求获取HTML html = urlopen("http://www.baidu.com/") # 用BeautifulSoup解析html obj = bf(html.read(),'html.parser') # 从标签head、title里提取标题 title = obj.head.title # 只提取logo图片的信息 logo_pic_info = obj.find_all('img',class_="index-logo-src") # 提取logo图片的链接 logo_url = "https:"+logo_pic_info[0]['src'] # 使用urlretrieve下载图片 urlretrieve(logo_url, 'logo.png')
图片处理、图表可视化涉及到图像处理,这也是Python的强项,现在诸如图像识别、计算机视觉等前沿领域也都会用到Python。
在Python中处理图像的包有scikit Image、PIL、OpenCV等,处理图表的包有matplotlib、plotly、seaborn等。
对图片进行黑白化处理:
from PIL import Image from PIL import ImageEnhance img_main = Image.open(u'E:/login1.png') img_main = img_main.convert('L') threshold1 = 138 table1 = [] for i in range(256): if i < threshold1: table1.append(0) else: table1.append(1) img_main = img_main.point(table1, "1") img_main.save(u'E:/login3.png')
生成统计图表:
import numpy as np import matplotlib.pyplot as plt N = 5 menMeans = (20, 35, 30, 35, 27) womenMeans = (25, 32, 34, 20, 25) menStd = (2, 3, 4, 1, 2) womenStd = (3, 5, 2, 3, 3) ind = np.arange(N)# the x locations for the groups width = 0.35 # the width of the bars: can also be len(x) sequence p1 = plt.bar(ind, menMeans, width, yerr=menStd) p2 = plt.bar(ind, womenMeans, width, bottom=menMeans, yerr=womenStd) plt.ylabel('Scores') plt.title('Scores by group and gender') plt.xticks(ind, ('G1', 'G2', 'G3', 'G4', 'G5')) plt.yticks(np.arange(0, 81, 10)) plt.legend((p1[0], p2[0]), ('Men', 'Women')) plt.show()
总之Python会成为大众化的编程语言,帮助到更多需要的人。
以上がPython オフィス オートメーションのトップ 10 のシナリオをご存知ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。