コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Python で固定幅ファイルの解析を最適化する方法

Python で固定幅ファイルの解析を最適化する方法

DDD

リリース： 2024-10-31 05:26:30

オリジナル

646 人が閲覧しました

How to Optimize Fixed Width File Parsing in Python?

固定幅ファイル解析の最適化

固定幅ファイルを効率的に解析するには、Python の struct モジュールの利用を検討できます。このアプローチでは、次の例に示すように、C を利用して速度を向上させます。

1

2

3

4

5

6

7

8

9

10

11

<code class="python">import struct
 
fieldwidths = (2, -10, 24)
fmtstring = ' '.join('{}{}'.format(abs(fw), 'x' if fw < 0 else 's') for fw in fieldwidths)
 
unpack = struct.Struct(fmtstring).unpack_from  # Alias.
parse = lambda line: tuple(s.decode() for s in unpack(line.encode()))
 
line = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789\n'
fields = parse(line)
print('fields: {}'.format(fields))</code>

ログイン後にコピー

代わりに、文字列スライスを使用することもできます。効率を高めるには、以下の最適化バージョンに示すように、実行時にスライスをコンパイルするラムダ関数を定義することを検討してください。

1

2

3

4

5

6

7

8

9

10

11

<code class="python">def make_parser(fieldwidths):
    cuts = tuple(cut for cut in accumulate(abs(fw) for fw in fieldwidths))
    pads = tuple(fw < 0 for fw in fieldwidths)  # bool flags for padding fields
    flds = tuple(zip_longest(pads, (0,) + cuts, cuts))[:-1]  # ignore final one
    slcs = ', '.join('line[{}:{}]'.format(i, j) for pad, i, j in flds if not pad)
    parse = eval('lambda line: ({})\n'.format(slcs))  # Create and compile source code.
    # Optional informational function attributes.
    parse.size = sum(abs(fw) for fw in fieldwidths)
    parse.fmtstring = ' '.join('{}{}'.format(abs(fw), 'x' if fw < 0 else 's')
                                                for fw in fieldwidths)
    return parse</code>

ログイン後にコピー

以上がPython で固定幅ファイルの解析を最適化する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

前の記事：私のボトルの Hello World サンプルが「getaddrinfo failed」で失敗するのはなぜですか? 次の記事：以下に、内容に合わせて質問に基づいた記事のタイトルをいくつか示します。直接的かつ具体的: * 「Anaconda 環境をアクティブ化できないのはなぜですか? (およびその修復方法)」 *「アナコ」

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

6つの便利な方法で蒸気であまりにも多くのレトリエラーを解く

2025-03-25 18:01:09
BTFDコインは、その革新的な機能と繁栄したプレセールを備えた暗号の世界で波を作っています

2025-03-25 11:28:16
VNXは、GBP安定性のためにSolanaブロックチェーンで最初の英国ポンドトークン、LieChtensteinのFMAによってライセンスされている$ VGBPを発売します。

2025-03-25 11:26:17
メタプラネットはビットコインの投資を2倍にし、平均価格で84,000ドルで150 BTCを取得します

2025-03-25 11:24:16
Solana（Sol）は142ドルのマークを取り戻し、より広い暗号通貨市場ラリーをミラーリングします

2025-03-25 11:22:16
KrakenはGoldman SachsとJPMorgan Chaseと協力して、計画された公開リストに先立って最大10億ドルの負債を調達しています

2025-03-25 11:20:16
IMFは、ビットコインが「デジタルゴールド」ではなく、BPM7の資本資産として認めています。

2025-03-25 11:18:16
カルダノ（ADA）の価格は、来るブルサイクルで10ドルに達する可能性があります

2025-03-25 11:16:16
パリでイブニングミートアップを開催するためのシータネットワーク

2025-03-25 11:14:17
LivePeerは3月26日にコミュニティコールを開催して更新を提供します

2025-03-25 11:12:16

最新の問題

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート

