ホームページ バックエンド開発 Python チュートリアル pandas を使用して txt ファイル データを簡単に処理する

pandas を使用して txt ファイル データを簡単に処理する

Jan 19, 2024 am 08:50 AM
txt pandas 対処する

pandas を使用して txt ファイル データを簡単に処理する

パンダを使用して txt ファイル データを簡単に処理する

データ分析と処理では、txt ファイルから読み取ったデータを処理する必要がある状況によく遭遇します。たとえば、データ形式がわかりにくいため整理する必要がある、一部の列が無効なので削除する必要がある、一部の列を型変換する必要がある、などです。これらのタスクには多くの作業と時間がかかる場合がありますが、Python ライブラリの pandas を使用してこれらの操作を簡単に完了できます。

この記事では、コード例を組み合わせて、パンダを使用して txt ファイル データを処理する方法を説明します。

  1. pandas ライブラリの導入

pandas ライブラリを使用する前に、まずそれを導入する必要があります。 Python スクリプトでは、後続の呼び出しを容易にするために、pandas ライブラリの名前を pd に変更することが一般的に合意されています。

import pandas as pd
ログイン後にコピー
  1. txt ファイルの読み取り

まず、txt ファイル内のデータを読み取る必要があります。 pandas では、pd.read_csv() 関数を使用してデータを読み取ります。関数名にはcsvが含まれていますが、txtファイルの読み込みにも適した関数です。

data = pd.read_csv('data.txt', sep='    ', header=None)
ログイン後にコピー

関数パラメータは次のように説明されています:

  • 'data.txt': 読み取る必要がある txt ファイルのパスとファイル名を示します。
  • sep: データ区切り文字を示します。ここでは、データがタブで区切られていることを示すために「 」が使用されています。他の記号に置き換えることもできます。
  • header: 列名がファイルに含まれるかどうかを示します。含まれない場合は、「なし」に設定されます。

データを読み取った後、データを印刷することでデータの内容と形式を確認できます。

print(data)
ログイン後にコピー

出力結果:

   0    1    2
0  A  123  1.0
1  B  321  2.0
2  C  231  NaN
3  D  213  4.0
4  E  132  3.0
ログイン後にコピー

読み込んだデータがDataFrame形式のデータに格納されていることがわかります。

  1. データのクリーニング

読み取られたデータには多くの形式異常やエラーが含まれている可能性があるため、データをクリーニングする必要があります。たとえば、一部の行または列に欠損値がある可能性があるため、それらを埋めるか削除する必要がある場合や、一部の列のデータ型がニーズを満たしていない可能性があるため、それらを数値型または文字列型に変換する必要があるなどです。 。

a. 欠損値を含む行を削除する

dropna() 関数を使用して、欠損値を含む行を削除できます。

data_clean = data.dropna()
ログイン後にコピー

この関数は、データ内の欠損値を含む行を削除し、完全なデータのみを含む DataFrame を返します。

b. 欠損値を埋める

欠損値を含む行を削除できない場合は、これらの欠損値を埋めることを選択できます。 fillna() 関数を使用するだけです。

data_fill = data.fillna(0)
ログイン後にコピー

この関数は欠損値を 0 で埋めます。他の値を埋めたい場合は、括弧内に対応する値を渡すことができます。

c. データ型の変換

データ分析では、後続の計算または処理のために、特定のデータ型を数値型または文字型に変換する必要があります。 pandas では、型変換に astype() 関数を使用できます。

data_conversion = data_clean.astype({'1': 'int', '2': 'str'})
ログイン後にコピー

この関数は、data_clean の列 1 の型を整数型 (int) に、列 2 の型を文字列型 (str) に変換できます。

  1. 新しいデータの保存

最後に、クリーンアップおよび処理されたデータを新しい txt ファイルに保存する必要があります。 pandas では、to_csv() 関数を使用してこれを実現できます。

data_clean.to_csv('data_clean.txt', index=False, header=False, sep='    ')
ログイン後にコピー

関数パラメータは次のように説明されます。

  • 'data_clean.txt': 保存されたファイルのパスとファイル名を示します。
  • index: 行インデックスを保持するかどうかを示します。保持しない場合は、ここで False を選択します。
  • header: 列名がファイルに含まれるかどうかを示します。列名を除外するには、ここで False を選択します。
  • sep: 区切り文字を示します。ここで「 」は、区切り文字としてタブを使用することを示すために使用されます。

コード例

以下は、Python スクリプトにコピーして実行できる完全なコード例です。

import pandas as pd

# 读入数据
data = pd.read_csv('data.txt', sep='    ', header=None)
print('原始数据:
', data)

# 删除含有缺失值的行
data_clean = data.dropna()
print('处理后数据(删除缺失值):
', data_clean)

# 填充缺失值
data_fill = data.fillna(0)
print('处理后数据(填充缺失值):
', data_fill)

# 转换数据类型
data_conversion = data_clean.astype({'1': 'int', '2': 'str'})
print('处理后数据(类型转换):
', data_conversion)

# 保存新数据
data_clean.to_csv('data_clean.txt', index=False, header=False, sep='    ')
ログイン後にコピー

この記事では、pandas を使用して、データの読み取り、クリーニング、変換、保存など、txt ファイル データを簡単に処理する方法を紹介します。 Python の重要なデータ処理ツールの 1 つであるパンダは、データ マイニングと分析のタスクをより効率的に完了するのに役立ちます。

以上がpandas を使用して txt ファイル データを簡単に処理するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

WIN10サービスホストの動作プロセスがCPUを過剰に占有している WIN10サービスホストの動作プロセスがCPUを過剰に占有している Mar 27, 2024 pm 02:41 PM

1. まず、タスクバーの空白スペースを右クリックして[タスクマネージャー]オプションを選択するか、スタートロゴを右クリックして[タスクマネージャー]オプションを選択します。 2. 開いたタスク マネージャー インターフェイスで、右端の [サービス] タブをクリックします。 3. 開いた[サービス]タブで、下の[サービスを開く]オプションをクリックします。 4. 表示される[サービス]ウィンドウで、[InternetConnectionSharing(ICS)]サービスを右クリックし、[プロパティ]オプションを選択します。 5. 表示されたプロパティ画面で[プログラムから開く]を[無効]に変更し、[適用]をクリックして[OK]をクリックします。 6. スタートロゴをクリックし、シャットダウンボタンをクリックして[再起動]を選択し、コンピュータの再起動を完了します。

一般的なパンダのインストール問題の解決: インストール エラーの解釈と解決策 一般的なパンダのインストール問題の解決: インストール エラーの解釈と解決策 Feb 19, 2024 am 09:19 AM

Pandas インストール チュートリアル: 一般的なインストール エラーとその解決策の分析、特定のコード サンプルが必要です はじめに: Pandas は、データ クリーニング、データ処理、およびデータ視覚化で広く使用されている強力なデータ分析ツールであるため、この分野で高く評価されていますデータサイエンスのただし、環境構成と依存関係の問題により、パンダのインストール時に問題やエラーが発生する可能性があります。この記事では、パンダのインストール チュートリアルを提供し、いくつかの一般的なインストール エラーとその解決策を分析します。 1.パンダをインストールする

pandasを使用してtxtファイルを正しく読み取る方法 pandasを使用してtxtファイルを正しく読み取る方法 Jan 19, 2024 am 08:39 AM

pandas を使用して txt ファイルを正しく読み取る方法には、特定のコード サンプルが必要です。パンダは、広く使用されている Python データ分析ライブラリです。CSV ファイル、Excel ファイル、SQL データベースなど、さまざまな種類のデータの処理に使用できます。同時に、txt ファイルなどのテキスト ファイルを読み取るために使用することもできます。ただし、txt ファイルを読み取るときに、エンコードの問題や区切り文字の問題など、いくつかの問題が発生することがあります。この記事ではパンダを使ってtxtを正しく読む方法を紹介します。

pandas を使用して txt ファイルを読み取るための実践的なヒント pandas を使用して txt ファイルを読み取るための実践的なヒント Jan 19, 2024 am 09:49 AM

pandas を使用して txt ファイルを読み取るための実践的なヒント、具体的なコード例が必要です データ分析とデータ処理では、txt ファイルは一般的なデータ形式です。 pandas を使用して txt ファイルを読み取ると、高速で便利なデータ処理が可能になります。この記事では、パンダをより効果的に使用して txt ファイルを読み取るのに役立ついくつかの実践的なテクニックを、具体的なコード例とともに紹介します。区切り文字付きの txt ファイルの読み取りパンダを使用して区切り文字付きの txt ファイルを読み取る場合は、read_c を使用できます。

Pandas の効率的なデータ重複排除方法を明らかに: 重複データをすばやく削除するためのヒント Pandas の効率的なデータ重複排除方法を明らかに: 重複データをすばやく削除するためのヒント Jan 24, 2024 am 08:12 AM

Pandas 重複排除メソッドの秘密: データを重複排除するための高速かつ効率的な方法 (特定のコード例が必要) データの分析と処理のプロセスでは、データの重複が頻繁に発生します。データが重複すると分析結果が誤解される可能性があるため、重複排除は非常に重要な手順です。強力なデータ処理ライブラリである Pandas では、データ重複排除を実現するためのさまざまな方法が提供されています。この記事では、一般的に使用されるいくつかの重複排除方法を紹介し、具体的なコード例を添付します。単一列に基づく重複排除の最も一般的なケースは、特定の列の値が重複しているかどうかに基づいています。

Pandas の使用法チュートリアル: JSON ファイルを読み取るためのクイック スタート Pandas の使用法チュートリアル: JSON ファイルを読み取るためのクイック スタート Jan 13, 2024 am 10:15 AM

クイック スタート: JSON ファイルを読み取る Pandas の方法、特定のコード サンプルが必要です はじめに: データ分析とデータ サイエンスの分野では、Pandas は重要な Python ライブラリの 1 つです。豊富な機能と柔軟なデータ構造を備え、さまざまなデータを簡単に処理・分析できます。実際のアプリケーションでは、JSON ファイルを読み取る必要がある状況によく遭遇します。この記事では、Pandas を使用して JSON ファイルを読み取る方法を紹介し、具体的なコード例を添付します。 1.パンダのインストール

PHP で特殊文字を処理し、一重引用符を変換する方法を学習します。 PHP で特殊文字を処理し、一重引用符を変換する方法を学習します。 Mar 27, 2024 pm 12:39 PM

PHP 開発のプロセスでは、特殊文字の処理が一般的な問題になります。特に文字列処理では、特殊文字がエスケープされることがよくあります。その中でも、特殊文字を一重引用符に変換することは比較的一般的な要件です。これは、PHP では一重引用符が文字列をラップする一般的な方法であるためです。この記事では、PHP での特殊文字変換シングルクォーテーションの扱い方と具体的なコード例を説明します。 PHP では、特殊文字には一重引用符 (')、二重引用符 (")、バックスラッシュ () などが含まれますが、これらに限定されません。

シンプルなパンダのインストール チュートリアル: さまざまなオペレーティング システムにパンダをインストールする方法に関する詳細なガイダンス シンプルなパンダのインストール チュートリアル: さまざまなオペレーティング システムにパンダをインストールする方法に関する詳細なガイダンス Feb 21, 2024 pm 06:00 PM

シンプルなパンダのインストール チュートリアル: さまざまなオペレーティング システムにパンダをインストールする方法に関する詳細なガイダンス、特定のコード サンプルが必要です. データ処理と分析の需要が高まり続けるにつれて、パンダは多くのデータ サイエンティストやアナリストにとって推奨されるツールの 1 つになりました。 pandas は、大量の構造化データを簡単に処理および分析できる強力なデータ処理および分析ライブラリです。この記事では、さまざまなオペレーティング システムにパンダをインストールする方法を詳しく説明し、具体的なコード例を示します。 Windows オペレーティング システムにインストールする

See all articles