Pandasを使用してExcelファイルを読み取る方法
Pandas は、Python で一般的に使用されるデータ処理および分析ツールであり、Excel ファイルを読み取り、処理するための一連の便利な方法を提供します。この記事では、Pandas が Excel ファイルを読み取るための一般的な方法をいくつか紹介し、読者がそれらをよりよく理解して適用できるように具体的なコード例を示します。
1. Pandas の read_excel() 関数を使用して Excel ファイルを読み取る
Pandas は、Excel ファイルを直接読み取り、DataFrame オブジェクトに変換できる read_excel() 関数を提供します。この関数の基本的な使用法は次のとおりです。
import pandas as pd # 读取Excel文件 df = pd.read_excel('filename.xlsx', sheetname='sheet1')
ここで、「filename.xlsx」は、読み取る Excel ファイルの名前であり、相対パスまたは絶対パスを指定できます。 Sheetname パラメーターは、読み取るワークシートの名前を指定するために使用されます。これには、特定のワークシート名またはインデックスを指定できます。
デモンストレーションの便宜のために、次の内容を含む data.xlsx
という名前のサンプル Excel ファイルを作成します:
名前 年齢 性別
Zhang San 25 Male
Li Si 30 Female
王五 28 Male
次に、read_excel() 関数を使用してデータを読み取り、出力します。
import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheetname='Sheet1') # 打印数据 print(df)
実行結果は次のとおりです。
名前 年齢 性別
0 Zhang San 25 Male
1 Li Si 30 Female
2 Wang Wu 28 Male
Excelファイルを読み込んだ後、DataFrame上でさまざまなデータ加工や分析を行うことができます物体。
2. 複数のワークシートからデータを読み取る
Excel ファイルに複数のワークシートが含まれている場合、sheetname パラメーターを指定することで、指定したワークシートからデータを読み取ることができます。このとき、read_excel() 関数は、ワークシート名をキーとして、対応する DataFrame オブジェクトを値として持つ辞書を返します。例は次のとおりです:
import pandas as pd # 读取Excel文件的所有工作表 dfs = pd.read_excel('filename.xlsx', sheetname=None) # 打印所有工作表的数据 for sheetname, df in dfs.items(): print(sheetname, ": ", df)
3. データを読み取る列範囲を指定する
Excel ファイル内の列データの一部だけを読み取りたい場合があります。このとき、usecolsパラメータを指定することで、読み込む列の範囲を制限できます。例は次のとおりです:
import pandas as pd # 读取Excel文件的指定列范围 df = pd.read_excel('filename.xlsx', usecols='A:C') # 打印数据 print(df)
4. null 値の処理
Excel ファイルを読み取るときに、null 値が含まれる状況に遭遇することがよくあります。 Pandas は、この状況を簡単に処理するために fillna() 関数を提供します。例は次のとおりです。
import pandas as pd # 读取Excel文件并处理空值 df = pd.read_excel('filename.xlsx') df.fillna(value=0, inplace=True) # 打印数据 print(df)
上の例では、fillna() 関数を使用して null 値を 0 で埋めており、inplace=True は元の DataFrame オブジェクトで直接変更することを意味します。
上記は、Pandas が Excel ファイルを読み取るためのいくつかの一般的な方法とサンプル コードです。読者は、自分のニーズに応じて適切な方法を選択し、Pandas のデータ処理および分析機能をさらに探索して適用できます。
以上がPandasを使用してExcelファイルを読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











このチュートリアルでは、Pythonを使用してZIPFの法則の統計的概念を処理する方法を示し、法律の処理時にPythonの読み取りおよび並べ替えの効率性を示します。 ZIPF分布という用語が何を意味するのか疑問に思うかもしれません。この用語を理解するには、まずZIPFの法律を定義する必要があります。心配しないでください、私は指示を簡素化しようとします。 ZIPFの法則 ZIPFの法則は単に意味します。大きな自然言語のコーパスでは、最も頻繁に発生する単語は、2番目の頻繁な単語のほぼ2倍の頻度で表示されます。 例を見てみましょう。アメリカ英語の茶色のコーパスを見ると、最も頻繁な言葉は「thであることに気付くでしょう。

ノイズの多い画像を扱うことは、特に携帯電話や低解像度のカメラの写真でよくある問題です。 このチュートリアルでは、OpenCVを使用してPythonの画像フィルタリング手法を調査して、この問題に取り組みます。 画像フィルタリング:強力なツール 画像フィルター

この記事では、Pythonライブラリである美しいスープを使用してHTMLを解析する方法について説明します。 find()、find_all()、select()、およびget_text()などの一般的な方法は、データ抽出、多様なHTML構造とエラーの処理、および代替案(SEL

この記事では、深い学習のためにTensorflowとPytorchを比較しています。 関連する手順、データの準備、モデルの構築、トレーニング、評価、展開について詳しく説明しています。 特に計算グラップに関して、フレームワーク間の重要な違い

データサイエンスと処理のお気に入りであるPythonは、高性能コンピューティングのための豊富なエコシステムを提供します。ただし、Pythonの並列プログラミングは、独自の課題を提示します。このチュートリアルでは、これらの課題を調査し、グローバルな承認に焦点を当てています

このチュートリアルでは、Python 3にカスタムパイプラインデータ構造を作成し、機能を強化するためにクラスとオペレーターのオーバーロードを活用していることを示しています。 パイプラインの柔軟性は、一連の機能をデータセットに適用する能力にあります。

Pythonオブジェクトのシリアル化と脱介入は、非自明のプログラムの重要な側面です。 Pythonファイルに何かを保存すると、構成ファイルを読み取る場合、またはHTTPリクエストに応答する場合、オブジェクトシリアル化と脱滑り化を行います。 ある意味では、シリアル化と脱派化は、世界で最も退屈なものです。これらすべての形式とプロトコルを気にするのは誰ですか? Pythonオブジェクトを維持またはストリーミングし、後で完全に取得したいと考えています。 これは、概念レベルで世界を見るのに最適な方法です。ただし、実用的なレベルでは、選択したシリアル化スキーム、形式、またはプロトコルは、プログラムの速度、セキュリティ、メンテナンスの自由、およびその他の側面を決定する場合があります。

Pythonの統計モジュールは、強力なデータ統計分析機能を提供して、生物統計やビジネス分析などのデータの全体的な特性を迅速に理解できるようにします。データポイントを1つずつ見る代わりに、平均や分散などの統計を見て、無視される可能性のある元のデータの傾向と機能を発見し、大きなデータセットをより簡単かつ効果的に比較してください。 このチュートリアルでは、平均を計算し、データセットの分散の程度を測定する方法を説明します。特に明記しない限り、このモジュールのすべての関数は、単に平均を合計するのではなく、平均()関数の計算をサポートします。 浮動小数点数も使用できます。 ランダムをインポートします インポート統計 fractiから
