Pandas Excel を読み取る方法: 1. Excel ファイル全体を読み取る; 2. 指定されたワークシートを読み取る; 3. 複数のワークシートを読み取る; 4. 列名とインデックス列を指定する; 5. 欠損値を処理し、 null 値など。詳細な紹介: 1. Excel ファイル全体を読み取るには、Pandas の "read_excel()" メソッドを使用して Excel ファイル全体を読み取ることができます。このメソッドでは、ファイル パスとワークシート名を指定する必要があります。2. 指定されたワークシートを読み取る場合は、 Excel ファイルなどの特定のワークシートを読み取るだけで済みます。
このチュートリアルのオペレーティング システム: Windows 10 システム、DELL G3 コンピューター。
Pandas は、Excel ファイルを読み取るためのさまざまな方法を提供する人気のある Python データ分析ライブラリです。 Pandas を使用して Excel ファイルを読み取る一般的な方法は次のとおりです:
1. Excel ファイル全体を読み取る
Pandas の read_excel() メソッドを使用して Excel ファイル全体を読み取ることができます。ファイルのパスとワークシート名を指定します。
サンプル コード:
import pandas as pd df = pd.read_excel('file_path.xlsx', sheet_name='Sheet1') # 读取名为'Sheet1'的工作表
2. 指定されたワークシートを読み取る
Excel ファイル内の特定のワークシートのみを読み取る必要がある場合は、read_excel() メソッドを使用できます。 Sheet_name パラメータを指定します。
サンプル コード:
import pandas as pd df = pd.read_excel('file_path.xlsx', sheet_name='Sheet2') # 读取名为'Sheet2'的工作表
3. 複数のワークシートを読み取る
Excel ファイル内の複数のワークシートを読み取る場合は、read_excel() メソッドを使用できます。パラメータを使用して複数のワークシートの名前を指定し、複数のデータ フレーム オブジェクトを取得します。
サンプル コード:
import pandas as pd dfs = pd.read_excel('file_path.xlsx', sheet_name=['Sheet1', 'Sheet2']) # 获取名为'Sheet1'和'Sheet2'的两个数据框对象
4. 列名とインデックス列の指定
デフォルトでは、read_excel() メソッドは最初の行を列名および最初の列として扱います。列名としてインデックス列として扱われます。列名とインデックス列を指定する場合は、header パラメーターとindex_col パラメーターを使用できます。
サンプル コード:
import pandas as pd df = pd.read_excel('file_path.xlsx', header=1, index_col=0) # 将第一行视为列名,将第一列视为索引列
5. 欠損値と空の値の処理
デフォルトでは、read_excel() メソッドは空のセルを NaN 値として扱います。 null 値を処理するために他の値を指定する場合は、na_values パラメーターを使用できます。さらに、欠損値は fillna() メソッドを使用して埋めることができます。
サンプルコード:
import pandas as pd df = pd.read_excel('file_path.xlsx', na_values='N/A') # 将空单元格视为NaN值,但将'N/A'视为一个特殊值 df = df.fillna(0) # 填充缺失值为0
以上がパンダでExcelを読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。