データ処理初心者もすぐに上達できるPython Pandas実践ドリル!
-
read_csv()
を使用して CSV ファイルを読み取ります:df = pd.read_csv("data.csv")
- 欠損値の処理:
- 欠損値の削除:
df = df.dropna()
- 欠損値を埋める:
df["column_name"].fillna(value)
- 欠損値の削除:
- データ型の変換:
df["column_name"] = df["column_name"].astype(dtype)
-
並べ替えとグループ化:
- 並べ替え:
df.sort_values(by="column_name")
- グループ:
groupby_object = df.groupby(by="column_name")
- 並べ替え:
2. データ分析
-
###統計###
-
- describe()
- : データの基本統計を表示します
- : 平均値を計算します
- : 標準偏差の計算
- : データの基本統計を表示します
-
- plot()
- : 折れ線グラフや散布図などのさまざまな種類のグラフを生成します
- :棒グラフの生成
- :円グラフの生成
- : 折れ線グラフや散布図などのさまざまな種類のグラフを生成します
-
- agg()
- : グループ化されたデータに集計関数を適用します
- : データを要約および分析するためのクロス集計を作成します
- : グループ化されたデータに集計関数を適用します
- インデックス
- とスライス:
- loc[index_values]
- : インデックス値によるデータの取得
- : インデックス位置によるデータの取得
- : 条件によるデータのフィルタリング
- : インデックス値によるデータの取得
-
- append()
- :データをDataFrameに追加します
- : 2 つ以上の DataFrame をマージします
- : 複数の DataFrame を連結します
- :データをDataFrameに追加します
-
- apply()
- :関数を行ごとまたは列ごとに適用します
- : データを変換する匿名関数を作成します
- :関数を行ごとまたは列ごとに適用します
カスタム関数: カスタム関数を作成して使用し、
- pandas
- の機能を拡張します。 ベクトル化操作: NumPy のベクトル化関数を使用して効率を向上させる
- データクリーニング:
-
- str.strip()
- :
string
から空白文字 を削除します str.replace() - : 文字列または
正規表現
内の文字を置換します。 str. lower() - : 文字列を小文字に変換します
- :
顧客データの分析: 顧客の行動、購入パターン、傾向を理解する
- 財務データの処理: 財務指標の計算、株式パフォーマンスの分析
- 科学データの探索: センサー データの処理と実験結果の分析
以上がデータ処理初心者もすぐに上達できるPython Pandas実践ドリル!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











Oracle の SUM は null 以外の値の合計を計算するために使用されますが、COUNT は重複値を含むすべてのデータ型の null 以外の値の数をカウントします。

SQL の SUM() 関数は、数値列の合計を計算するために使用されます。指定された列、フィルター、エイリアス、複数の列のグループ化と集計に基づいて合計を計算できますが、数値のみを処理し、NULL 値は無視されます。

MySQL の AVG() 関数は、数値の平均を計算するために使用されます。これは、次のようなさまざまな使用法をサポートしています: 販売されたすべての製品の平均数量を計算する: SELECT AVG(quantity_ sold) FROM sales; 平均価格を計算する: AVG(price); 平均販売数量を計算する: AVG(quantity_ sold *price)。 AVG() 関数は NULL 値を無視します。IFNULL() を使用して、NULL 以外の値の平均を計算します。

Oracle の COUNT 関数は、指定された列または式内の null 以外の値をカウントするために使用されます。構文は COUNT(DISTINCT <column_name>) または COUNT(*) で、一意の値とすべての非 null 値の数をカウントします。 -null値それぞれ。

GROUP BY は、指定された列に基づいてデータをグループ化し、集計操作を実行するために使用される SQL の集計関数です。これにより、ユーザーは次のことが可能になります。 特定の列値に基づいてデータ行をグループ化します。各グループに集計関数 (合計、カウント、平均など) を適用します。大規模なデータセットから意味のある要約を作成し、データの集計とグループ化を実行します。

SC は SQL の SELECT COUNT の略で、条件が満たされるかどうかに関係なくレコードの数をカウントするために使用される集計関数です。 SC 構文: SELECT COUNT(*) AS Record_count FROM table_name WHERE 条件、COUNT(*) はすべてのレコードの数をカウントし、table_name はテーブル名、condition はオプションの条件 (条件を満たすレコードの数をカウントするために使用されます)状態)。

SQL SUM 関数は、一連の数値を加算して合計を計算します。演算プロセスには次のものが含まれます: 1. 入力値を識別する; 2. 入力値をループして数値に変換する; 3. 各数値を加算して合計を計算する; 4. 合計結果を返す。

HAVING 句は、GROUP BY 句によってグループ化された結果セットをフィルタリングするために使用されます。その構文は HAVING <condition> です。<condition> はブール式です。 WHERE 句との違いは、HAVING 句は集計後にグループをフィルタリングするのに対し、WHERE 句は集計前に行をフィルタリングすることです。これを使用して、グループ化された結果セットのフィルタリング、データの集計計算の実行、階層レポートの作成、またはクエリの要約を行うことができます。
