Python での効率的なデータ処理は一見の価値があります-Python チュートリアル-php.cn

Pandas を使用すると、非常に簡単な方法で 2 つのグラフィックの形状比較を取得できます: " > Pandas を使用すると、非常に簡単な方法で 2 つのグラフィックの形状比較を取得できます:

ホームページ

バックエンド開発

Python チュートリアル

Python での効率的なデータ処理は一見の価値があります

烟雨青岚

Jun 16, 2020 pm 05:31 PM

pandas python

Python での効率的なデータ処理は一見の価値があります

一見の価値のある Python の効率的なデータ処理

Pandas は Python で非常に一般的に使用されるデータ処理ツールであり、非常に使いやすいです。 NumPy の配列構造上に構築されているため、演算の多くは NumPy や Pandas に付属する拡張モジュールを介して記述されており、これらのモジュールは Cython で記述されて C にコンパイルされ、C 上で実行されるため、処理速度が確保されています。

今日私たちはその力を体験します。

1. データの作成

pandas を使用すると簡単にデータを作成できます。ここで、5 列、1000 行の pandas DataFrame を作成しましょう:

mu1, sigma1 = 0, 0.1
mu2, sigma2 = 0.2, 0.2
n = 1000df = pd.DataFrame(
    {
        "a1": pd.np.random.normal(mu1, sigma1, n),
        "a2": pd.np.random.normal(mu2, sigma2, n),
        "a3": pd.np.random.randint(0, 5, n),
        "y1": pd.np.logspace(0, 1, num=n),
        "y2": pd.np.random.randint(0, 2, n),
    }
)

ログイン後にコピー

a3: 0 ～ 4 のランダムな整数。
y1: 0 から 1 までの対数スケールで均一に分布します。
y2: 0 から 1 までのランダムな整数。

以下に示すデータを生成します:

2. 画像を描画します

Pandas 描画関数matplotlib 座標軸 (Axes) を返すので、必要なものをカスタマイズできます。たとえば、垂直線と平行線を描きます。これは私たちにとって非常に有益です:

1. 平均線を描きます

2. 重要な点をマークします

import matplotlib.pyplot as plt
ax = df.y1.plot()
ax.axhline(6, color="red", linestyle="--")
ax.axvline(775, color="red", linestyle="--")
plt.show()

ログイン後にコピー

グラフに表示するテーブルの数をカスタマイズすることもできます:

fig, ax = plt.subplots(2, 2, figsize=(14,7))
df.plot(x="index", y="y1", ax=ax[0, 0])
df.plot.scatter(x="index", y="y2", ax=ax[0, 1])
df.plot.scatter(x="index", y="a3", ax=ax[1, 0])
df.plot(x="index", y="a1", ax=ax[1, 1])
plt.show()

ログイン後にコピー

#3. ヒストグラムを描画します

Pandas を使用すると、非常に簡単な方法で 2 つのグラフィックの形状比較を取得できます:

df[["a1", "a2"]].plot(bins=30, kind="hist")
plt.show()

ログイン後にコピー

また、複数のグラフィックを描画することもできます:

df[["a1", "a2"]].plot(bins=30, kind="hist", subplots=True)
plt.show()

ログイン後にコピー

もちろん、折れ線グラフの生成も簡単ではありません:

df[['a1', 'a2']].plot(by=df.y2, subplots=True)
plt.show()

ログイン後にコピー

4. 線形フィッティング

パンダもフィッティングに使用できます。パンダを使用して、次の図に最も近い直線を見つけてみましょう:

最小二乗法メソッドは最短直線距離を計算します:

df['ones'] = pd.np.ones(len(df))
m, c = pd.np.linalg.lstsq(df[['index', 'ones']], df['y1'], rcond=None)[0]

ログイン後にコピー

最小二乗結果に基づいて y と近似直線を描画します:

df['y'] = df['index'].apply(lambda x: x * m + c)
df[['y', 'y1']].plot()
plt.show()

ログイン後にコピー

読んでいただきありがとうございます。多くの恩恵を受けることを願っています。

この記事は、https://blog.csdn.net/u010751000/article/details/106735872

」

以上がPython での効率的なデータ処理は一見の価値がありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7439

CakePHP チュートリアル

1369

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

Related knowledge

C言語合計の機能は何ですか？ Apr 03, 2025 pm 02:21 PM

C言語に組み込みの合計機能はないため、自分で書く必要があります。合計は、配列を通過して要素を蓄積することで達成できます。ループバージョン：合計は、ループとアレイの長さを使用して計算されます。ポインターバージョン：ポインターを使用してアレイ要素を指し示し、効率的な合計が自己概要ポインターを通じて達成されます。アレイバージョンを動的に割り当てます：[アレイ]を動的に割り当ててメモリを自分で管理し、メモリの漏れを防ぐために割り当てられたメモリが解放されます。

誰がより多くのPythonまたはJavaScriptを支払われますか？ Apr 04, 2025 am 12:09 AM

スキルや業界のニーズに応じて、PythonおよびJavaScript開発者には絶対的な給与はありません。 1. Pythonは、データサイエンスと機械学習でさらに支払われる場合があります。 2。JavaScriptは、フロントエンドとフルスタックの開発に大きな需要があり、その給与もかなりです。 3。影響要因には、経験、地理的位置、会社の規模、特定のスキルが含まれます。

独特の目標は関連していますか？ Apr 03, 2025 pm 10:30 PM

明確で明確なものは区別に関連していますが、それらは異なる方法で使用されます。明確な（形容詞）は、物事自体の独自性を説明し、物事の違いを強調するために使用されます。明確な（動詞）は、区別の動作または能力を表し、差別プロセスを説明するために使用されます。プログラミングでは、個別は、重複排除操作などのコレクション内の要素の独自性を表すためによく使用されます。明確なは、奇数や偶数の偶数を区別するなど、アルゴリズムまたは関数の設計に反映されます。最適化する場合、異なる操作は適切なアルゴリズムとデータ構造を選択する必要がありますが、異なる操作は、論理効率の区別を最適化し、明確で読み取り可能なコードの書き込みに注意を払う必要があります。

Cで理解する方法！x？ Apr 03, 2025 pm 02:33 PM

！X理解！Xは、C言語の論理的な非操作者です。 Xの値をブーリングします。つまり、虚偽の真の変化、trueへの誤った変更です。ただし、Cの真実と虚偽はブール型ではなく数値で表されていることに注意してください。非ゼロは真であると見なされ、0のみが偽と見なされます。したがって、！xは正の数と同じ負の数を扱い、真実と見なされます。

c言語でsumとはどういう意味ですか？ Apr 03, 2025 pm 02:36 PM

Cには組み込みの合計関数はありませんが、次のように実装できます。ループを使用して要素を1つずつ蓄積します。ポインターを使用して、要素に1つずつアクセスして蓄積します。大量のデータ量については、並列計算を検討してください。

H5ページの生産には継続的なメンテナンスが必要ですか？ Apr 05, 2025 pm 11:27 PM

H5ページは、コードの脆弱性、ブラウザー互換性、パフォーマンスの最適化、セキュリティの更新、ユーザーエクスペリエンスの改善などの要因のため、継続的に維持する必要があります。効果的なメンテナンス方法には、完全なテストシステムの確立、バージョン制御ツールの使用、定期的にページのパフォーマンスの監視、ユーザーフィードバックの収集、メンテナンス計画の策定が含まれます。

58.com作業ページでリアルタイムアプリケーションと視聴者のデータを取得する方法は？ Apr 05, 2025 am 08:06 AM

クロール中に58.com作業ページの動的データを取得するにはどうすればよいですか？ Crawlerツールを使用して58.comの作業ページをrawったら、これに遭遇する可能性があります...

ラブコードのコピーをコピーして貼り付けて無料でラブコードを貼り付けます Apr 04, 2025 am 06:48 AM

コードのコピーと貼り付けは不可能ではありませんが、注意して扱う必要があります。コード内の環境、ライブラリ、バージョンなどの依存関係は、現在のプロジェクトと一致しないため、エラーや予測不可能な結果が得られます。ファイルパス、従属ライブラリ、Pythonバージョンなど、コンテキストが一貫していることを確認してください。さらに、特定のライブラリのコードをコピーして貼り付けるときは、ライブラリとその依存関係をインストールする必要がある場合があります。一般的なエラーには、パスエラー、バージョンの競合、一貫性のないコードスタイルが含まれます。パフォーマンスの最適化は、コードの元の目的と制約に従って再設計またはリファクタリングする必要があります。コピーされたコードを理解してデバッグすることが重要であり、盲目的にコピーして貼り付けないでください。

See all articles

Python での効率的なデータ処理は一見の価値があります

1. データの作成

2. 画像を描画します

Pandas を使用すると、非常に簡単な方法で 2 つのグラフィックの形状比較を取得できます:

パンダもフィッティングに使用できます。パンダを使用して、次の図に最も近い直線を見つけてみましょう:

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック