目次
Data
Prediction
回帰直線を描く

Python での一変量線形回帰の例

Jun 09, 2023 pm 11:04 PM
python 戻る 線形

Python は非常に人気のあるプログラミング言語であり、その強力な科学計算機能とデータ処理機能により、データ分析や機械学習の分野で広く使用されています。この記事では、データ モデリングと予測に Python で一変量線形回帰を使用する方法を紹介し、例を通じてその実際の応用例を示します。

まず第一に、線形回帰とは何ですか?統計と機械学習では、線形回帰は 2 つの変数間の関係を確立するために使用される方法です。単変量線形回帰では、説明変数 (独立変数) と応答変数 (従属変数) が 1 つだけあります。

次に、Python で scikit-learn ライブラリを使用して一変量線形回帰を実装する方法を紹介します。 scikit-learn は、データ モデリングと視覚化のためのツールが多数含まれている人気の機械学習ライブラリです。

ステップ 1: ライブラリとデータをインポートする
まず、いくつかのライブラリをインポートする必要があります。この記事では、NumPy、Pandas、Matplotlib、Scikit-learn を使用します。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

次に、必要なものを準備する必要がありますデータを分析するため。この例では、非常に単純なデータ セットである、住宅のサイズと価格に関するデータ セットを使用します。

Data

df = pd.DataFrame({'エリア': [1400, 1600, 1700, 1875, 1100, 1550, 2350, 2450, 1425, 1700],

               '价格': [245000, 312000, 279000, 308000, 199000, 219000, 405000, 324000, 319000, 255000]})
ログイン後にコピー

print(df)

出力は次のとおりです:

面积      价格
ログイン後にコピー

0 1400 245000
1 1600 312000
2 1700 279000
3 1875 308000
4 1100 199000
5 1550 219000
6 2350 405000
7 2450 324000
8 1425 319000
9 1700 255000

#ステップ 2: データ分析と視覚化
データをインポートしたら、データ分析と視覚化を開始できます。横軸が住宅面積、縦軸が販売価格である散布図を描きましょう。

plt.scatter(df['area '], df['price'])
plt.xlabel('area')
plt.ylabel('price')
plt.show()

出力:

この散布図は、家の面積が増加するにつれて、販売価格も増加することを示しています。したがって、これら 2 つの変数の間には線形関係がある可能性があります。

ステップ 3:線形回帰モデルの近似
これで、線形回帰モデルの近似を開始できます。scikit-learn では、LinearRegression() 関数を使用して線形モデルを構築する必要があります。

X = df[[ 'area']]
Y = df['price']
model = LinearRegression().fit(X, Y)

ここでは、面積を独立変数 X に代入します。価格を従属変数 Y に渡し、LinearRegression() 関数に渡します。モデルをフィッティングした後、傾きと切片を確認できます。

print('Slope:', model.coef_)
print ('切片:'、モデル .intercept_)

出力:

傾き: [126.88610769]
切片: 36646.35077294225

ステップ 4: 視覚化の結果
完了モデルのトレーニングでは、Matplotlib を使用して回帰直線を描画し、住宅価格を予測できます。次のコードは、新築住宅エリアの販売価格を予測する方法を示します。

Prediction

y_pred = model.predict([[2000]])
print('予測販売価格:', y_pred)

回帰直線を描く

plt.scatter(df['area'], df['price'])
plt.plot(df['area'], model.predict(df[['area']]) 、color ='r')
plt.xlabel('area')
plt.ylabel('price')
plt.show()

出力:

Yes 回帰直線がデータ ポイントに適合していることを確認すると、適合モデルを使用して新築住宅の販売価格を平方フィート単位で予測できます。

この記事では、Python で scikit-learn ライブラリを使用して、データの準備、データ分析と視覚化、線形回帰モデルのフィッティング、結果の予測などの一変量線形回帰を実装する方法を紹介します。線形回帰は、2 つの変数間の関係を調査し、予測を行うために使用できるシンプルかつ強力なツールであり、データ分析や機械学習に幅広く応用できます。

以上がPython での一変量線形回帰の例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

C言語合計の機能は何ですか? C言語合計の機能は何ですか? Apr 03, 2025 pm 02:21 PM

C言語に組み込みの合計機能はないため、自分で書く必要があります。合計は、配列を通過して要素を蓄積することで達成できます。ループバージョン:合計は、ループとアレイの長さを使用して計算されます。ポインターバージョン:ポインターを使用してアレイ要素を指し示し、効率的な合計が自己概要ポインターを通じて達成されます。アレイバージョンを動的に割り当てます:[アレイ]を動的に割り当ててメモリを自分で管理し、メモリの漏れを防ぐために割り当てられたメモリが解放されます。

誰がより多くのPythonまたはJavaScriptを支払われますか? 誰がより多くのPythonまたはJavaScriptを支払われますか? Apr 04, 2025 am 12:09 AM

スキルや業界のニーズに応じて、PythonおよびJavaScript開発者には絶対的な給与はありません。 1. Pythonは、データサイエンスと機械学習でさらに支払われる場合があります。 2。JavaScriptは、フロントエンドとフルスタックの開発に大きな需要があり、その給与もかなりです。 3。影響要因には、経験、地理的位置、会社の規模、特定のスキルが含まれます。

独特の目標は関連していますか? 独特の目標は関連していますか? Apr 03, 2025 pm 10:30 PM

明確で明確なものは区別に関連していますが、それらは異なる方法で使用されます。明確な(形容詞)は、物事自体の独自性を説明し、物事の違いを強調するために使用されます。明確な(動詞)は、区別の動作または能力を表し、差別プロセスを説明するために使用されます。プログラミングでは、個別は、重複排除操作などのコレクション内の要素の独自性を表すためによく使用されます。明確なは、奇数や偶数の偶数を区別するなど、アルゴリズムまたは関数の設計に反映されます。最適化する場合、異なる操作は適切なアルゴリズムとデータ構造を選択する必要がありますが、異なる操作は、論理効率の区別を最適化し、明確で読み取り可能なコードの書き込みに注意を払う必要があります。

Cで理解する方法!x? Cで理解する方法!x? Apr 03, 2025 pm 02:33 PM

!X理解!Xは、C言語の論理的な非操作者です。 Xの値をブーリングします。つまり、虚偽の真の変化、trueへの誤った変更です。ただし、Cの真実と虚偽はブール型ではなく数値で表されていることに注意してください。非ゼロは真であると見なされ、0のみが偽と見なされます。したがって、!xは正の数と同じ負の数を扱い、真実と見なされます。

c言語でsumとはどういう意味ですか? c言語でsumとはどういう意味ですか? Apr 03, 2025 pm 02:36 PM

Cには組み込みの合計関数はありませんが、次のように実装できます。ループを使用して要素を1つずつ蓄積します。ポインターを使用して、要素に1つずつアクセスして蓄積します。大量のデータ量については、並列計算を検討してください。

H5ページの生産には継続的なメンテナンスが必要ですか? H5ページの生産には継続的なメンテナンスが必要ですか? Apr 05, 2025 pm 11:27 PM

H5ページは、コードの脆弱性、ブラウザー互換性、パフォーマンスの最適化、セキュリティの更新、ユーザーエクスペリエンスの改善などの要因のため、継続的に維持する必要があります。効果的なメンテナンス方法には、完全なテストシステムの確立、バージョン制御ツールの使用、定期的にページのパフォーマンスの監視、ユーザーフィードバックの収集、メンテナンス計画の策定が含まれます。

58.com作業ページでリアルタイムアプリケーションと視聴者のデータを取得する方法は? 58.com作業ページでリアルタイムアプリケーションと視聴者のデータを取得する方法は? Apr 05, 2025 am 08:06 AM

クロール中に58.com作業ページの動的データを取得するにはどうすればよいですか? Crawlerツールを使用して58.comの作業ページをrawったら、これに遭遇する可能性があります...

ラブコードのコピーをコピーして貼り付けて無料でラブコードを貼り付けます ラブコードのコピーをコピーして貼り付けて無料でラブコードを貼り付けます Apr 04, 2025 am 06:48 AM

コードのコピーと貼り付けは不可能ではありませんが、注意して扱う必要があります。コード内の環境、ライブラリ、バージョンなどの依存関係は、現在のプロジェクトと一致しないため、エラーや予測不可能な結果が得られます。ファイルパス、従属ライブラリ、Pythonバージョンなど、コンテキストが一貫していることを確認してください。さらに、特定のライブラリのコードをコピーして貼り付けるときは、ライブラリとその依存関係をインストールする必要がある場合があります。一般的なエラーには、パスエラー、バージョンの競合、一貫性のないコードスタイルが含まれます。パフォーマンスの最適化は、コードの元の目的と制約に従って再設計またはリファクタリングする必要があります。コピーされたコードを理解してデバッグすることが重要であり、盲目的にコピーして貼り付けないでください。

See all articles