


Analisis regresi dan garis lurus paling sesuai menggunakan Python
Dalam tutorial ini, kami akan melaksanakan analisis regresi dan garisan paling sesuai menggunakan pengaturcaraan Python
Pengenalan
Analisis regresi ialah bentuk analisis ramalan yang paling asas.
Dalam statistik, regresi linear ialah kaedah memodelkan hubungan antara nilai skalar dan satu atau lebih pembolehubah penjelasan.
Dalam pembelajaran mesin, regresi linear ialah algoritma yang diselia. Algoritma ini meramalkan nilai sasaran berdasarkan pembolehubah bebas.
Maklumat lanjut tentang regresi linear dan analisis regresi
Dalam regresi/analisis linear, sasaran adalah nilai sebenar atau berterusan seperti gaji, BMI, dll. Ia sering digunakan untuk meramalkan hubungan antara pembolehubah bersandar dan satu set pembolehubah tidak bersandar. Model ini biasanya sesuai dengan persamaan linear, walau bagaimanapun, terdapat jenis regresi lain, termasuk polinomial tertib tinggi.
Sebelum memasang model linear pada data, adalah perlu untuk menyemak sama ada terdapat hubungan linear antara titik data. Ini terbukti dari plot taburan mereka. Matlamat algoritma/model adalah untuk mencari garisan yang paling sesuai.
Dalam artikel ini, kami akan meneroka analisis regresi linear dan pelaksanaannya menggunakan C++.
Persamaan regresi linear adalah dalam bentuk Y = c + mx, di mana Y ialah pembolehubah sasaran dan X ialah pembolehubah bebas atau parameter/pembolehubah penerangan. m ialah kecerunan garis regresi dan c ialah pintasan. Memandangkan ini adalah tugas regresi 2D, model cuba mencari garisan yang paling sesuai semasa latihan. Semua mata tidak perlu berbaris tepat pada baris yang sama. Sesetengah titik data mungkin terletak pada baris, dan beberapa mungkin bertaburan di seluruh baris. Jarak menegak antara garis dan titik data ialah baki. Nilai boleh menjadi negatif atau positif bergantung pada sama ada titik di bawah atau di atas garisan. Baki ialah ukuran sejauh mana garisan itu sesuai dengan data. Algoritma ini berterusan untuk meminimumkan jumlah baki.
Baki bagi setiap pemerhatian ialah perbezaan antara nilai ramalan y (pembolehubah bersandar) dan nilai pemerhatian y
$$mathrm{baki: =:sebenar:y:nilai:−:ramalan:y:nilai}$$
$$mathrm{ri:=:yi:−:y'i}$$
Metrik yang paling biasa untuk menilai prestasi model regresi linear dipanggil ralat purata kuasa dua punca, atau RMSE. Idea asas adalah untuk mengukur sejauh mana ramalan model yang buruk/salah dibandingkan dengan pemerhatian sebenar.
Jadi, RMSE tinggi adalah "buruk" dan RMSE rendah adalah "baik"
Ralat RMSE ialah
$$mathrm{RMSE:=:sqrt{frac{sum_i^n=1:(this:-:this')^2}{n}}}$$ p>
RMSE ialah punca bagi min kuasa dua bagi semua baki.
Dilaksanakan menggunakan Python
Contoh
# Import the libraries import numpy as np import math import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error # Generate random data with numpy, and plot it with matplotlib: ranstate = np.random.RandomState(1) x = 10 * ranstate.rand(100) y = 2 * x - 5 + ranstate.randn(100) plt.scatter(x, y); plt.show() # Creating a linear regression model based on the positioning of the data and Intercepting, and predicting a Best Fit: lr_model = LinearRegression(fit_intercept=True) lr_model.fit(x[:70, np.newaxis], y[:70]) y_fit = lr_model.predict(x[70:, np.newaxis]) mse = mean_squared_error(y[70:], y_fit) rmse = math.sqrt(mse) print("Mean Square Error : ",mse) print("Root Mean Square Error : ",rmse) # Plot the estimated linear regression line using matplotlib: plt.scatter(x, y) plt.plot(x[70:], y_fit); plt.show()
Output
Mean Square Error : 1.0859922470998231 Root Mean Square Error : 1.0421095178050257
Kesimpulan
Analisis regresi ialah teknik yang sangat mudah tetapi berkuasa yang digunakan untuk analisis ramalan dalam pembelajaran mesin dan statistik. Idea ini terletak pada kesederhanaannya dan hubungan linear yang mendasari antara pembolehubah bebas dan sasaran.
Atas ialah kandungan terperinci Analisis regresi dan garis lurus paling sesuai menggunakan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Python ialah bahasa pengaturcaraan yang digunakan secara meluas, dan keupayaan analisis data dan visualisasi yang berkuasa menjadikannya salah satu alat pilihan untuk saintis data dan jurutera pembelajaran mesin. Dalam aplikasi ini, analisis sisa ialah teknik biasa yang digunakan untuk menilai ketepatan model dan mengenal pasti sebarang bias model. Dalam artikel ini, kami akan memperkenalkan beberapa cara untuk menggunakan teknik analisis sisa dalam Python. Memahami Sisa Sebelum memperkenalkan teknik analisis sisa dalam Python, mari kita fahami dahulu apa itu sisa. Dalam statistik, baki ialah perbezaan antara nilai cerapan sebenar dan

Penegasan dalam Python ialah alat yang berguna untuk pengaturcara untuk menyahpepijat kod mereka. Ia digunakan untuk mengesahkan bahawa keadaan dalaman program memenuhi jangkaan dan menimbulkan ralat penegasan (AssertionError) apabila syarat ini palsu. Semasa proses pembangunan, penegasan digunakan semasa ujian dan penyahpepijatan untuk menyemak sama ada status kod sepadan dengan hasil yang dijangkakan. Artikel ini akan membincangkan punca, penyelesaian dan cara menggunakan penegasan dengan betul dalam kod anda. Punca ralat penegasan Pas ralat penegasan

Teknik Persampelan Berstrata dalam Persampelan Python ialah kaedah pengumpulan data yang biasa digunakan dalam statistik Ia boleh memilih sebahagian daripada sampel daripada set data untuk dianalisis untuk membuat kesimpulan ciri-ciri keseluruhan set data. Dalam era data besar, jumlah data adalah besar, dan menggunakan keseluruhan sampel untuk analisis adalah memakan masa dan tidak praktikal dari segi ekonomi. Oleh itu, pemilihan kaedah persampelan yang sesuai dapat meningkatkan kecekapan analisis data. Artikel ini terutamanya memperkenalkan teknik persampelan berstrata dalam Python. Apakah persampelan berstrata? Dalam persampelan, persampelan berstrata

Gambaran keseluruhan cara membangunkan pengimbas kerentanan melalui Python Dalam persekitaran hari ini yang meningkatkan ancaman keselamatan Internet, pengimbas kerentanan telah menjadi alat penting untuk melindungi keselamatan rangkaian. Python ialah bahasa pengaturcaraan popular yang ringkas, mudah dibaca dan berkuasa, sesuai untuk membangunkan pelbagai alat praktikal. Artikel ini akan memperkenalkan cara menggunakan Python untuk membangunkan pengimbas kerentanan untuk menyediakan perlindungan masa nyata untuk rangkaian anda. Langkah 1: Tentukan Sasaran Imbasan Sebelum membangunkan pengimbas kerentanan, anda perlu menentukan sasaran yang ingin anda imbas. Ini boleh menjadi rangkaian anda sendiri atau apa sahaja yang anda mempunyai kebenaran untuk menguji

Cara menggunakan Python untuk menulis dan melaksanakan skrip dalam Linux Dalam sistem pengendalian Linux, kita boleh menggunakan Python untuk menulis dan melaksanakan pelbagai skrip. Python ialah bahasa pengaturcaraan ringkas dan berkuasa yang menyediakan banyak perpustakaan dan alatan untuk menjadikan skrip lebih mudah dan lebih cekap. Di bawah ini kami akan memperkenalkan langkah asas cara menggunakan Python untuk penulisan dan pelaksanaan skrip dalam Linux, dan menyediakan beberapa contoh kod khusus untuk membantu anda memahami dan menggunakannya dengan lebih baik. Pasang Python

Contoh penggunaan dan kod fungsi sqrt() dalam Python 1. Fungsi dan pengenalan fungsi sqrt() Dalam pengaturcaraan Python, fungsi sqrt() ialah fungsi dalam modul matematik, dan fungsinya adalah untuk mengira punca kuasa dua bagi nombor. Punca kuasa dua bermaksud nombor yang didarab dengan sendirinya sama dengan kuasa dua nombor itu, iaitu, x*x=n, maka x ialah punca kuasa dua bagi n. Fungsi sqrt() boleh digunakan dalam atur cara untuk mengira punca kuasa dua. 2. Cara menggunakan fungsi sqrt() dalam Python, sq

Amalan pengaturcaraan Python: Cara menggunakan API Peta Baidu untuk menjana fungsi peta statik Pengenalan: Dalam masyarakat moden, peta telah menjadi bahagian yang amat diperlukan dalam kehidupan manusia. Apabila bekerja dengan peta, kami selalunya perlu mendapatkan peta statik kawasan tertentu untuk dipaparkan pada halaman web, apl mudah alih atau laporan. Artikel ini akan memperkenalkan cara menggunakan bahasa pengaturcaraan Python dan API Peta Baidu untuk menjana peta statik dan menyediakan contoh kod yang berkaitan. 1. Kerja-kerja penyediaan Bagi merealisasikan fungsi penjanaan peta statik menggunakan API Peta Baidu, I

Pengaturcaraan Python untuk menganalisis fungsi penukaran koordinat dalam dokumentasi API Peta Baidu Pengenalan: Dengan perkembangan pesat Internet, fungsi penentududukan peta telah menjadi bahagian yang amat diperlukan dalam kehidupan orang moden. Sebagai salah satu perkhidmatan peta paling popular di China, Peta Baidu menyediakan satu siri API untuk digunakan oleh pembangun. Artikel ini akan menggunakan pengaturcaraan Python untuk menganalisis fungsi penukaran koordinat dalam dokumentasi API Peta Baidu dan memberikan contoh kod yang sepadan. 1. Pengenalan Dalam pembangunan, kita kadangkala melibatkan isu penukaran koordinat. AP Peta Baidu
