Trực quan hóa thuật toán Machine Leaning bằng Python

Thuật toán ML(machine learning) thường được sử dụng để tìm mối quan hệ đặc trưng giữa các features và labels. Features là các biến độc lập mà chúng ta đưa vào thuật toán để huấn luyện mô hình ML, còn labels là các biến độc lập mà chúng ta muốn dự đoán bằng thuật toán

Thuật toán ML(machine learning) thường được sử dụng để tìm mối quan hệ đặc trưng giữa các features và labels. Features là các biến độc lập mà chúng ta đưa vào thuật toán để huấn luyện mô hình ML, còn labels là các biến độc lập mà chúng ta muốn dự đoán bằng thuật toán ML. Trong bài viết ngắn này, chúng ta sẽ trực quan hóa thuật toán ML với python:

Trực quan hóa thuật toán Machine Leaning bằng Python

Trực quan hóa thuật toán học máy có nghĩa là trực quan hóa đường xu hướng của các giá trị dự đoán bằng thuật toán ML. Điều xảy ra là khi chúng ta đào tạo một mô hình ML bằng thuật toán, chúng ta cung cấp dữ liệu vào thuật toán, thuật toán sẽ tìm mối quan hệ giữa các features và labels.

Vì vậy, khi chúng ta trực quan hóa một thuật toán ML, nó sẽ hiển thị đường xu hướng của các giá trị của nhãn được dự đoán theo các features. Bây giờ, chúng ta sẽ đào tạo một thuật toán học máy đơn giản và trực quan hóa nó bằng Python. Ở đây, trước tiên chúng ta sẽ đào tạo một mô hình hồi quy tuyến tính để dự đoán doanh số bán sản phẩm dựa trên số tiền chi cho quảng cáo trên TV của sản phẩm đó, sau đó sẽ trực quan hóa các dự đoán của thuật toán hồi quy tuyến tính bằng cách sử dụng thư viện sơ đồ trong Python (các bạn có thể download dữ liệu tại đây: https://raw.githubusercontent.com/amankharwal/Website-data/master/Advertising.csv)

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split 
from sklearn.linear_model import LinearRegression

data = pd.read_csv("https://raw.githubusercontent.com/amankharwal/Website-data/master/Advertising.csv")
x = data["TV"].values.reshape(-1,1)
y = data["Sales"]

model = LinearRegression().fit(x, y)
x_range = np.linspace(x.min(), x.max(), 100)
y_range = model.predict(x_range.reshape(-1,1))

import plotly.graph_objects as go 
import plotly.express as px

figure = px.scatter(data, x = "TV", y = "Sales", opacity = 0.5)
figure.add_trace(go.Scatter(x = x_range, y = y_range, name = "Linear Regression"))
figure.show()

Trong hình trên, đường màu đỏ là đường xu hướng hiển thị các dự đoán được đưa ra bởi thuật toán hồi quy tuyến tính, không gì khác ngoài mối quan hệ giữa số tiền chi cho quảng cáo trên truyền hình và doanh số bán sản phẩm.

print(y_range)

Thuật toán ML được sử dụng để tìm mối quan hệ giữa các features và labels. Trực quan hóa thuật toán ML có nghĩa là trực quan hóa đường xu hướng của các giá trị dự đoán bằng thuật toán học máy.

Nguồn: https://thecleverprogrammer.com/

Nguồn: viblo.asia

Bài viết liên quan

WebP là gì? Hướng dẫn cách để chuyển hình ảnh jpg, png qua webp

WebP là gì? WebP là một định dạng ảnh hiện đại, được phát triển bởi Google

Điểm khác biệt giữa IPv4 và IPv6 là gì?

IPv4 và IPv6 là hai phiên bản của hệ thống địa chỉ Giao thức Internet (IP). IP l

Check nameservers của tên miền xem website trỏ đúng chưa

Tìm hiểu cách check nameservers của tên miền để xác định tên miền đó đang dùn

Mình đang dùng Google Domains để check tên miền hàng ngày

Từ khi thông báo dịch vụ Google Domains bỏ mác Beta, mình mới để ý và bắt đầ