Trực quan hóa thuật toán Machine Leaning bằng Python

Thuật toán ML(machine learning) thường được sử dụng để tìm mối quan hệ đặc trưng giữa các features và labels. Features là các biến độc lập mà chúng ta đưa vào thuật toán để huấn luyện mô hình ML, còn labels là các biến độc lập mà chúng ta muốn dự đoán bằng thuật toán

Thuật toán ML(machine learning) thường được sử dụng để tìm mối quan hệ đặc trưng giữa các features và labels. Features là các biến độc lập mà chúng ta đưa vào thuật toán để huấn luyện mô hình ML, còn labels là các biến độc lập mà chúng ta muốn dự đoán bằng thuật toán ML. Trong bài viết ngắn này, chúng ta sẽ trực quan hóa thuật toán ML với python:

Trực quan hóa thuật toán Machine Leaning bằng Python

Trực quan hóa thuật toán học máy có nghĩa là trực quan hóa đường xu hướng của các giá trị dự đoán bằng thuật toán ML. Điều xảy ra là khi chúng ta đào tạo một mô hình ML bằng thuật toán, chúng ta cung cấp dữ liệu vào thuật toán, thuật toán sẽ tìm mối quan hệ giữa các features và labels.

Vì vậy, khi chúng ta trực quan hóa một thuật toán ML, nó sẽ hiển thị đường xu hướng của các giá trị của nhãn được dự đoán theo các features. Bây giờ, chúng ta sẽ đào tạo một thuật toán học máy đơn giản và trực quan hóa nó bằng Python. Ở đây, trước tiên chúng ta sẽ đào tạo một mô hình hồi quy tuyến tính để dự đoán doanh số bán sản phẩm dựa trên số tiền chi cho quảng cáo trên TV của sản phẩm đó, sau đó sẽ trực quan hóa các dự đoán của thuật toán hồi quy tuyến tính bằng cách sử dụng thư viện sơ đồ trong Python (các bạn có thể download dữ liệu tại đây: https://raw.githubusercontent.com/amankharwal/Website-data/master/Advertising.csv)

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split 
from sklearn.linear_model import LinearRegression

data = pd.read_csv("https://raw.githubusercontent.com/amankharwal/Website-data/master/Advertising.csv")
x = data["TV"].values.reshape(-1,1)
y = data["Sales"]

model = LinearRegression().fit(x, y)
x_range = np.linspace(x.min(), x.max(), 100)
y_range = model.predict(x_range.reshape(-1,1))

import plotly.graph_objects as go 
import plotly.express as px

figure = px.scatter(data, x = "TV", y = "Sales", opacity = 0.5)
figure.add_trace(go.Scatter(x = x_range, y = y_range, name = "Linear Regression"))
figure.show()

Trong hình trên, đường màu đỏ là đường xu hướng hiển thị các dự đoán được đưa ra bởi thuật toán hồi quy tuyến tính, không gì khác ngoài mối quan hệ giữa số tiền chi cho quảng cáo trên truyền hình và doanh số bán sản phẩm.

print(y_range)

Thuật toán ML được sử dụng để tìm mối quan hệ giữa các features và labels. Trực quan hóa thuật toán ML có nghĩa là trực quan hóa đường xu hướng của các giá trị dự đoán bằng thuật toán học máy.

Nguồn: https://thecleverprogrammer.com/

Nguồn: viblo.asia

Bài viết liên quan

9 Mẹo lập trình Web “ẩn mình” giúp tiết kiệm hàng giờ đồng hồ

Hầu hết các lập trình viên (kể cả những người giỏi) đều tốn thời gian x

Can GPT-4o Generate Images? All You Need to Know about GPT-4o-image

OpenAI‘s GPT-4o, introduced on March 25, 2025, has revolutionized the way we create visual con

Khi nào nên dùng main, section, article, header, footer, và aside trong HTML5

HTML5 đã giới thiệu các thẻ ngữ nghĩa giúp cấu trúc nội dung web một cách có

So sánh Webhook và API: Khi nào nên sử dụng?

Trong lĩnh vực công nghệ thông tin và phát triển phần mềm, Webhook và API là hai th