Nhân dịp đầu năm mới, chúc mọi người cùng gia đình luôn tràn đầy sức khỏe, an khang thịnh vượng!
Chào mọi người, sau một thời gian vắng bóng trên mặt trận chia sẻ kiến thức trên Viblo thì nay mình đã trở lại rồi đây. Trong không khí nghỉ lễ, trên khắp các mặt trận, đặc biệt là TikTok, mình thấy các reviewer liên tục đề cập tới một hiện tượng tương đối hot – ChatGPT. ChatGPT là gì? Tại sao nó lại hot như vậy? Có gì đáng lo ngại không? Cùng mình tìm hiểu qua về nó nhé!
ChatGPT là gì?
- ChatGPT được OpenAI phát hành vào ngày 30 tháng 11 năm 2022. Nó là một mô hình tối ưu hóa ngôn ngữ cho hội thoai (Optimizing Language Model for Dialogue). Lượng dữ liệu cho nó tương đối khủng, có thể kể tới như dữ liệu chat với Chatbot, dữ liệu phản hồi được đánh giá từ các người dùng chọn lọc, … ngoài ra còn được tinh chỉnh lời văn nhờ sự giúp đỡ từ các giảng viên (theo OpenAI báo cáo).
- ChatGPT có thể được sử dụng cho các tác vụ xử lý ngôn ngữ tự nhiên như tạo văn bản và dịch ngôn ngữ. Nó dựa trên mô hình GPT-3.5 (Generative Pretraining Transformer 3.5), một trong những mô hình ngôn ngữ lớn nhất và tiên tiến nhất hiện có.
Nó làm được gì mà hot đến vậy?
-
Một trong những tính năng chính của ChatGPT là khả năng tạo phản hồi bằng văn bản giống con người đối với lời nhắc. Điều này làm cho nó trở nên hữu ích cho nhiều ứng dụng, chẳng hạn như tạo chatbot cho dịch vụ khách hàng, tạo câu trả lời cho các câu hỏi trên diễn đàn trực tuyến hoặc thậm chí tạo nội dung được cá nhân hóa cho các bài đăng trên mạng xã hội. Một trong những ứng dụng của nó gây rầm rộ trong thời gian gần đây là khả năng tạo một đoạn văn hoàn chỉnh hay một đoạn code hoàn chỉnh cho một chương trình đơn giản nào đó (tất nhiên khả năng vẫn còn bug nhưng đạt được đến như vậy đã là một điều gì đó hỗ trợ các lập trình viên rồi)
-
GPT-3.5 đã được đào tạo dựa trên lượng dữ liệu khổng lồ về mã và thông tin từ internet, bao gồm các nguồn như thảo luận Reddit, để giúp ChatGPT học cách đối thoại và đạt được phong cách phản hồi của con người.
-
ChatGPT cũng được đào tạo bằng cách sử dụng phản hồi của con người (một kỹ thuật gọi là Học tăng cường với phản hồi của con người) để AI biết được những gì con người mong đợi khi họ đặt câu hỏi. Đào tạo Large Language Model (LLM) theo cách này là một cuộc cách mạng vì nó không chỉ đơn giản là đào tạo LLM để dự đoán từ tiếp theo.
-
Một vài hạn chế có thể kế tới như
- Chất lượng câu trả lời phụ thuộc vào chất lượng hướng dẫn, cụ thể trong câu hỏi
- Câu trả lời không phải lúc nào cũng đúng
- Tùy mục đích sử dụng mà có thể có hại
-
Các bước để sử dụng ChatGPT:
- Mở openai.com,Đăng ký tài khoản và đăng nhập (nếu có tài khoản thì đăng nhập trực tiếp)
- Nhấp vào ChatGPT ở dưới cùng bên trái
- Nhấp vào Dùng thử ngay bây giờ tại chat.openai.com .
- Nhập câu hỏi cần truy vấn vào ô nhập liệu phía dưới
Thảm họa có thể xảy ra?
1. Tin giả
Việc lan truyền thông tin sai lệch là một trong những vấn đề nghiêm trọng nhất mà ChatGPT có thể gặp phải. Đầu tiên là việc tin tức giả mạo, không đáng tin được lan truyền với tốc độ chóng mặt, cộng thêm cái hiệu ứng tam sao thất bản nữa thì chẳng biết câu chuyện sẽ đi về đâu. Tin tức giả mạo và nội dung thông tin sai lệch khác có thể lan truyền nhanh chóng và rộng rãi, đặc biệt là trên các nền tảng mạng xã hội, khiến việc ngăn chặn hoặc chống lại càng khó khăn hơn. Với kỷ nguyên về dữ liệu, việc sử dụng dữ liệu ngày nay để đào tạo các mô hình phán đoán thì nó có thể dẫn đến việc mô hình phân phối thông tin sai lệch. Ngoài ra, ChatGPT có khả năng có thể bị các tác nhân độc hại sử dụng để tạo và lan truyền tin tức giả mạo, tiếp tục khuếch đại phạm vi tiếp cận và tác động của nó.
Do đó, các biện pháp phải được đưa ra để đảm bảo rằng mô hình không được sử dụng cho các mục đích bất chính. Điều này có thể bao gồm các quy định và hướng dẫn, cũng như việc thực hiện kiểm tra và cân bằng chẳng hạn như kiểm tra chéo các nguồn và xác minh tính chính xác của thông tin trước khi nó được phổ biến.
2. Thư rác
Một bài toán điển hình khi ta bước vào học máy: Phân loại thư rác. Ở đây thì Spam là một trong những thứ tồi tệ nhất của ChatGPT. Mô hình có thể xuất một lượng văn bản đáng kể để phản hồi lời nhắc, điều này có thể dẫn đến việc tạo thư rác hoặc thư không mong muốn. Chắc chắn việc này cũng đặc biệt liên quan đến mô hình đang được sử dụng cho mục đích tiếp thị hoặc quảng cáo.
3. Lừa đảo
Một trong những rủi ro lớn nhất liên quan đến ChatGPT là lừa đảo. Lừa đảo là hành vi gửi email hoặc tin nhắn được ngụy trang dưới dạng một nguồn hợp pháp để lấy dữ liệu cá nhân, chẳng hạn như mật khẩu hoặc thông tin thẻ tín dụng. Vì ChatGPT có thể tạo văn bản trông giống như thật nên nó có thể được sử dụng để tạo các thông báo thuyết phục có thể đánh lừa những người dùng cả tin. Điều này gây ra rủi ro lớn đối với dữ liệu và tài khoản của người dùng, đặc biệt nếu mô hình được sử dụng trong bối cảnh công cộng hoặc chuyên nghiệp.
4. Tài khoản bị xâm phạm
Rủi ro tiếp theo liên quan đến ChatGPT là khả năng tài khoản bị xâm phạm. Mô hình được đào tạo trên tập dữ liệu văn bản lớn và có thể tạo văn bản giống với lời nói của con người. Điều này giúp các tác nhân độc hại dễ dàng tạo các thông báo thuyết phục và đáng tin cậy có thể được sử dụng để giành quyền truy cập vào tài khoản người dùng hoặc truyền bá thông tin sai lệch. Ví dụ: kẻ lừa đảo có thể sử dụng ChatGPT để tạo một email có vẻ như đến từ một nguồn hợp pháp nhằm lấy thông tin nhạy cảm như mật khẩu hoặc số thẻ tín dụng.
OpenAI đã nhận ra rủi ro này và đã thực hiện các bước để giảm thiểu nó bằng cách đào tạo mô hình để xác định và gắn cờ hoạt động đáng ngờ. Tuy nhiên, điều quan trọng là người dùng vẫn phải cảnh giác và thực hiện các bước để bảo vệ tài khoản của họ khỏi các mối đe dọa tiềm ẩn do ChatGPT gây ra. Điều này bao gồm sử dụng mật khẩu mạnh, cho phép xác thực hai yếu tố và thường xuyên theo dõi các tài khoản để phát hiện hoạt động đáng ngờ.
5. Chatbot độc hại
Một ứng dụng không thể thiếu của ChatGPT đó là chatbot, tuy nhiên bên cạnh đó là khả năng xảy ra các chatbot độc hại. Với ChatGPT, mô hình có thể nhanh chóng đáp ứng các yêu cầu tạo phần mềm độc hại nguy hiểm, hay các phản hồi không phù hợp hoặc gây khó chịu từ mô hình là một mối quan tâm lớn khác.
6. Hành vi săn mồi
Việc thiếu đạo đức liên quan đến nội dung do AI tạo ra cũng là một vấn đề. Vì mô hình không có tập hợp niềm tin và quan điểm riêng nên nó có thể đưa ra câu trả lời sai hoặc nguy hiểm. Ngoài ra, nếu mô hình được đào tạo dựa trên dữ liệu sai lệch, nó cũng sẽ tạo ra kết quả sai lệch. Điều này có thể dẫn đến việc duy trì các khuôn mẫu tiêu cực.
7. Đánh cắp dữ liệu
Trộm cắp dữ liệu là một mối quan tâm nghiêm trọng khi nói đến ChatGPT của OpenAI. Vì mô hình được đào tạo trên một tập dữ liệu văn bản lớn nên nó có khả năng truy cập và xử lý dữ liệu người dùng, điều này có thể dẫn đến hành vi trộm cắp danh tính hoặc các loại hành vi trộm cắp dữ liệu khác. Điều quan trọng là phải nhận thức được rủi ro này và thực hiện các bước để bảo vệ mọi thông tin nhạy cảm mà mô hình có thể tiếp xúc. Ngoài ra, các tác nhân độc hại có thể sử dụng mô hình để tạo các chatbot độc hại hoặc tin nhắn lừa đảo có thể được sử dụng để đánh cắp dữ liệu người dùng. Để bảo vệ người dùng khỏi bị đánh cắp dữ liệu, điều quan trọng là phải đảm bảo rằng mô hình chỉ được sử dụng cho các mục đích hợp pháp và mọi quyền truy cập vào dữ liệu người dùng đều được giám sát chặt chẽ.
8. Quảng cáo có mục tiêu xấu
ChatGPT có khả năng quảng cáo được nhắm mục tiêu của nó. Bởi vì nó có thể thu thập và xử lý dữ liệu người dùng, nó có thể được sử dụng để lập hồ sơ mọi người cho các mục đích quảng cáo hiệu quả và hiệu quả hơn. Điều này có thể dẫn đến những lo ngại về quyền riêng tư, cũng như sự thao túng người dùng của các công ty đang tìm cách thu lợi từ dữ liệu này. Ngoài ra, ChatGPT có thể được sử dụng để cung cấp quảng cáo cho những người dùng cả tin, sử dụng phản hồi “spam” của mô hình để khiến họ nhấp vào liên kết hoặc thực hiện hành động có lợi cho công ty.
9. Đánh cắp danh tính
Trộm cắp danh tính là một trong những rủi ro nghiêm trọng nhất liên quan đến ChatGPT. Do khả năng thu thập và xử lý dữ liệu người dùng, nó có thể được sử dụng để truy cập thông tin cá nhân, để đánh cắp danh tính. Rủi ro này tăng cao khi mô hình được sử dụng cho dịch vụ hoặc hỗ trợ khách hàng. Điều quan trọng là phải nhận thức được khả năng bị đánh cắp danh tính và thực hiện các bước để bảo vệ dữ liệu người dùng và đảm bảo rằng dữ liệu đó không bị lạm dụng. Các vấn đề về quyền riêng tư cũng cần được xem xét khi sử dụng ChatGPT. Ngoài ra, người dùng cũng nên biết dữ liệu của họ đang được sử dụng như thế nào và liệu nó có được chia sẻ với bất kỳ bên thứ ba nào hay không. Bằng cách hiểu những rủi ro liên quan đến ChatGPT, người dùng có thể giúp đảm bảo rằng ChatGPT được sử dụng một cách có trách nhiệm và có đạo đức.
10. Cat Fishing
Catfishing là một hình thức lừa dối trong đó ai đó tạo danh tính giả trực tuyến để lừa người khác vào một mối quan hệ trực tuyến. ChatGPT là một mô hình ngôn ngữ mạnh mẽ có thể tạo ra văn bản giống như lời nói của con người, nhưng nó có thể được sử dụng cho mục đích xấu. Ví dụ: người dùng ác ý có thể sử dụng mô hình này để tạo danh tính giả và xây dựng mối quan hệ trực tuyến với ai đó bằng cách yêu cầu ChatGPT tạo tin nhắn và cuộc hội thoại. Rủi ro ở đây là người nhận có thể không phân biệt được rằng họ đang nói chuyện với máy móc chứ không phải người thật và có thể phát triển mối liên hệ tình cảm với đối tượng không tồn tại này, từ đó những kẻ có ý đồ xấu có thể cố gắng trích xuất thông tin cá nhân hoặc thông tin tài chính từ những nạn nhân nhẹ dạ cả tin.
Tài liệu tham khảo
Nguồn: viblo.asia