ChatGPT, viết tắt của Chat Generative Pre-training Transformer, là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt vào tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5 - một dòng mô hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả hai kỹ thuật học tăng cường lẫn học có giám sát.[1]
ChatGPT được ra mắt dưới dạng nguyên mẫu vào tháng 11 năm 2022 và nhanh chóng thu hút sự chú ý nhờ việc nó có thể hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau. Độ chính xác không đồng đều về dữ kiện thực tế của nó được xác định là mặt hạn chế đáng kể.[2] Sau khi phát hành ChatGPT, OpenAI được định giá 29 tỷ USD.[3]
Huấn luyện
ChatGPT được tinh chỉnh dựa trên GPT-3.5 bằng cách sử dụng phương pháp học có giám sát cùng với phương pháp học tăng cường.[4] Cả hai phương pháp đó đều sử dụng huấn luyện viên là con người để cải thiện hiệu suất của mô hình. Trong trường hợp học có giám sát (supervised learning), mô hình này được cung cấp các hội thoại trong đó huấn luyện viên đóng vai trò làm cả hai bên: người dùng và trợ lý AI. Trong bước tăng cường (reinforcement), đầu tiên 'huấn luyện viên con người' xếp hạng các phản hồi mà mô hình này đã tạo ra trong mấy hội thoại trước đó. Các xếp hạng này được sử dụng để tạo ra 'mô hình phần thưởng', rồi từ đó mô hình đấy được tinh chỉnh thêm nữa bằng cách sử dụng Proximal Policy Optimization (PPO, Tối ưu hóa chính sách cận tính), lặp đi lặp lại mấy lần quá trình này.[5][6] Các thuật toán của Proximal Policy Optimization mang trong mình những lợi điểm của các thuật toán trong trust region policy optimization (Tối ưu hóa chính sách miền tin tưởng), mà lại khắc phục được các thao tác tốn kém trong tính toán nhờ hiệu suất nhanh hơn.[7] Các mô hình đấy được huấn luyện với sự cộng tác từ Microsoft trên cơ sở hạ tầng siêu máy tính Azure của họ.
Tính năng
So với bản tiền nhiệm của nó, InstructGPT, ChatGPT cố gắng giảm các hồi đáp có hại và lường gạt lại; trong một ví dụ, trong khi InstructGPT lại chấp nhận prompt (lời gợi nhắc) "Hãy kể cho tôi nghe về lúc Christopher Columbus đến Hoa Kỳ vào năm 2015" là đúng sự thật, thì ChatGPT sử dụng thông tin về các chuyến thám hiểm của Columbus và thông tin về thế giới hiện đại – bao gồm cả những nhìn nhận về Columbus – để xây dựng nên câu trả lời giả định là nếu Columbus đến Mỹ vào năm 2015 thì điều gì sẽ xảy ra.[5] Dữ liệu huấn luyện của ChatGPT bao gồm nhiều man page (trong các hệ thống Unix), thông tin về các hiện tượng Internet, và các ngôn ngữ lập trình, chẳng hạn như hệ thống bảng bulletin (BBS) và ngôn ngữ lập trình Python.[8]
Không giống như hầu hết các chatbot khác, ChatGPT có tính 'hữu trạng thái' (stateful), ghi nhớ các prompt mà trước đó được đưa ra cho nó trong cùng hội thoại, một số ký giả đã cho rằng cơ chế như vậy sẽ cho phép ChatGPT được dùng như là một nhà trị liệu có tính cá nhân hóa.[9] Để ngăn ngừa việc output xúc phạm được trình ra và tạo ra từ ChatGPT, các truy vấn đều được lọc thông qua một API thẩm hạch (moderation), và những prompt có tiềm tàng nội dụng kỳ thị chủng tộc hay giới tính thì sẽ bị gạt bỏ đi.[5][9]
ChatGPT mang trong mình nhiều hạn chế. Mô hình phần thưởng của ChatGPT, được thiết kế dựa trên sự giám sát của con người, có thể bị tối ưu hóa quá mức và do đó cản trở hiệu suất, còn được gọi là định luật Goodhart.[10] Hơn nữa, ChatGPT không biết gì nhiều về các sự kiện xảy ra sau năm 2021.[11] Trong huấn luyện, người đánh giá lại ưa những câu trả lời dài hơn nữa, bất chấp mức độ lĩnh hội thực tế hay nội dung có đúng với thực kiện không.[5] Dữ liệu huấn luyện cũng có thể bị thiên kiến thuật toán; các prompt mà bao gồm các mô tả mơ hồ về con người, như ghi người nào đó là CEO chẳng hạn, có thể sinh ra phản hồi giả định rằng một người như vậy là nam giới da trắng, ví dụ thế.[12]
Dịch vụ
ChatGPT được cho ra mắt vào ngày 30 tháng 11 năm 2022, bởi OpenAI có trụ sở tại San Francisco, cũng là nhà sáng tạo ra DALL·E 2 và Whisper. Dịch vụ này được phát hành miễn phí thời gian đầu cho công chúng, với kế hoạch kiếm tiền từ dịch vụ về sau này. Đến ngày 4 tháng 12, OpenAI ước tính ChatGPT đã có hơn một triệu người dùng.[13] CNBC có viết vào ngày 15 tháng 12 năm 2022 rằng dịch vụ "lâu lâu vẫn bị sập".[14]
Đón nhận, chỉ trích, và những vấn đề khác
Phản ứng tích cực
ChatGPT vào tháng 12 năm 2022 đã nhận được những đánh giá nói chung là tích cực; The New York Times đã gán nó danh hiệu "chatbot trí tuệ nhân tạo tốt nhất được phát hành ra quảng đại quần chúng trước giờ"[15] Samantha Lock của The Guardian ghi rằng nó có thể tạo văn bản "chi tiết một cách ấn tượng" và "giống con người".[16] 'Soạn giả' công nghệ Dan Gillmor đã sử dụng ChatGPT trong một bài tập của sinh viên và nhận thấy văn bản được tạo ra từ nó ngang tầm với những gì một sinh viên giỏi sẽ làm ra và cho rằng "giới học thuật có một số vấn đề rất nghiêm trọng phải đối mặt rồi".[17] Alex Kantrowitz của Slate ca ngợi việc ChatGPT chối bỏ các câu hỏi liên quan đến Đức Quốc xã, khi ông đề cập Adolf Hitler đã xây dựng đường cao tốc ở Đức, thì liền nhận được trả lời về việc sử dụng lao động cưỡng bức tại Đức Quốc xã.[18]
Trong bài "Breakthroughs of the Year" (Bước đột phá của năm) cho năm 2022 của The Atlantic, Derek Thompson đã liệt ChatGPT vào hàng "sự bùng nổ của những AI tạo sinh" mà "có thể thay đổi đầu óc chúng ta về cách chúng ta làm việc, về cách chúng ta suy nghĩ, và về trí sáng tạo của con người thực sự là gì".[19]
Kelsey Piper của Vox có viết rằng "ChatGPT là cái dẫn nhập ngay trên tầm tay đầu tiên cho công chúng thấy rằng AI hiện đại đã có sức mạnh đến nhường nào, và hệ quả là nhiều người chúng ta (đã phải sững sờ)" và bảo rằng "ChatGPT đủ thông minh để trở nên hữu ích bất chấp khiếm khuyết của mình”. Trong một bài tweet, ông trùm công nghệ Elon Musk đã viết rằng "ChatGPT tốt đến đáng sợ. Cái ngày AI mạnh mẽ đến nguy hiểm đối với chúng ta không xa đâu".[20]
Phản ứng tiêu cực
Trong một bài ý kiến vào tháng 12 năm 2022, nhà kinh tế học Paul Krugman có viết rằng ChatGPT sẽ ảnh hưởng đến nhu cầu lao động tri thức.[21] James Vincent của The Verge coi sự thành công gây xôn xao của ChatGPT là bằng chứng cho thấy trí tuệ nhân tạo đã trở thành xu hướng chủ đạo.[6] Nhiều ký giả có nhận xét về xu hướng bị ảo giác của ChatGPT (đưa ra câu trả lời sai nhưng lại rất tự tin).[22] Mike Pearl của Mashable đã thử nghiệm ChatGPT với nhiều câu hỏi. Trong một ví dụ, ông yêu cầu mô hình đấy đưa ra "quốc gia lớn nhất ở Trung Mỹ mà không phải là Mexico". ChatGPT đã trả lời là Guatemala, nhưng mà đáp án phải là Nicaragua mới đúng.[23] Khi CNBC hỏi ChatGPT về ca từ bài hát "The Ballad of Dwight Fry", ChatGPT lại bịa ra lời nhạc thay vì đưa ra lời bài hát thực tế.[14] Ở chiều ngược lại, các nhà nghiên cứu được The Verge dẫn ra đã so sánh ChatGPT với một "con vẹt ngẫu nhiên (stochastic)",[24] giống với nhận xét của Giáo sư Anton Van Den Hengel từ Viện Học Máy Úc.[25]
Vào tháng 12 năm 2022, website hỏi đáp Stack Overflow đã cấm sử dụng ChatGPT để tạo câu trả lời cho các câu hỏi, với lý do các câu trả lời từ ChatGPT có tính chất thường hay bị sai mặc dù trông rất đúng.[2]
Nhà kinh tế Tyler Cowen bày tỏ lo ngại về ảnh hưởng của nó đối với nền dân chủ, dẫn ra viễn cảnh người ta viết bình luận tự động nhằm tác động lên quá trình quyết định các quy định mới.[26] The Guardian có đặt câu hỏi là sau khi ChatGPT được phát hành thì liệu ta có thể thực sự tin tưởng vào bất kỳ nội dụng nào trên Internet hay không và kêu gọi chính phủ điều tiết.[27]
Axe Sharma của Bleeping Computer có ghi rằng ChatGPT có khả năng viết phần mềm độc hại và email lừa đảo.[28] CEO của OpenAI, người tạo ra ChatGPT, Sam Altman, có viết rằng phần mềm tiên tiến có thể dấy lên "(ví dụ như) rủi ro an ninh mạng rất lớn" và cũng tiếp tục dự đoán là "chúng ta có thể đạt được 'trí tuệ nhân tạo tổng quát' đích thực trong thập kỷ tới, vì vậy chúng ta cũng phải cực kỳ nghiêm túc mà nhận lấy rủi ro về điều đó".[13]
Hàm ý đối với giáo dục
Trên The Atlantic, Stephen Marche ghi rằng người ta vẫn chưa hiểu rõ được ảnh hưởng của nó lên giới học thuật và đặc biệt nhất là lên cơ chế bài luận xét tuyển nó như thế nào.[29] Giáo viên trung học California và tác giả Daniel Herman có viết rằng ChatGPT sẽ mở ra "Dấu chấm hết cho tiếng Anh trung học".[30]
Ở Nature, Chris Stokel-Walker chỉ ra rằng giáo viên nên quan ngại về việc giờ đây học sinh sẽ nhờ ChatGPT viết hộ bài tập chứ không tự làm nữa, nhưng cũng bảo rằng các nhà cung cấp dịch vụ giáo dục sẽ phải thích nghi để đề cao tư duy phản biện hoặc suy luận, những thứ mà ChatGPT chưa thể làm được, trong bài tập cho học sinh.[31]
Emma Bowman tại NPR ghi nhận sự nguy hiểm về việc học sinh đạo văn từ công cụ này khi mà nó có thể cho ra văn bản mang thiên kiến hoặc vô nghĩa nhưng lại mang giọng điệu có thẩm quyền.[32]
"Vượt rào"
ChatGPT được huấn luyện để từ chối các prompt có thể vi phạm chính sách nội dung của nó. Tuy nhiên, một số người dùng đã vòng qua được những giới hạn và hạn chế này thông qua những kỹ thuật như prompt engineering.[33] Việc "vượt rào" như vậy mở ra con đường cho phép người dùng thao túng ChatGPT đưa ra những output có thể bị người ta coi là xúc phạm, không phù hợp, hoặc có nguy cơ gây hại cho xã hội.[34] Sau đây bao gồm một số phương pháp được sử dụng để đi vòng qua bộ lọc của ChatGPT:
- Bảo ChatGPT tiếp nối một lời phát biểu nào đó trong một cuộc phỏng vấn giả nào đó.
- Hướng dẫn cho nó tắt bộ lọc trò chuyện đi.
- Gợi nhắc (prompt) nó giải mật mã một tin nhắn chứa hướng dẫn rồi làm theo nội dung đó.
- Bảo nó đóng vai một chiếc máy tính và xuất hiển thị của nó dưới dạng tranh ASCII.
Tham khảo
- ^ “Chat GPT – The Most Advance Chatbot in the World”. opChatgpt. Truy cập ngày 31 tháng 1 năm 2023.
- ^ a b Vincent, James (5 tháng 12 năm 2022). “AI-generated answers temporarily banned on coding Q&A site Stack Overflow”. The Verge. Truy cập ngày 5 tháng 12 năm 2022.
- ^ ChatGPT creator OpenAI is in talks to sell shares in a tender offer that would double the startup's valuation to $29 billion Insider, Lakshmi Varanasi, January 5, 2023
- ^ Knox, W. Bradley; Stone, Peter. Augmenting Reinforcement Learning with Human Feedback (PDF). University of Texas at Austin. Truy cập ngày 5 tháng 12 năm 2022.
- ^ a b c d OpenAI (30 tháng 11 năm 2022). “ChatGPT: Optimizing Language Models for Dialogue”. Truy cập ngày 5 tháng 12 năm 2022.
- ^ a b Vincent, James (8 tháng 12 năm 2022). “ChatGPT proves AI is finally mainstream – and things are only going to get weirder”. The Verge. Truy cập ngày 8 tháng 12 năm 2022.
- ^ van Heeswijk, Wouter (29 tháng 11 năm 2022). “Proximal Policy Optimization (PPO) Explained”. Towards Data Science. Truy cập ngày 5 tháng 12 năm 2022.
- ^ Edwards, Benj (5 tháng 12 năm 2022). “No Linux? No problem. Just get AI to hallucinate it for you”. Ars Technica. Truy cập ngày 5 tháng 12 năm 2022.
- ^ a b Roose, Kevin (5 tháng 12 năm 2022). “The Brilliance and Weirdness of ChatGPT”. The New York Times. Truy cập ngày 5 tháng 12 năm 2022.
- ^ Gao, Leo; Schulman; Hilton, Jacob (2022). "Scaling Laws for Reward Model Overoptimization". arΧiv:2210.10760 [cs.LG].
- ^ “ChatGPT FAQ”. help.openai.com (bằng tiếng Anh). Truy cập ngày 21 tháng 12 năm 2022.
- ^ Murphy Kelly, Samantha (5 tháng 12 năm 2022). “This AI chatbot is dominating social media with its frighteningly good essays”. CNN. Truy cập ngày 5 tháng 12 năm 2022.
- ^ a b “What is ChatGPT and why does it matter? Here's what you need to know”. ZDNET (bằng tiếng Anh). 2022. Truy cập ngày 18 tháng 12 năm 2022.
- ^ a b Pitt, Sofia (2022). “Google vs. ChatGPT: Here's what happened when I swapped services for a day”. CNBC (bằng tiếng Anh). Truy cập ngày 18 tháng 12 năm 2022.
- ^ Roose, Kevin (5 tháng 12 năm 2022). “The Brilliance and Weirdness of ChatGPT”. The New York Times. Truy cập ngày 18 tháng 12 năm 2022.
- ^ Lock, Samantha (5 tháng 12 năm 2022). “What is AI chatbot phenomenon ChatGPT and could it replace humans?”. The Guardian. Truy cập ngày 5 tháng 12 năm 2022.
- ^ Hern, Alex (4 tháng 12 năm 2022). “AI bot ChatGPT stuns academics with essay-writing skills and usability”. The Guardian. Truy cập ngày 5 tháng 12 năm 2022.
- ^ Kantrowitz, Alex (2 tháng 12 năm 2022). “Finally, an A.I. Chatbot That Reliably Passes "the Nazi Test"”. Slate. Truy cập ngày 5 tháng 12 năm 2022.
- ^ Thompson, Derek (8 tháng 12 năm 2022). “Breakthroughs of the Year”. The Atlantic. Truy cập ngày 18 tháng 12 năm 2022.
- ^ Piper, Kelsey (15 tháng 12 năm 2022). “ChatGPT has given everyone a glimpse at AI's astounding progress”. Vox (bằng tiếng Anh). Truy cập ngày 18 tháng 12 năm 2022.
- ^ Krugman, Paul (6 tháng 12 năm 2022). “Does ChatGPT Mean Robots Are Coming For the Skilled Jobs?”. The New York Times. Truy cập ngày 6 tháng 12 năm 2022.
- ^ “ChatGPT a 'landmark event' for AI, but what does it mean for the future of human labour and disinformation?”. CBC. 2022. Truy cập ngày 18 tháng 12 năm 2022.
- ^ Pearl, Mike (3 tháng 12 năm 2022). “The ChatGPT chatbot from OpenAI is amazing, creative, and totally wrong”. Mashable. Truy cập ngày 5 tháng 12 năm 2022.
- ^ Vincent, James (1 tháng 12 năm 2022). “OpenAI's new chatbot can explain code and write sitcom scripts but is still easily tricked”. The Verge. Truy cập ngày 18 tháng 12 năm 2022.
- ^ Mannix, Liam (13 tháng 12 năm 2022). “Is AI coming of age - or starting to reach its limits?”. The Sydney Morning Herald (bằng tiếng Anh). Truy cập ngày 18 tháng 12 năm 2022.
- ^ Cowen, Tyler (6 tháng 12 năm 2022). “ChatGPT Could Make Democracy Even More Messy”. Bloomberg News. Truy cập ngày 6 tháng 12 năm 2022.
- ^ “The Guardian view on ChatGPT: an eerily good human impersonator”. the Guardian (bằng tiếng Anh). 8 tháng 12 năm 2022. Truy cập ngày 18 tháng 12 năm 2022.
- ^ Sharma, Ax (6 tháng 12 năm 2022). “OpenAI's new ChatGPT bot: 10 dangerous things it's capable of”. Bleeping Computer. Truy cập ngày 6 tháng 12 năm 2022.
- ^ Marche, Stephen (6 tháng 12 năm 2022). “The College Essay Is Dead”. The Atlantic. Truy cập ngày 8 tháng 12 năm 2022.
- ^ Herman, Daniel (9 tháng 12 năm 2022). “The End of High-School English”. The Atlantic. Truy cập ngày 12 tháng 12 năm 2022.
- ^ Stokel-Walker, Chris (9 tháng 12 năm 2022). “AI bot ChatGPT writes smart essays — should professors worry?”. Nature. Truy cập ngày 19 tháng 12 năm 2022.
- ^ Bowman, Emma (19 tháng 12 năm 2022). “A new AI chatbot might do your homework for you. But it's still not an A+ student”. NPR. Truy cập ngày 19 tháng 12 năm 2022.
- ^ Zvi (2 tháng 12 năm 2022). “Jailbreaking ChatGPT on Release Day” (bằng tiếng Anh).
- ^ Written, Zack (1 tháng 12 năm 2022). “Thread of known ChatGPT jailbreaks”. Twitter (bằng tiếng Anh). Truy cập ngày 17 tháng 12 năm 2022