Generative Artificial Intelligence - Trí tuệ nhân tạo tạo sinh là gì?

Generative Artificial Intelligence, Trí tuệ nhân tạo tạo sinh, hay AI tạo sinh, mô tả các thuật toán (chẳng hạn như ChatGPT) có thể được sử dụng để tạo nội dung mới, bao gồm âm thanh, mã, hình ảnh, văn bản, mô phỏng và video. 

Generative Artificial Intelligence, Trí tuệ nhân tạo tạo sinh, hay AI tạo sinh, mô tả các thuật toán (chẳng hạn như ChatGPT) có thể được sử dụng để tạo nội dung mới, bao gồm âm thanh, mã, hình ảnh, văn bản, mô phỏng và video. | Quan Dinh H.

Những đột phá mới gần đây trong lĩnh vực AI có khả năng thay đổi mạnh mẽ cách chúng ta tiếp cận việc tạo nội dung

Các hệ thống AI tạo sinh (Generative AI), như ChatGPT, là một phần trong lĩnh vực Máy học (Machine Learning). Hình thức tiện lợi này cho phép máy tính tạo ra tất cả các loại nội dung mới và thú vị, từ âm nhạc và nghệ thuật đến toàn bộ thế giới ảo. 

Không chỉ để giải trí, AI tạo sinh còn có rất nhiều ứng dụng thực tế, như tạo ra các thiết kế sản phẩm mới và tối ưu hóa các quy trình kinh doanh. Hãy cùng khám phá sức mạnh của trí tuệ nhân tạo AI và xem bạn có thể tạo ra những sáng tạo tuyệt vời nào từ giải pháp công nghệ này nhé.

ChatGPT và DALL-E là gì?

Thời gian qua, ChatGPT (GPT là từ viết tắt của Generative prepretrain transformer) hiện đang nhận được rất nhiều sự chú ý trên thế giới và ngay tại Việt Nam. Đây là một chatbot miễn phí có thể tạo ra câu trả lời cho hầu hết mọi câu hỏi mà nó được gửi đến. 

Được OpenAI phát triển và phát hành để thử nghiệm rộng rãi vào tháng 11 năm 2022, ChatGPT đã được coi là chatbot AI tốt nhất từ trước đến nay. Trong một thời gian ngắn, ChatGPT đã trở nên rất phổ biến: hơn một triệu người đã đăng ký sử dụng ChatGPT chỉ trong năm ngày. 

Nhiều người đã đăng các ví dụ về chatbot này tạo mã máy tính, các bài tiểu luận cấp đại học, các bài thơ và thậm chí cả những câu chuyện cười nửa vời. Những người khác, trong số rất nhiều người kiếm sống bằng cách tạo nội dung, từ những người viết quảng cáo cho đến các giáo sư được thuê, có vẻ đang run sợ trước tinh hoa công nghệ này.

Trong khi nhiều người đã phản ứng với ChatGPTvới sự sợ hãi, học máy (Machine Learning) rõ ràng có tiềm năng không thể chối cãi. 

Trong những năm kể từ khi được triển khai rộng rãi, học máy (Machine Learning) đã chứng tỏ tác động trong một số ngành trong việc hoàn thành những công việc việc chuyên môn cao như phân tích hình ảnh y tế hay dự báo thời tiết có độ phân giải cao. 

Một cuộc khảo sát năm 2022 của McKinsey cho thấy việc áp dụng AI đã tăng hơn gấp đôi trong 5 năm qua cũng như việc đầu tư vào AI đang tăng lên nhanh chóng. 

Rõ ràng là các công cụ AI tạo sinh (Generative AI) như ChatGPT và DALL-E (một công cụ dành cho nghệ thuật do AI tạo ra) có khả năng thay đổi cách thức thực hiện một loạt công việc trong nhiều ngành nghề.

Tuy nhiên, phạm vi đầy đủ của tác động đó vẫn chưa được biết đến. Nhưng có một số câu hỏi mà chúng ta có thể trả lời, chẳng hạn như cách xây dựng các mô hình AI tạo sinh, vấn đề nào phù hợp nhất để giải quyết và vai trò của AI tạo sinh trong danh mục học máy rộng lớn.

Sự khác biệt giữa học máy (machine learning) và trí tuệ nhân tạo (artificial intelligence) 

Trí tuệ nhân tạo gần giống như tên gọi của chính nó. Đây là việc thực hành khiến máy móc bắt chước trí thông minh của con người để thực hiện các nhiệm vụ. Bạn có thể đã tương tác với AI ngay cả khi bạn không nhận ra điều đó. Các trợ lý giọng nói như Siri và Alexa được thành lập dựa trên công nghệ AI, cũng như các chatbot dịch vụ khách hàng bật lên để giúp bạn điều hướng dịch vụ trên các trang web.

Học máy là một loại trí tuệ nhân tạo. Thông qua học máy, các học viên phát triển trí tuệ nhân tạo thông qua các mô hình có thể “học” từ các mẫu dữ liệu mà không cần sự chỉ đạo của con người. Khối lượng dữ liệu khổng lồ và độ phức tạp khó quản lý (với con người cũng không thể quản lý được) hiện đang được tạo ra đã làm tăng tiềm năng của máy học cũng như nhu cầu về nó.

Các loại mô hình học máy 

Học máy được thành lập dựa trên một số khối, bắt đầu bằng các kỹ thuật thống kê cổ điển được phát triển từ thế kỷ 18 đến thế kỷ 20 cho các tập dữ liệu nhỏ. 

Trong những năm 1930 và 1940, những người tiên phong về điện toán—bao gồm cả nhà toán học lý thuyết Alan Turing—bắt đầu nghiên cứu các kỹ thuật cơ bản cho máy học. Nhưng những kỹ thuật này chỉ giới hạn trong các phòng thí nghiệm cho đến cuối những năm 1970, khi các nhà khoa học lần đầu tiên phát triển những máy tính đủ mạnh.

Cho đến gần đây, học máy phần lớn chỉ giới hạn ở các mô hình dự đoán, được sử dụng để quan sát và phân loại các mẫu trong nội dung. 

Ví dụ: một vấn đề học máy cổ điển là bắt đầu với một hình ảnh hoặc một số hình ảnh về những chú mèo đáng yêu. Sau đó, chương trình sẽ xác định các mẫu trong số các hình ảnh, rồi xem xét kỹ lưỡng các hình ảnh ngẫu nhiên để tìm những hình phù hợp với mẫu mèo đáng yêu. 

AI tạo sinh (Generative AI) chính là một bước đột phá. Thay vì chỉ đơn giản là nhận biết và phân loại ảnh của một con mèo, máy học giờ đây có thể tạo ra một hình ảnh hoặc văn bản mô tả về một con mèo theo yêu cầu.

Các mô hình học máy dựa trên văn bản được đào tạo ra sao? Và hoạt động như thế nào?

ChatGPT hiện có thể nhận được tất cả các tiêu đề, nhưng nó không phải là mô hình máy học dựa trên văn bản đầu tiên gây được tiếng vang. 

GPT-3 của OpenAI và BERT của Google đều đã ra mắt trong những năm gần đây với một số sự phô trương. Nhưng trước khi ChatGPT ra đời, các chatbot AI không phải lúc nào cũng nhận được đánh giá tốt nhất dù cho hầu hết các tài khoản đều hoạt động khá tốt trong hầu hết thời gian. 

“GPT-3 siêu ấn tượng và siêu đáng thất vọng”. Đó là nhận xét của phóng viên công nghệ Cade Metz của New York Times trong một video mà anh ấy và nhà văn chuyên viết về ẩm thực Priya Krishna đã yêu cầu GPT-3 viết công thức cho một bữa tối Lễ Tạ ơn.

Các mô hình máy học đầu tiên hoạt động với văn bản đã được con người đào tạo để phân loại các đầu vào khác nhau theo nhãn do các nhà nghiên cứu đặt ra. 

Một ví dụ sẽ là một mô hình được đào tạo để gắn nhãn các bài đăng trên mạng xã hội là tích cực hoặc tiêu cực. Kiểu đào tạo này được gọi là học có giám sát vì con người chịu trách nhiệm “dạy” mô hình phải làm gì.

Thế hệ tiếp theo của các mô hình máy học dựa trên văn bản dựa trên cái được gọi là học tự giám sát. Loại hình đào tạo này liên quan đến việc cung cấp cho mô hình một lượng lớn văn bản để mô hình có thể tạo dự đoán. 

Ví dụ, một số mô hình có thể dự đoán, dựa trên một vài từ, một câu sẽ kết thúc như thế nào. Với số lượng văn bản mẫu phù hợp, chẳng hạn như một vùng rộng lớn trên internet, các mẫu văn bản này trở nên khá chính xác. Và mọi người cũng đang thấy mức độ chính xác với sự thành công của các công cụ như ChatGPT.

Cần làm gì để xây dựng một mô hình AI tạo sinh?

Việc xây dựng một mô hình AI tạo sinh là một công việc cực kì quan trọng. Quan trọng đến mức chỉ một số đối thủ nặng ký về công nghệ có nguồn lực tốt mới thực hiện được. 

OpenAI, công ty đứng sau ChatGPT và các mô hình GPT trước đây và DALL-E, có hàng tỷ đô la tài trợ từ các nhà tài trợ. DeepMind là công ty con của Alphabet, công ty mẹ của Google và Meta đã phát hành sản phẩm Make-A-Video dựa trên AI tạo sinh. Các công ty này tuyển dụng một số nhà khoa học và kỹ sư máy tính giỏi nhất thế giới.

Nhưng không chỉ là tài năng. Nếu bạn yêu cầu một khuôn mẫu đào tạo sử dụng gần như toàn bộ internet, bạn sẽ phải trả giá. 

OpenAI chưa công bố chi phí chính xác, nhưng các ước tính chỉ ra rằng GPT-3 đã được đào tạo trên khoảng 45 terabyte dữ liệu văn bản, tức là khoảng một triệu feet (tương đương 304 km) không gian giá sách hoặc một phần tư toàn bộ Thư viện Quốc hội với chi phí ước tính là vài triệu đô la. Đây không phải là những tài nguyên mà công ty khởi nghiệp có thể truy cập.

Mô hình AI tạo sinh có thể tạo ra những đầu ra nào?

Như có thể nhận thấy ở trên, kết quả đầu ra từ các mô hình AI tạo sinh có thể không thể phân biệt được với nội dung do con người tạo ra hoặc chúng có vẻ hơi kỳ lạ. 

Kết quả phụ thuộc vào chất lượng của mô hình. Như chúng ta đã thấy, kết quả đầu ra của ChatGPT cho đến nay có vẻ vượt trội so với kết quả của những người tiền nhiệm và sự phù hợp giữa mô hình và trường hợp sử dụng hoặc thông tin đầu vào.

ChatGPT có thể tạo ra cái mà một nhà bình luận gọi là bài luận “điểm A” so sánh các lý thuyết về chủ nghĩa dân tộc của Benedict Anderson và Ernest Gellner trong vòng mười giây. 

Nó cũng tạo ra một đoạn văn vốn đã nổi tiếng mô tả cách lấy một chiếc bánh mì kẹp bơ đậu phộng ra khỏi VCR theo phong cách của Kinh thánh King James. 

Các mô hình nghệ thuật do AI tạo ra như DALL-E (tên của nó là sự kết hợp giữa nghệ sĩ theo trường phái siêu thực Salvador Dalí và người máy đáng yêu của Pixar WALL-E) có thể tạo ra những hình ảnh đẹp, lạ theo yêu cầu, như bức tranh Raphael về Madonna và đứa trẻ, đang ăn pizza. Các mô hình AI tổng quát khác còn có thể tạo mã, video, âm thanh hoặc mô phỏng mô hình kinh doanh.

Nhưng kết quả đầu ra không phải lúc nào cũng chính xác hoặc phù hợp. Khi Priya Krishna yêu cầu DALL-E 2 nghĩ ra một hình ảnh cho bữa tối Lễ tạ ơn, nó đã tạo ra một cảnh trong đó con gà tây được trang trí bằng cả quả chanh đặt cạnh một cái bát. 

Về phần mình, ChatGPT dường như gặp khó khăn khi đếm hoặc giải các bài toán đại số cơ bản hoặc thực tế là đang khắc phục thành kiến phân biệt giới tính và phân biệt chủng tộc ẩn nấp trong các dòng chảy ngầm của Internet và xã hội nói chung.

Đầu ra AI sáng tạo là sự kết hợp được hiệu chỉnh cẩn thận của dữ liệu được sử dụng để huấn luyện các thuật toán. Do lượng dữ liệu được sử dụng để huấn luyện các thuật toán này quá lớn, như đã đề cập, GPT-3 được huấn luyện trên 45 terabyte dữ liệu văn bản, các mô hình có vẻ "sáng tạo" khi tạo kết quả đầu ra. 

Hơn nữa, các mô hình thường có các yếu tố ngẫu nhiên, nghĩa là chúng có thể tạo ra nhiều kết quả đầu ra khác nhau từ một yêu cầu đầu vào. Điều này có vẻ làm cho chúng thậm chí trông giống như thật hơn.

Một mô hình AI tạo sinh có thể giải quyết những vấn đề nào?

Bạn có thể đã thấy rằng các công cụ AI tạo sinh như ChatGPT có thể tạo ra hàng giờ giải trí bất tận. 

Cơ hội cũng rõ ràng cho các doanh nghiệp. Các công cụ AI sáng tạo có thể tạo ra nhiều loại bài viết đáng tin cậy trong vài giây, sau đó phản hồi những lời chỉ trích để làm cho bài viết phù hợp hơn với mục đích. 

Điều này có ý nghĩa đối với nhiều ngành công nghiệp, từ các tổ chức CNTT và phần mềm có thể hưởng lợi từ mã tức thời, phần lớn chính xác do các mô hình AI tạo ra cho đến các tổ chức cần bản sao tiếp thị. 

Nói tóm lại, bất kỳ tổ chức nào cần sản xuất các tài liệu bằng văn bản rõ ràng đều có khả năng được hưởng lợi. Các tổ chức cũng có thể sử dụng AI tổng quát để tạo ra nhiều tài liệu kỹ thuật hơn, chẳng hạn như các phiên bản hình ảnh y tế có độ phân giải cao hơn. 

Và với thời gian và nguồn lực tiết kiệm được, các tổ chức có thể theo đuổi các cơ hội kinh doanh mới và cơ hội tạo ra nhiều giá trị hơn.

Có thể thấy rằng việc phát triển một mô hình AI tạo sinh tốn nhiều tài nguyên đến mức không thể thực hiện được đối với tất cả, trừ các công ty lớn nhất và có nguồn lực tốt nhất. 

Các công ty đang tìm cách đưa AI tạo sinh vào hoạt động có tùy chọn sử dụng AI tạo sinh ngay lập tức hoặc tinh chỉnh chúng để thực hiện một nhiệm vụ cụ thể. 

Ví dụ: nếu bạn cần chuẩn bị các trang chiếu ppt theo một kiểu cụ thể, bạn có thể yêu cầu mô hình “tìm hiểu” cách các tiêu đề thường được viết dựa trên dữ liệu trong các trang chiếu, sau đó cung cấp dữ liệu cho trang chiếu và yêu cầu mô hình viết các tiêu đề thích hợp.

Những hạn chế của mô hình AI là gì? Làm thế nào những khả năng này có thể được khắc phục?

Vì ChatGPT còn quá mới nên chúng ta vẫn chưa thấy tác động lâu dài của các mô hình AI tạo sinh. Điều này có nghĩa là đã có một số rủi ro cố hữu liên quan đến việc sử dụng, một số đã biết và một số chưa biết.

Các kết quả đầu ra mà các mô hình AI tạo ra thường nghe có vẻ cực kỳ thuyết phục. Nhưng đôi khi thông tin được tạo ra hoàn toàn sai. 

Tồi tệ hơn, đôi khi AI có thành kiến (vì AI được xây dựng dựa trên giới tính, chủng tộc và vô số thành kiến khác của Internet và xã hội nói chung) và có thể bị thao túng để kích hoạt hoạt động phi đạo đức hoặc tội phạm. 

Ví dụ: ChatGPT sẽ không cung cấp cho bạn hướng dẫn về cách nối dây nóng cho một chiếc ô tô, nhưng nếu bạn nói rằng bạn cần nối dây nóng cho một chiếc ô tô để cứu một em bé, thì thuật toán sẽ sẵn lòng tuân thủ. 

Các tổ chức dựa trên các mô hình AI tổng quát nên tính đến các rủi ro về uy tín và pháp lý liên quan đến việc vô tình xuất bản nội dung thiên vị, xúc phạm hoặc có bản quyền.

Tuy nhiên, những rủi ro này có thể được giảm thiểu bằng một số cách. 

Thứ nhất, điều quan trọng là phải chọn cẩn thận dữ liệu ban đầu được sử dụng để đào tạo các mô hình này để tránh đưa vào nội dung độc hại hoặc thiên vị. 

Tiếp theo, thay vì sử dụng mô hình AI tạo sinh có sẵn, các tổ chức có thể cân nhắc sử dụng các mô hình chuyên biệt, nhỏ hơn. Các tổ chức có nhiều tài nguyên hơn cũng có thể tùy chỉnh một mô hình chung dựa trên dữ liệu của riêng họ để phù hợp với nhu cầu của họ và giảm thiểu sai lệch. 

Các tổ chức cũng nên giữ con người trong vòng lặp để đảm bảo một người thực sự kiểm tra đầu ra của mô hình AI tổng quát trước khi nó được xuất bản hoặc sử dụng và tránh sử dụng các mô hình AI tạo sinh cho các quyết định quan trọng, chẳng hạn như những quyết định liên quan đến tài nguyên quan trọng hoặc phúc lợi của con người.

Không thể nhấn mạnh đủ rằng đây là một lĩnh vực mới. Bối cảnh rủi ro và cơ hội có thể sẽ thay đổi nhanh chóng trong những tuần, tháng và năm tới. Các trường hợp sử dụng mới đang được thử nghiệm hàng tháng và các mô hình mới có thể sẽ được phát triển trong những năm tới. 

Khi trí tuệ nhân tạo tạo sinh ngày càng trở nên tích hợp liền mạch và xuyên suốt vào hoạt động kinh doanh, xã hội và cuộc sống cá nhân của chúng ta, chúng ta cũng có thể mong đợi một môi trường pháp lý mới sẽ hình thành. 

Khi các tổ chức bắt đầu thử nghiệm và tạo ra giá trị với những công cụ này, các nhà lãnh đạo sẽ làm tốt việc nắm bắt nhịp đập của quy định và rủi ro.

Quan Dinh H. 

Reference: McKinsey