Digital Transformation #21: Bàn về Machine Learning và Artificial Intelligence
Mục đích của việc chuyển đổi số trong doanh nghiệp là thu thập được dữ liệu khách hàng để phục vụ hoạt động kinh doanh tốt hơn. Từ đó, các thuật ngữ như Machine Learning (ML – máy học) hay Artificial Intelligence (AI – trí tuệ nhân tạo) ra đời và được kỳ vọng sẽ là các giải pháp giúp doanh nghiệp khai thác dữ liệu hiệu quả hơn. Tuy nhiên cho đến nay, định nghĩa cũng như ứng dụng thực tế của các giải pháp này vẫn chưa rõ nét.
Brands Việt Nam đã có dịp trao đổi với ông Phạm Hy Hiếu, Nghiên cứu sinh Tiến sĩ tại dự án Google Brain (Mỹ) về vấn đề này. Google Brain là dự án được khởi động từ năm 2011 với mục tiêu tạo ra các cỗ máy có thể tự vận hành, giảm bớt sự phụ thuộc vào con người của chúng.
* Xin chào, ông có thể chia sẻ một chút về công việc của ông tại Google Brain hiện nay ?
Để đánh giá sự thông minh về AI của một công ty công nghệ, giới nghiên cứu thường nhìn vào khả năng xử lý ngôn ngữ của máy tính tại công ty đó.
Chừng nào máy tính chưa hoàn toàn “hiểu” được ngôn ngữ, thì vẫn chưa có trí tuệ nhân tạo.
Sử dụng ngôn ngữ là một trong những khả năng khiến con người khác biệt so với nhiều loài động vật. Các nhà khoa học máy tính cho rằng, hiểu được ngôn ngữ là một trong những thước đo quan trọng cho sự phát triển của trí tuệ nhân tạo của máy tính. Chừng nào máy tính chưa hoàn toàn “hiểu” được ngôn ngữ, thì vẫn chưa có trí tuệ nhân tạo.
Chẳng hạn như Google Translate, dù có thể dịch được nhiều thứ tiếng khác nhau, nhưng chưa bao giờ được cho là “hiểu” được các ngôn ngữ mà nó đã dịch. Tương tự, Siri của iPhone hay Google Assistant trên Android có thể giao tiếp tối thiểu với con người, nhưng cả hai đều không đạt các tiêu chuẩn của việc “hiểu” ngôn ngữ.
Cho đến nay, một định nghĩa rõ ràng của việc “hiểu” được ngôn ngữ ở máy tính vẫn đang gây tranh cãi, vì mỗi công ty có một cách nghiên cứu phát triển khác nhau. Cùng với các đồng nghiệp, chúng tôi đang tìm ra một cách giúp máy tính có thể học nhanh và chứng minh hiệu quả của giải pháp đó với thế giới.
* Quan điểm cá nhân của ông về khẳng định ‘phải có dữ liệu mới làm được AI và ML’ như thế nào thưa ông ?
Tôi chỉ có thể đồng ý rằng phải có dữ liệu mới làm được ML.
Định nghĩa của ML được thừa nhận rộng rãi có lẽ đến từ cuốn sách của Giáo sư Tom Mitchell ở Đại học Carnegie Mellon: “ML là các hệ thống tự cải thiện thông qua kinh nghiệm (Experience) hoặc dữ liệu (Data)”.
Cá nhân tôi nghĩ rằng trong các nghiên cứu hiện đại, kinh nghiệm cũng là một loại dữ liệu. Như vậy, ML buộc phải có dữ liệu. Tuy nhiên, như thế không có nghĩa là không có dữ liệu thì không thể làm cho máy tính thông minh (Intelligent) được. Có thể có các phương pháp khác để làm cho máy tính thông minh mà không cần học (Learning), nhưng các phương pháp này không gọi là ML.
Còn với AI thì tôi không chắc, vì cho đến nay khái niệm AI không có một định nghĩa cụ thể nào. Các “định nghĩa” AI thường mang tính triết học và thường phải thông qua các ví dụ. Tôi sẽ không cố gắng định nghĩa AI là gì, bởi đó là một cuộc tranh luận không hồi kết.
Tuy nhiên, trong khuôn khổ của các câu hỏi này, ta tạm hiểu nôm na “AI là các chương trình máy tính có thể hoạt động giống con người”. (Bạn thấy đó, giải thích thế nào là “giống con người” sẽ dẫn đến một cuộc nói chuyện không hồi kết khác cho nên chúng ta cứ tạm chấp nhận AI là “máy tính giống con người” thôi). Theo cách hiểu này của AI, thì ML có thể là một phương pháp giúp tạo ra AI từ dữ liệu và kinh nghiệm. Như đã nói, có thể có phương pháp khác để tạo ra AI mà chúng ta chưa nghĩ đến.
* Vâng thưa ông, cũng liên quan đến câu chuyện về dữ liệu để làm AI, trên thị trường có hai trường phái là tự xây dựng và mua lại. Vậy với việc tự xây dựng thì doanh nghiệp mất bao lâu và cần quan tâm gì khi bắt tay xây dựng dữ liệu? Trong trường hợp mua thì rủi ro nào có thể xảy ra?
Theo tôi, không có một câu trả lời chính xác nào cho thời gian cần thiết để xây dựng một bộ dữ liệu. Thời gian để tự xây dựng một bộ dữ liệu phụ thuộc vào thể loại và tính chất của loại dữ liệu. Có loại dữ liệu chỉ cần một số lượng nhỏ, ví dụ như để xây dựng từ điển của 2 ngôn ngữ thì chỉ cần thu thập khoảng 50.000 từ. Có loại dữ liệu cần số lượng lớn hơn, càng nhiều càng tốt, ví dụ như hình chụp các tình huống giao thông để dạy cho xe tự lái. Lại có loại dữ liệu cần phải được liên tục làm mới, ví dụ như giá tiền hàng ngày của BitCoin.
Nếu doanh nghiệp muốn tự xây dựng dữ liệu cho các ứng dụng AI và ML của mình thì ngoài việc phân tích kỹ các tính chất và thể loại của dữ liệu cần thu thập, còn phải phân tích nhu cầu dữ liệu của các thuật toán AI và ML mà mình cần sử dụng. Các thuật toán AI, ML cổ điển cần tương đối ít dữ liệu và đôi khi cũng có thể cho độ chính xác tương đối ổn. Trong khi đó, các thuật toán AI, ML hiện đại thường rất “đói” dữ liệu, nhưng sẽ cho độ chính xác cao hơn nhiều nếu được cung cấp đủ.
Không có một câu trả lời chính xác nào cho thời gian cần thiết để xây dựng một bộ dữ liệu.
Ví dụ, nếu một doanh nghiệp muốn chế tạo một cỗ máy tự động chẩn đoán ung thư thì nên dùng thuật toán tốt nhất và càng nhiều dữ liệu càng tốt, bởi vì công việc này cần độ chính xác cao; nhưng nếu một doanh nghiệp muốn làm một ứng dụng gợi ý hashtag cho ảnh của người dùng thì có thể dùng các thuật toán đơn giản và tiết kiệm hơn.
Còn về việc mua dữ liệu, quan điểm cá nhân của tôi thì đúng là mua dữ liệu đôi khi có thể tiết kiệm đáng kể chi phí so với việc xây dựng, đặc biệt là khi công ty sở hữu dữ liệu đã có sẵn các dữ liệu này và sẵn sàng bán cho nhiều đối tượng. Một ví dụ điển hình là Facebook – chỉ cần thu thập các dữ liệu người dùng một lần, sau đó bán cho nhiều bên thứ ba; khi đó, mỗi bên thứ ba chỉ cần trả một khoản tiền nhỏ là có thể mua được các dữ liệu này.
Tuy nhiên, rủi ro của việc mua lại dữ liệu là bên mua thường không kiểm soát được quá trình thu thập dữ liệu, từ đó dẫn đến việc không đánh giá được chất lượng, ví dụ như dữ liệu có chính xác không, có vi phạm bản quyền không. Đó là chưa kể một số trường hợp dữ liệu được bán với giá đắt hơn cả khi tự thu thập. Nếu muốn mua dữ liệu, các doanh nghiệp cần phải nghiên cứu thị trường dữ liệu và xem xét cẩn thận các lựa chọn của mình.
* Hiện ranh giới giữa AI và ML rất mong manh. Theo ông, ML diễn ra trước rồi mới có AI hay ngược lại? Xin cho một ví dụ cụ thể về ML và AI khi xử lý ngôn ngữ?
Theo tôi, AI với ML giống như “quả trứng với con gà”. Câu hỏi “AI hay ML có trước” luôn dẫn đến các cuộc tranh cãi không hồi kết. Tạm bỏ qua máy tính, hãy xem xét con người. Chúng ta đều đồng ý rằng con người thông minh (hơn các loài động vật khác). Tuy nhiên, con người thông minh là nhờ học hay là nhờ con người thông minh nên họ mới nghĩ ra việc học để truyền đạt kinh nghiệm từ thế hệ này sang thế hệ khác?!
Nói về ví dụ, câu hỏi của bạn muốn một ví dụ về “xử lý ngôn ngữ” nên tôi sẽ đưa ví dụ về lĩnh vực này. Tuy nhiên, nó hơi xa vời thực tế. Tôi xin lấy ví dụ về việc chia động từ khi dịch từ tiếng Việt sang tiếng Anh.
Trong tiếng Anh, các động từ ở thì hiện tại đơn (Present Simple) cần phải được viết dưới một dạng khác khi đi kèm với 3 chủ ngữ ‘he’, ‘she’, ‘it’ (anh ấy, cô ấy, nó). Ví dụ: “Tôi thích bạn” là “I like you”; “Họ thích bạn” là “They like you”. Nhưng “Anh ấy thích bạn” lại là “He likes you” (chú ý từ ‘likes’ có hậu tố s).
Khi AI cổ điển dịch Việt – Anh, quy luật chia động từ này sẽ được lập trình sẵn trong chương trình, ví dụ như: “Nếu thấy từ ‘thích’ trong tiếng Việt, trước hết hãy điền từ ‘like’ vào trong câu tiếng Anh”, sau đó “Nếu thấy chủ ngữ trong câu tiếng Anh là ‘he’, ‘she’, ‘it’ thì hãy sửa từ ‘like’ thành từ ‘likes’”.
Khi ML dịch Việt – Anh, quy luật chia động từ sẽ không được lập trình sẵn, mà chương trình sẽ phải tự rút ra quy luật này từ dữ liệu huấn luyện là các cặp câu song ngữ.
Như vậy, riêng đối với quy tắc chia động từ, AI tốt hơn ML, vì AI không cần có dữ liệu để học cách chia động từ, trong khi ML cần dữ liệu để học cách chia động từ. Tuy nhiên, ngoài quy tắc chia động từ, trong tiếng Anh còn hàng nghìn quy tắc khác, chưa kể các trường hợp bất quy tắc. Sẽ mất rất nhiều công sức để lập trình hết các quy tắc này cho AI. Lúc này, ML mới thể hiện lợi thế có thể học từ một lượng dữ liệu lớn. Có nhiều tình huống cụ thể mà ML không chính xác bằng AI, nhưng ít nhất với các công nghệ ML hiện đại, thì ML về tổng quan sẽ dịch tốt hơn.
* Như vậy ranh giới của ML và AI vẫn chưa thể phân định được?
Tôi phân loại các ví dụ của bạn dựa vào hiểu biết của bản thân. Như bạn đã nói, ranh giới của ML và AI rất mong manh, nên có thể sẽ có người không đồng ý với tôi. Tiêu chuẩn của tôi là, các hành vi nào của hệ thống có thể tự suy ra từ dữ liệu mà không cần lập trình viên tự viết thì tôi gọi là ML, còn các hành vi cần lập trình viên viết cụ thể thì là AI.
* Xin hãy giải thích cụ thể hơn nếu như AI do lập trình viên tác động thì dữ liệu AI sử dụng sẽ được truy xuất thủ công hay tự động? Và liệu dữ liệu đó có tự cập nhật theo real-time để tăng tính chính xác cho báo cáo hay không? Và nếu dữ liệu tự cập nhật thì có thể xem là ML hay không ?
Kể cả dưới sự tác động của lập trình viên, thông thường thì dữ liệu mà AI sử dụng vẫn được truy xuất một cách tự động. Ví dụ như trong thực tế, lập trình viên có thể cung cấp 1 triệu dữ liệu cho một chương trình học, nhưng chương trình này sẽ chỉ lấy ngẫu nhiên một vài dữ liệu để học, rất ít máy tính hiện đại có thể lưu trữ toàn bộ 1 triệu dữ liệu để học.
Nói về “dữ liệu tự cập nhật”, trong ML có những phân ngành chuyên làm về hướng này. Ví dụ, học tăng cường (Reinforcement Learning) đòi hỏi chương trình học bằng cách tự sinh ra dữ liệu mới; ở Google, nhóm của tôi có làm về AutoML (tạm dịch: học tự động), trong đó cũng có hướng giúp cho máy tự sinh ra thêm dữ liệu để học. Như vậy, nếu dữ liệu “biết” tự cập nhật thì theo tôi, có thể xem là ML.
* Vậy chúng tôi có thể hiểu ML là đầu vào dữ liệu để cho AI sử dụng, phân tích và đưa ra báo cáo/ kết quả doanh nghiệp mong muốn hay không thưa ông?
Tôi nghĩ nói ML là “đầu giữa” thì tốt hơn. Tôi thường hiểu thế này: AI là “đứa trẻ” và lúc đầu nó đang “đói bụng”; dữ liệu là “gạo”; ML là phương pháp để “nấu gạo thành cơm” (cơm hấp, cơm nắm, cơm chiên...); bằng cách sử dụng ML, dữ liệu trở thành “cơm” cho đứa trẻ AI “ăn”; sau khi “ăn”, AI sẽ trở nên thông minh hơn.
* Ông có chia sẻ là If-Else là AI thế hệ cũ, vậy ông có thể vui lòng chia sẻ thêm cho chúng tôi AI thế hệ mới là như thế nào không thưa ông?
AI thế hệ mới thay thế If-Else bằng những quyết định tự động và liên tục hơn. Cụ thể:
AI thế hệ mới thay thế If-Else bằng những quyết định tự động và liên tục hơn.
- Tự động có nghĩa là đối với phương pháp If-Else, lập trình viên phải viết rõ các điều kiện để chương trình biết khi nào sẽ vận hành nhánh If, khi nào vận hành nhánh Else. Ví dụ, “nếu trong bức ảnh có ria mép thì có khả năng đây là con mèo”. Trong AI hiện đại, các điều kiện này được xác định tự động từ dữ liệu thông qua ML.
- Còn liên tục có ý nghĩa tương phản với If-Else. Trong phương pháp If-Else, nếu đã If thì không Else nữa. Xét trong ví dụ trên, bức ảnh hoặc là có xuất hiện ria mép, hoặc là không, nhưng trong AI hiện đại, bức ảnh có thể “có 0,5 sợi ria mép”. Sự liên tục này giúp AI hiện đại linh hoạt hơn trong huấn luyện và thực dụng.
* Nói sâu một chút về ML sẽ học các thuộc tính nằm trong hành vi lịch sử và nằm ngoài hành vi lịch sử như thế nào? Xin cho một ví dụ cụ thể?
Ví dụ về hành vi trong lịch sử thì rất nhiều. Một hệ thống Thương mại Điện tử có thể nhận thấy rằng nhiều người dùng của họ sau khi mua một chiếc vợt tennis thì sẽ mua bóng tennis và giày tennis. Từ đó, nếu thấy một người mới mua vợt tennis, hệ thống sẽ đưa ra các quảng cáo để bán bóng tennis. Hơn nữa, nếu hệ thống biết được người dùng là nam hay nữ thì sẽ quảng cáo các mẫu giày tương ứng. Các quảng cáo này được đưa ra dựa theo lịch sử mua bán của người dùng.
Ví dụ về hành vi ngoài lịch sử thường xuất hiện khi các hệ thống ML được sử dụng để lấy mẫu (Sample). Hệ thống GPT-3 của OpenAI, được gọi là “siêu AI”, đã thể hiện khả năng này khi tự nói rằng: “AI sẽ không tiêu diệt loài người. Tin tôi đi” mặc dù câu nói này hoàn toàn không có trong dữ liệu huấn luyện của GPT-3.
Tuy nhiên, theo cá nhân tôi, các ví dụ thú vị nhất về hành vi không có trong lịch sử thường xuất hiện trong một phân ngành hẹp của ML gọi là Reinforcement Learning (học tăng cường). Tôi xin lấy một ví dụ khác trong bộ môn cờ vua. Lý thuyết cờ vua căn bản có nguyên lý: trong khai cuộc, cần cố gắng để kiểm soát trung tâm của bàn cờ. Tuy nhiên, năm 2018, DeepMind – công ty con của Alphabet – đã lập trình ra hệ thống AlphaZero, sử dụng các thuật toán học tăng cường để huấn luyện một mạng neuron chơi cờ vua. AlphaZero thường đưa ra một nước đi rất quái dị là h4, tức là đẩy một quân tốt ngoài biên, thường không liên quan gì đến kiểm soát trung tâm của bàn cờ. Thế nhưng, sau khi các đại kiện tướng phân tích nước h4 của AlphaZero, họ dần nhận ra nước đi này rất hiệu quả. Từ đó, họ gọi nước đi này là “nước đi h4 kiểu AlphaZero” và bắt đầu xây dựng các lý thuyết mới về nó. “Hành động” h4 này của AlphaZero hoàn toàn nằm ngoài hành vi lịch sử.
* Truyền thông vẫn thường nói nhiều về việc dùng AI để tạo ra mô hình kinh doanh mới, nhưng dữ liệu phải được xây như thế nào để đáp ứng nhu cầu này thưa ông?
Tôi nghĩ rằng các doanh nghiệp cần phải xác định thật rõ ràng mục tiêu của họ là gì và “dạy” cho AI thật cụ thể về các mục tiêu này. AI khi được “tự do” hành động, có thể sẽ đưa ra rất nhiều quyết định mà chúng ta không ngờ đến, nhưng AI khi không có đủ “tự do” để hành động thì đôi khi lại chẳng làm được gì.
Xác định thật cụ thể các mục tiêu, độ tự do và giới hạn cho các thuật toán AI và ML sẽ mang đến các kết quả như ý hơn
Ví dụ, nếu một công ty “yêu cầu” AI của họ “hãy tìm mọi cách để tăng doanh số bán hàng”, thì AI đó có thể sẽ “nghĩ” ra các giải pháp tăng doanh số cao ngoài mức hàng mà công ty có thể cung cấp. Từ đó, AI sẽ “chỉ đạo” công ty này phải đầu tư xây dựng thêm nhiều nhà máy để sản xuất đủ sản phẩm, nhưng không biết rằng sản xuất quá nhiều sẽ gây ra cung vượt cầu, khiến các sản phẩm không bán được và cuối cùng công ty này mất nhiều tiền hơn.
Mặt khác, nếu công ty này yêu cầu AI của họ “hãy tìm mọi cách để tăng doanh số bán hàng nhưng không được dùng thêm vốn” thì có thể AI của họ lại chẳng tìm được phương pháp nào cả.
Một điểm cân bằng tốt hơn cho công ty này có thể là, công ty chuẩn bị sẵn một số vốn, sau đó yêu cầu AI của họ “hãy tìm mọi cách để tăng doanh số bán hàng nhưng không dùng quá số vốn này”.
Như vậy, xác định thật cụ thể các mục tiêu, độ tự do và giới hạn cho các thuật toán AI và ML sẽ mang đến các kết quả như ý hơn. Một khi xác định rõ các tiêu chí này, thì việc thu thập dữ liệu có thể tuân theo các tiêu chí này mà thực hiện.
* Xin cảm ơn ông.
Xem thêm bài viết cùng chuyên mục tại đây.
Công Sang / Brands Vietnam
* Nguồn: Brands Vietnam