Bùi Minh Tuấn

Founder @ Vbusiness

Chia sẻ
Báo lỗi

Không phải Big Data, tương lai của AI sẽ phụ thuộc vào ít dữ liệu hơn

11/02/2019
3,394
0

Theo nhận định của hai chuyên gia H. James Wilson và Paul R. Daugherty thì tương lai của trí tuệ nhân tạo sẽ cần ít dữ liệu hơn.

Trước khi đầu tư vào AI (Trí tuệ nhân tạo), các công ty nên hiểu rằng năm năm tới sẽ là thời điểm mà ứng dụng và máy móc trở nên “thật” hơn và thông minh hơn.

Chúng sẽ ít phụ thuộc vào lượng dữ liệu khổng lồ được cung cấp mà sẽ bắt đầu suy luận cách giải quyết vấn đề giống con người. Chính khả năng suy luận này sẽ giúp AI được áp dụng rộng rãi hơn ngay trong những lĩnh vực không ai nghĩ nó thích hợp.

Trong quá khứ, AI được phát triển thông qua học sâu (Deep Learning) và học máy (Machine Learning), phát triển hệ thống thông qua hàng “tấn” dữ liệu. Nhưng phụ thuộc nhiều vào dữ liệu khiến chúng dễ gặp rắc rối, chẳng hạn như trong các trường hợp không có hoặc có quá ít dữ liệu.

Không phải Big Data, tương lai của AI sẽ phụ thuộc vào ít dữ liệu hơn

Sẽ thế nào nếu tương lai là “Small data” thay vì Big data?

Ví dụ: Xe không người lái có thể dừng khi gặp người băng qua đường, người đi bộ hay xử lý với tình trạng giao thông tồi tệ nhưng lại khó khăn khi gặp một đứa trẻ mặc trang phục Halloween khác thường và nhảy nhót trên đường trong buổi hoàng hôn.

Nhiều hệ thống khác cũng gặp tình trạng tương tự. Hệ thống nhận diện khuôn mặt của Iphone X thì không nhận ra khuôn mặt của người dùng vào buổi sáng – Những gương mặt hốc hác và bơ phờ sau một đêm ngủ say.

Công cụ thông minh nhân tạo tuy đánh thắng các kiện tướng trong môn Cờ Vây nhưng chỉ cần hình ảnh nó nhận diện bị lật ngược hoặc có một chút thay đổi thì nó sẽ phán đoán sai hoặc trở nên “tự tin thái quá” khi nhận diện những thứ không rõ ràng.

Các hệ thống này cũng bị hạn chế về mặt đạo đức vì không phải công ty nào cũng có đủ dữ liệu để xây dựng công cụ của riêng họ.

Sử dụng dữ liệu của người dân thì lại liên quan đến vấn đề riêng tư và càng làm chính phủ thắt chặt kiểm soát – Quy định bảo vệ dữ liệu chung (GDPR) của Liên Minh Châu Âu là một trường hợp trong đó dữ liệu cá nhân của người dùng được quy định và bảo vệ một cách nghiêm ngặt.

Không phải Big Data, tương lai của AI sẽ phụ thuộc vào ít dữ liệu hơn

GDPR quy định rất nghiêm ngặt về dữ liệu cá nhân.

Hơn nữa, các hệ thống này giống như “hộp đen”, không ai hiểu cách dữ liệu được sử dụng và điều đó khiến họ dễ bị thao túng bởi các thế lực ngầm (Như cách Người Nga làm trong cuộc bầu cử tổng thống Hoa Kì năm 2016).

Trong tương lai, chúng ta sẽ dựa vào những hệ thống Top-down (Top-down Systems) vốn không cần nhiều dữ liệu, nhanh hơn, linh hoạt hơn và giống như con người – Thông minh một cách bẩm sinh.

Để hiểu hơn về AI sẽ phát triển trong vòng bốn năm tới, các công ty nên tập trung trong bốn lĩnh vực sau:

Tập trung vào sự suy luận của AI

Khi AI dần hiểu biết về thế giới nơi chúng ta đang sống thì việc dạy chúng sẽ dễ dàng hơn và cần ít dữ liệu hơn. Vicarious – Startup được đầu tư bởi những “ông lớn” như Mark Zuckerberg, Jeff Bezos và Marc Benioff, đang làm việc để phát triển trí thông minh nhân tạo cho AI là một ví dụ điển hình.

Không phải Big Data, tương lai của AI sẽ phụ thuộc vào ít dữ liệu hơn

Vicarious – Startup với câu slogan ấn tượng “Chúng tôi xây dựng những phần mềm biết suy nghĩ và học tập như con người”.

Hãy nhớ lại Captchas, công cụ vốn được dùng để phân biệt giữa người và máy tính. Máy tính vốn rất khó vượt qua vì độ phức tạp của Captchas nhưng đó là ngày trước, mọi chuyện đã khác ở thời điểm hiện tại.

Hiện tại, các chuyên viên nghiên cứu ở Vicarious đã dựa trên ngành Thần kinh học tính toán để phát triển một mô hình giúp máy tính vượt qua Captchas với tốc độ cao hơn nhiều so với Mạng thần kinh sâu (Deep Neural Network) và độ hiệu quả về dữ liệu cao hơn gấp 300 lần.

Về thành công của Vicarious, mô hình của họ chỉ cần năm ví dụ vể Captchas để đào tạo cho AI trong khi Mạng thần kinh sâu cần gấp 50.000 lần con số đó.

Những mô hình như vậy đang sở hữu khả năng đào tạo nhanh hơn và rộng hơn so với các phương pháp đào tạo hiện tại và đưa chúng ta tới một thực tiễn nơi AI hiểu rõ về thế giới mà chúng ta đang sống.

Khiến AI hành động như một chuyên gia

Mô hình hóa những gì một chuyên gia sẽ làm trong tình trạng không chắc chắn và thiếu dữ liệu, Mô hình trí tuệ nhân tạo Top-down (Top-down artificial intelligence) kiểu Vicarious sẽ dễ dàng đánh bại những mô hình cần nhiều dữ liệu trong việc thiết kế và kiểm soát các thiết bị trong nhà máy.

Không phải Big Data, tương lai của AI sẽ phụ thuộc vào ít dữ liệu hơn

Phòng Lab chuyên nghiên cứu AI của Siemens đang giúp họ giải quyết rất nhiều vấn đề liên quan tới việc quản lý nhà máy.

Điển hình là Siemens, hãng điện khí lớn nhất của CHLB Đức và châu Âu đang sử dụng mô hình AI Top-Down để kiểm soát quá trình đốt trong các tuabin khí nơi nhiệt độ lên tới 1.600 độ C. Nếu sử dụng mô hình kiểu Bottom-up thì các tuabin khí sẽ cần cả thế kỷ để có đủ dữ liệu cho việc đào tạo AI.

Đào tạo dựa trên sự nhận thức chung

Rất nhiều tổ chức đang làm việc mỗi ngày để “dạy” cho máy móc cách xử lý tình huống theo nhận thức chung của con người để chúng có thể hiểu từng sự vật, sự việc xảy ra hàng ngày, cách giao tiếp, cách đối mặt với các tình huống không thể lường trước và học hỏi kinh nghiệm từ thực tiễn.

Tuy nhiên, điều chúng ta thấy bình thường thì lại rất khó khăn đối với máy móc. Oren Etzioni, CEO của Viện trí tuệ nhân tạo Allen (AI2) đã phát biểu rằng:

HIỆN NAY, ÍT HỆ THỐNG AI (TRÍ TUỆ NHÂN TẠO) NÀO CÓ THỂ ĐƯA RA NHỮNG CÂU TRẢ LỜI ĐÁNG TIN CẬY CHO NHỮNG CÂU HỎI NHƯ “NẾU TÔI ĐẶT ĐÔI TẤT VÀO NGĂN KÉO,THÌ LIỆU NGÀY MAI CHÚNG CÓ CÒN Ở ĐÓ HAY KHÔNG?” HAY “LÀM THẾ NÀO ĐỂ BẠN BIẾT MỘT HỘP SỮA ĐẦY HAY RỖNG?”

Giúp AI hoạt động tốt hơn trong tình trạng thiếu thông tin

Mọi người thường có xu hướng suy nghĩ và hành động theo ý thích dù không có kinh nghiệm trước đó. AI hiện cũng đang được dạy để bắt chước điều đó thông qua quy trình Gaussian – Hành động dựa trên sự không chắc chắn, ít dữ liệu và học hỏi từ thực tiễn.

Alphabet, công ty mẹ của Google hiện đã ra mắt Project Loon, một dự án cung cấp Internet miễn phí đến các khu vực xa xôi trên thế giới thông qua những chiếc bóng bay khổng lồ lơ lửng trên tầng bình lưu.

Không phải Big Data, tương lai của AI sẽ phụ thuộc vào ít dữ liệu hơn

Project Loon là dự án cung cấp Internet miễn phí của Google và được áp dụng công nghệ AI.

Trong dự án này, các hệ thống điều hướng của họ sử dụng quy trình Gaussian để dự đoán các thông tin liên quan đến gió và xác định hướng quả bóng bay nên đi. Mỗi quả bóng sau đó sẽ di chuyển theo hướng gió để đến nơi cần đến và sắp xếp thành một mạng lưới liên lạc.

Những quả bóng này không những có thể đưa ra phán đoán chính xác và hợp lý bằng cách phân tích những chuyến bay trong quá khứ mà còn có thể điều chỉnh phán đoán của mình bằng dữ liệu trong chuyến bay hiện tại.

Các quy trình Gaussian vì vậy không cần nhiều dữ liệu, không cần tính toán nhiều và dễ dàng học hỏi, nếu có vấn đề thì có thể truy tìm nguyên nhân ngay lập tức. Mặc dù sự tiến bộ này chỉ là mới đây nhưng nền móng của nó đã có từ năm 1950, khi các chuyên gia nghiên cứu sử dụng mô hình Top-down để bắt chước trí thông minh của con người.

Vào thời điểm đó, việc nghiên cứu thường gặp khó khăn và khi mô hình học máy kiểu Bottom-up trở nên rõ ràng thì các chuyên gia đã từ bỏ mô hình này, nhưng sự tiến bộ của nghiên cứu và kỹ thuật tính toán đã giúp công nghệ AI theo mô hình Top-down được tái sinh trở lại.

Sớm thôi, các công ty rồi sẽ hiểu hướng đầu tư họ nên đi là gì!

Minh Tuấn/Vbusiness