Kinh tế dữ liệu – động lực của tương lai
Trong thế kỉ 20, dầu mỏ đóng một vai trò vô cùng quan trọng trong đời sống kinh tế, chính trị của nhân loại. Nó mở ra những ngành công nghiệp mới, thúc đẩy sản xuất và cả là quyền lực cho những ai nắm được trữ lượng lớn. Bước sang thế kỉ 21, một loại tài nguyên mới – với tầm quan trọng và vai trò đạt đến những gì dầu mỏ từng có trước đây – đã xuất hiện, đó chính là dữ liệu.
Hãy nhìn lại cuộc sống công nghệ quanh bạn, để thấy được rằng hiện nay chúng ta đang đứng giữa những dòng chảy dữ liệu khổng lồ: từ chiếc điện thoại bạn dùng để nhắn tin mỗi ngày, chiếc đồng hồ thông minh theo dõi sức khỏe đeo trên tay, những mạng xã hội như Facebook, Instagram không dưới một lần bạn truy cập hàng ngày…Mọi thứ đều thu nhận dữ liệu từ bạn, và dữ liệu đó không còn chỉ đơn thuần là thông tin cá nhân cơ bản như tên, tuổi, địa chỉ, sở thích chung, mà các thiết bị giờ đây còn tạo ra dữ liệu thứ cấp, được nội suy từ những dữ liệu thô thu thập từ bạn, từ đó gợi ý lại cho chính bạn về nhu cầu mua sắm hay địa điểm cần tìm. Ở một quy mô rộng hơn, dữ liệu còn được tạo ra từ những phương tiện giao thông trên thế giới, từ những chiếc xe tự lái, hay cả những cảm biến đặt trong thiết bị máy móc…
Hàng triệu con người cùng hàng tỷ thiết bị đang cùng sản sinh ra lượng dữ liệu khổng lồ. Dòng chảy đó lớn dần lên từng giây trong bối cảnh thế giới đã đặt một chân vào cuộc cách mạng công nghệ 4.0, và Internet of Things (IoT) đang là xu hướng dẫn đầu mọi xu hướng.
Về phía người dân, sự trỗi dậy của kinh tế dữ liệu mang lại cho họ rất nhiều lợi ích. Không chỉ đơn giản là những gợi ý mua hàng trên Amazon, hay những bài quảng cáo có liên quan đến sở thích của bạn trên Facebook, nó còn làm được nhiều hơn thế.
Như trong lĩnh vực y tế, với dữ liệu dồi dào từ bệnh nhân, các máy tính mô phỏng sẽ xác định các loại thuốc mới có hiệu quả và an toàn hay không, thay vì phải thực hiện nhiều pha thử nghiệm lâm sàng như truyền thống - điều tốn nhiều thời gian cũng như chi phí. Như vậy các loại thuốc mới sẽ đến tay bác sĩ và bệnh nhân nhanh hơn trước đây.
Một ví dụ cụ thể đó là trường hợp của bà Shirley Pepke (Los Angeles, Mỹ) được chẩn đoán mắc ung thư buồng trứng vào năm 2013. Nhờ vào một công cụ phân tích dữ liệu về khối u của hàng trăm người bị ung thư buồng trứng (trong đó có chính bà Pepke) do chính mình tự phát triển, Pepke đã phát hiện ra mối liên quan nhất định giữa khối u trong cơ thể mình và hệ miễn dịch. Thay vì tiến hành thêm đợt hóa trị như được đề nghị, bà thuyết phục bác sĩ thử nghiệm một loại thuốc mới vẫn chưa được cấp phép sử dụng trong điều trị ung thư buồng trứng nhưng lại có khả năng giúp “khởi động lại” hệ miễn dịch của mình. Kết quả là khối u đã không còn và một năm sau không có dấu hiệu nào của ung thư được phát hiện. Bà Pepke sau đó đã cho phát triển rộng rãi công cụ xác định liệu trình điều trị cho riêng từng bệnh nhân mà mình sáng tạo ra để giúp đỡ được những người mắc ung thư buồng trứng khác.
Hay trong lĩnh vực an ninh, có thể nhắc đến hệ thống DAS (Domain Awareness System – hệ thống nhận biết theo khu vực) của Sở cảnh sát thành phố New York. DAS thu thập và phân tích dữ liệu thu thập từ hơn 9.000 camera giám sát, 600 bộ cảm biến phóng xạ, hóa học bao gồm cả loại cố định và di động, các cuộc gọi đến số điện thoại khẩn cấp 911, hồ sơ tội phạm lưu trữ trong Sở. Toàn bộ 35.000 nhân viên cảnh sát ở New York đều được trang bị điện thoại thông minh để tương tác với hệ thống. DAS là hệ thống cung cấp nguồn thông tin hỗ trợ việc phòng chống tội phạm, khủng bố và phục vụ hoạt động hàng ngày của cảnh sát.
Về phía các công ty công nghệ, dữ liệu là nguồn tài nguyên giữ vai trò trung tâm trong nhiều kế hoạch phát triển. Nó là căn cứ để tạo ra hiệu ứng mạng lưới dữ liệu (data-network effect). Hiểu đơn giản, hiệu ứng này xảy ra khi các sản phẩm của Facebook hay Google, dưới sự hỗ trợ của trí thông minh nhân tạo (AI), sẽ càng “thông minh” hơn khi nó tiếp nhận được càng nhiều dữ liệu, và từ đó dịch vụ mà nó cung ứng sẽ được cải thiện và phù hợp hơn cho từng đối tượng người dùng.
Khi dữ liệu đổ vào nhiều thêm, thì các khả năng của sản phẩm (như dự đoán hành vi người dùng, đưa ra gợi ý cho người dùng, tối ưu hóa cho từng người dùng) cũng tự động được nâng cấp. Và nếu chất lượng sản phẩm tăng lên, thì sẽ vừa giữ chân được người dùng cũ, và hấp dẫn người dùng mới, vậy là dữ liệu đổ vào sẽ lại tăng lên. Vòng lặp này diễn ra liên tục giúp mang lại lợi ích cho các công ty công nghệ trong cả việc cải thiện sản phẩm và có thêm khách hàng.
Ví dụ, khi bạn like, bình luận bài viết hay ảnh từ một người bạn trên Facebook nhiều hơn so với những người bạn khác. Hệ thống của mạng xã hội này sẽ dựa trên các dữ liệu đó, thay đổi lại newfeeds của bạn với mật độ xuất hiện của người bạn kia cao hơn, đây chính sự ưu tiên để bạn cập nhật thông tin nhiều hơn từ những những người mà bạn quan tâm. Hay nếu bạn cho đăng tải càng nhiều ảnh của mình lên cùng với việc gắn thẻ (tag) mình vào các bức ảnh đó, thì cơ chế tự động nhận diện khuôn mặt của Facebook sẽ càng chính xác hơn. Trợ lý ảo “Assistant” của Google sẽ càng thực hiện các thao tác và trả lời câu hỏi từ người dùng tốt hơn nếu càng được sử dụng nhiều.
Khi dữ liệu đổ vào nhiều thêm, thì các khả năng của sản phẩm (như dự đoán hành vi người dùng, đưa ra gợi ý cho người dùng, tối ưu hóa cho từng người dùng) cũng tự động được nâng cấp. Và nếu chất lượng sản phẩm tăng lên, thì sẽ vừa giữ chân được người dùng cũ, và hấp dẫn người dùng mới, vậy là dữ liệu đổ vào sẽ lại tăng lên. Vòng lặp này diễn ra liên tục giúp mang lại lợi ích cho các công ty công nghệ trong cả việc cải thiện sản phẩm và có thêm khách hàng.
Nếu như vào năm 2016, top 5 công ty có giá trị vốn hóa lớn nhất thị trường có những “đại gia” trong các lĩnh vực dầu mỏ, năng lượng, tài chính, thì giờ đây cả 5 cái tên đều là những người khổng lồ công nghệ làm chủ được hiệu ứng mạng lưới dữ liệu.
Hãy nhìn lại trường hợp của dầu mỏ, giá của nó được xác định bởi quy luật cung cầu, cùng các biến động kinh tế, chính trị liên quan. Nhưng với dữ liệu – "khoáng sản" trong kỉ nguyên số – nó sẽ cần được định giá như thế nào? Dữ liệu nào sẽ đắt giá hơn, và dữ liệu nào thì rẻ hơn? Đây là các câu hỏi khó.
Về cơ bản, các luồng dữ liệu đã không có sự thống nhất, nên tìm ra được những chuẩn mực để định giá không hề đơn giản. Các phương pháp định giá dữ liệu cũng chỉ mới được phát triển. Một ví dụ về vấn đề này là tập đoàn chuyên về cờ bạc Caesars Entertainment (tuyên bố phá sản năm 2014) nắm trong tay dữ liệu 45 triệu khách hàng trung thành trong suốt 17 năm, và số dữ liệu này được định giá lên tới 1 tỷ đô la Mỹ.
Xung quanh dữ liệu cũng nảy sinh nhiều vấn đề hóc búa. Như việc nó có thể bị sao chép và có thể được sử dụng cho những mục đích không tốt. Đôi khi việc ai là người sở hữu dữ liệu cũng là câu hỏi gây đau đầu. Như trường hợp của ô tô tự lái, chủ sở hữu dữ liệu sẽ là ai? Có phải là nhà chế tạo xe? Hay là đơn vị đã sản xuất cảm biến tạo ra dữ liệu? Hay nó phải nằm trong tay của chủ sở hữu xe?
Và nếu như dữ liệu liên quan đến thông tin cá nhân, mọi thứ còn phức tạp hơn. Ai sẽ là người có quyền bán hay quyền mua những thông tin đó? Thông tin cá nhân thu thập được bị tiết lộ đến đâu là quá giới hạn?
Hiện nay, có khoảng 11 tỷ thiết bị đang được kết nối tới Internet. Theo hãng nghiên cứu thị trường IDC, vào năm 2025, con số này sẽ là 80 tỷ. Chính phát triển chóng mặt này của IoT (Internet of Things) sẽ biến dòng chảy của dữ liệu “phình” lên đáng kể. IDC dự đoán rằng tổng lượng dữ liệu số được tạo ra trên toàn cầu đến năm 2025 sẽ là 180 zettabyte.
Đứng trước xu hướng này, các tập đoàn công nghệ lớn rõ ràng đều cần phải có những sự chuẩn bị. Trong năm 2016, Microsoft, Amazon và Alphabet (công ty mẹ của Google) đã chi ra gần 32 tỷ đô la Mỹ để đầu tư cho các trung tâm xử lý dữ liệu, tăng 22% so với năm 2015.
Đối với các công ty nhỏ, nếu muốn thu thập và xử lý dữ liệu, để đạt được hiệu ứng mạng lưới dữ liệu (data-network effect) thì sao? Trước hết cần hiểu rằng hiệu ứng này không tự nhiên mà có. Doanh nghiệp cần xây dựng hệ thống cơ sở hạ tầng cho dữ liệu (sử dụng nền tảng Big Data và các công cụ) và đội ngũ chuyên về dữ liệu (kĩ sư công nghệ, chuyên gia phân tích dữ liệu...).
Mục tiêu: Ngay từ ban đầu, công ty cần định hình được những mục tiêu cho việc thu thập và khai thác dữ liệu; xác định xem việc thu thập dữ liệu sẽ tiến hành qua các kênh nào, và sẽ tiến hành ra sao (thủ công hay tự động), dữ liệu thu về sẽ được xử lý như nào, và sử dụng ra sao?
Tập trung vào dữ liệu cần thiết: Khi đã có được dữ liệu trong tay, cần phân tích nguồn dữ liệu, và độ tin cậy của chúng. Nếu như không qua màng lọc đánh giá này, mà sử dụng “dữ liệu rác” thì các kết quả dự báo sẽ không chính xác.
Đánh giá chất lượng dữ liệu: Màng lọc này là để chọn ra những dữ liệu có thông tin phù hợp với mục tiêu đặt ra ban đầu, và bỏ qua những dữ liệu chứa thông tin không cần thiết. Điều này sẽ giúp giảm tải cho việc phân tích dữ liệu.
Phân tích ý nghĩa của dữ liệu: Phân tích ý nghĩa của dữ liệu là bước đánh giá xem dữ liệu nói lên điều gì về chất lượng của sản phẩm, về phản ứng của khách hàng, hay là cả về khách hàng. Từ những đánh giá được rút ra, công ty sẽ đưa ra thay đổi cho sản phẩm để tối ưu/phù hợp với khách hàng, cùng với đó là các dự báo phục vụ cho chiến lược trong tương lai.
Dữ liệu là loại tài nguyên giá trị trong thời đại công nghệ hiện nay. Mỗi doanh nghiệp, dù quy mô nhỏ hay lớn, nếu biết cách thì đều có thể khai thác được loại tài nguyên này. Như các dự báo của IDC, dòng chảy của dữ liệu sẽ còn “ào ạt” hơn trong tương lai gần. Nếu không muốn đứng ngoài xu thế này, lãnh đạo doanh nghiệp hãy sẵn sàng tìm hiểu về ứng dụng từ dữ liệu, và lập ra một nhóm xây dựng chiến lược cùng giải pháp khai thác dữ liệu phục vụ mục tiêu phát triển của công ty ngay từ hôm nay.
Phạm Tuấn Mạnh - Nguyễn Việt Dũng
Nguồn Doanh Nhân Online