Mỏ vàng dữ liệu
Bộ phim giả tưởng “Mắt đại bàng” (Eagle Eyes) nói về một cỗ máy trí tuệ nhân tạo đã điều khiển và thao túng cả con người khi nó có khả năng phân tích dữ liệu thu thập từ mọi nguồn. Với khoa học dữ liệu, Big Data, nhiều giả tưởng trong bộ phim này đã hiện diện trong cuộc sống...
Theo báo cáo của Nielsen năm 2017, ước tính có khoảng 15 triệu người Việt Nam đã tham gia mua sắm trực tuyến. Trong số 15 triệu người này, mỗi người đã thực hiện ít nhất 1 giao dịch thương mại điện tử. Mỗi giao dịch xảy ra đều được lưu trữ, từ tên của khách hàng, địa chỉ, độ tuổi, mặt hàng và thời điểm mua sắm đến thông tin thanh toán. Khối lượng dữ liệu thu thập và lưu trữ là vô cùng lớn.
Nếu so sánh với các trang mạng xã hội, lượng thông tin thu thập sẽ còn khổng lồ hơn vì người dùng thường xuyên tương tác với nhau qua các bài đăng, tweet, comment và chăm chỉ liệt kê đầy đủ các sở thích của mình từ thương hiệu thời trang, phim ảnh, sách, thể thao, âm nhạc đến những điểm đã đi qua. Theo số liệu công bố bởi Facebook tại thời điểm năm 2014, mỗi ngày, Facebook thu thập 600 Terabyte dữ liệu hình ảnh, video, bài đăng và lượng thông tin lưu trữ trong các trung tâm dữ liệu của Facebook đạt hơn 300 Petabyte, tương đương với 1 triệu Gigabyte, tăng 3 lần so với năm 2013. Các doanh nghiệp như Facebook, Lazada, Tiki, Uber, Grab hoàn toàn có quyền sử dụng những dữ liệu này tùy ý khi đã được sự cho phép của khách hàng qua việc đánh đấu đồng ý với các điều khoản sử dụng. Vậy các doanh nghiệp sử dụng những dữ liệu này để làm gì?
Đưa khách hàng vào thuật toán
“Lazada muốn phân tích nguồn dữ liệu khổng lồ của mình để từ đó có phương pháp tiếp cận khách hàng mới với chi phí marketing tối ưu nhất”, ông Phạm Thông, Giám đốc Marketing của Lazada Việt Nam, cho biết. Với thông tin thu thập từ khách hàng thực hiện giao dịch như họ tên, ngày tháng năm sinh, địa chỉ, giới tính và các thông tin giao dịch hằng ngày. Về lý thuyết, các doanh nghiệp thương mại điện tử như Lazada, Tiki, Adayroi hoàn toàn có thể vẽ ra chân dung 360 độ của khách hàng điển hình cho từng ngành hàng khác nhau, phân nhóm theo tiềm năng mua sắm, sở thích, thói quen mua sắm... Từ đó, họ thiết kế, xây dựng các chương trình tiếp thị, khuyến mại chính xác để khai thác tối đa những khách hàng tiềm năng.
Khai thác tối ưu dữ liệu khách hàng, các doanh nghiệp thương mại điện tử có thể theo đuổi cuộc chơi tùy biến đại trà (mass customization), một trong những xu hướng chi phối mạnh mẽ nhất ngành bán lẻ thế giới. Cụ thể, giao diện website có thể được trình bày tùy thuộc vào hồ sơ của khách hàng. Ví dụ, đối với khách hàng nữ hay mua sữa, tã cho em bé, giao diện website có thể hoàn toàn tập trung trình bày các sản phẩm theo chủ đề mẹ và bé, từ thời trang, sữa, đến bỉm hay sách hướng dẫn chăm sóc mẹ và bé... Áp dụng các phương pháp dự đoán, doanh nghiệp thương mại điện tử có thể dự đoán và gợi ý các khách hàng này mua sữa và tã cho bé 18 tháng hoặc 2 tuổi khi lượng tã, sữa của những đơn hàng trước có thể đã được dùng hết.
Trong buổi phỏng vấn với Tech in Asia, Max Bittner, CEO của Tập đoàn Lazada, cho biết Lazada đang đầu tư cho tăng trưởng, chú trọng ứng dụng khoa học dữ liệu và sẽ tăng gấp đôi đội ngũ các nhà khoa học dữ liệu của Lazada lên 60 người, để biến kho dữ liệu của Lazada thành kiến thức về khách hàng và các công cụ giúp người dùng mua sắm tốt hơn. Việc xây dựng các công cụ nhằm tiếp thị sản phẩm hiệu quả hơn cũng sẽ giúp Lazada tiến gần hơn đến nguồn doanh thu từ việc bán các gói quảng cáo, marketing cho các nhà bán hàng của mình.
Thu thập và phân tích tường tận dữ liệu khách hàng, Amazon và Lazada mong muốn có thể xóa mờ ranh giới giữa mua sắm tại cửa hàng và mua sắm trực tuyến khi vai trò của nhân viên bán hàng, tư vấn, chăm sóc khách hàng được thay thế bởi các thuật toán phân tích dữ liệu mua sắm quá khứ. Thậm chí, Amazon, Netflix, Google còn hiểu khách hàng hơn chính bản thân họ khi nắm trong tay dữ liệu lịch sử mua sắm qua nhiều năm.
Từ góc nhìn của các đơn vị cung cấp dịch vụ quảng cáo, Facebook định hướng các quảng cáo đến đúng đối tượng khách hàng dựa trên 98 tiêu chí, thông tin cá nhân của khách hàng như 98 tầng lọc để khoanh vùng được nhóm khách hàng mục tiêu.
Cùng sử dụng dữ liệu từ mạng xã hội, các công ty cung cấp dịch vụ lắng nghe xã hội (Social Listening) giúp các doanh nghiệp có thể hiểu rõ được người dùng nhìn nhận tích cực hay tiêu cực về mình. Các công ty này thu thập dữ liệu phổ biến như bài đăng Facebook, tweet trên Twitter, từ khóa tìm kiếm trên Google, hình ảnh và bình luận trên Instagram và các thông tin khác trên mạng xã hội. Sau đó, các nhà khoa học dữ liệu thực hiện các bước xử lý và phân tích dữ liệu bằng thuật toán do họ lập trình, có thể phân tích tương quan giữa các tín hiệu và các chủ đề như giá cả, chất lượng dịch vụ, mẫu mã sản phẩm, địa điểm...
Lợi thế của thị trường Việt Nam
Ông John Song, một chuyên gia có hơn 20 năm kinh nghiệm trong lĩnh vực báo chí, truyền thông, đã sáng lập nên TenPoint7, công ty cung cấp dịch vụ khoa học dữ liệu toàn cầu hoạt động tại Việt Nam. TenPoint7 sử dụng đội ngũ là các thạc sĩ, tiến sĩ khoa học dữ liệu của Việt Nam để cung cấp dịch vụ Machine Learning phân tích dữ liệu giúp doanh nghiệp toàn cầu hiểu rõ mối quan hệ của mình với khách hàng. TenPoint7 cung cấp kiến thức thấu hiểu người tiêu dùng và thúc đẩy bán hàng, nhưng những ứng dụng này chỉ là một phần nhỏ trong vô vàn ứng dụng của ngành khoa học dữ liệu.
Một startup mới nổi trong lĩnh vực này là ANTS đang tập trung nghiên cứu công nghệ Big Data trong quảng cáo (Computational Advertising, AdTech) và tự động hóa marketing (MarTech). Theo đồng sáng lập kiêm CEO ANTS Đinh Lê Đạt, hiện Chợ quảng cáo ANTS AdExchange có 15 tỉ lượt quảng cáo tại Việt Nam và 10 tỉ lượt quảng cáo tại Indonesia với độ phủ tới 100 triệu người dùng online thường xuyên. Khách hàng của ANTS cũng vượt con số 1.000 đối tác. “Từ những dữ liệu thô về khách hàng như họ và tên, email và số điện thoại, với công nghệ Big Data và Data-Driven Marketing sẽ giúp bạn hiểu thêm về nhân khẩu học, hành vi, tính cách, cuộc sống và xu hướng mua sắm trực tuyến của khách hàng. Bạn có thể tiếp cận khách hàng của mình với các thông điệp được lập trình sẵn mọi lúc mọi nơi qua môi trường internet”, ông Đạt chia sẻ.
McKinsey dự đoán trong năm 2018, nhu cầu thế giới về các nhà khoa học dữ liệu sẽ vượt 50% so với nguồn cung, trong đó chỉ riêng nước Mỹ cần đến 490.000 người, trong khi đào tạo và nguồn cung thu hút từ các nước khác chỉ được gần 200.000 người.
Với lợi thế dân số trẻ, có lượng người sử dụng internet cao (khoảng 54 triệu người chiếm 57% dân số), Việt Nam được xem là thị trường Big Data tiềm năng hàng đầu khu vực châu Á. Tuy nhiên, không phải doanh nghiệp nào cũng có thể thu thập dữ liệu khách hàng. Hầu hết dữ liệu khách hàng tại Việt Nam được thu thập từ các công ty cung cấp dịch vụ nghiên cứu thị trường hoặc do chính công ty tự thu thập (đa phần là các tổ chức tài chính hoặc các công ty hoạt động trong lĩnh vực thương mại điện tử). Ngành khoa học dữ liệu ở Việt Nam cũng tương đối mới so với ở các nước phát triển, cơ sở hạ tầng công nghệ thông tin cũng chưa thực sự tiên tiến nên cần đầu tư nhiều hơn mới có thể lưu trữ và xử lý dung lượng lớn dữ liệu. Việc ứng dụng khoa học dữ liệu tại Việt Nam mới chỉ phổ biến trong khuôn khổ 2 mục đích đã nói ở trên.
Ông John Song tin tưởng vào tiềm năng phát triển của nguồn nhân lực khoa học dữ liệu tại Việt Nam, do thế mạnh trong khâu đào tạo các nhà khoa học dữ liệu, mà nổi bật nhất là Viện John Von Neumann thuộc Đại học Quốc gia TP.HCM. Bản thân ông Song đã nghe một vài đồng nghiệp ở Singapore và Mỹ nhận xét rất tích cực về các nhà khoa học dữ liệu tại Việt Nam và dự báo rằng trong tương lai, các nhà khoa học dữ liệu của Việt Nam sẽ được các doanh nghiệp tranh giành hơn nữa, trong bối cảnh thiếu hụt nguồn nhân lực khoa học dữ liệu trên toàn cầu.
Một nghiên cứu của McKinsey dự đoán trong năm 2018, nhu cầu thế giới về các nhà khoa học dữ liệu sẽ vượt 50% so với nguồn cung, trong đó chỉ riêng nước Mỹ cần đến 490.000 người, trong khi đào tạo và nguồn cung thu hút từ các nước khác chỉ được gần 200.000 người. Nhận thấy cơ hội này, ông Song đã mở công ty tại Việt Nam và hợp tác với Viện John Von Neumann để thu hút nhân lực ngành tại Việt Nam, từ đó cung cấp các dịch vụ mua ngoài cho các công ty Mỹ.
Như Thọ
Nguồn Nhịp cầu Đầu tư