R&D team YouNet Group: “AI và Machine Learning phát hiện 98% hồ sơ Influencers Việt Nam không đạt chuẩn của SociaLift”

Với sự hỗ trợ của Machine Learning và AI, SociaLift là nền tảng dữ liệu Influencer lớn nhất tại Việt Nam với hơn 10.000 Influencers trên Facebook, 5.000 trên YouTube và 2.000 trên Instagram ở 50 ngành hàng, 70 nghề nghiệp, lĩnh vực. Bài phỏng vấn thầy Quản Thành Thơ và Trương Anh Minh (team R&D của YouNetGroup- YNG) sẽ làm rõ vai trò chủ chốt của Machine Learning (ML) và AI với SociaLift.

(*) Số liệu từ khảo sát vào tháng 01/2019 của YouNetGroup trên 600.000 hồ sơ influencers tại Việt Nam có hơn 5.000 followers. Sau khảo sát, chỉ có 10.000 hồ sơ đạt chuẩn của SociaLift (loại các hồ sơ ảo, hồ sơ không hoạt động trong ít nhất 3 tháng, chỉ chọn hồ sơ có số lượng active followers là 70% trên tổng followers...). Chi tiết trong bài.

SociaLift là platform có hệ thống đo lường, phân loại và đánh giá influencer lớn và sâu nhất Việt Nam, có bộ metrics độc quyền giúp nhãn hàng ra quyết định chính xác, thậm chí real-time (ngay lập tức) phát hiện ngay những Influencer mới nổi. Được kế thừa từ thành quả 5 năm phát triển Big Data, AI và Social Listening, SociaLift giải quyết thành công những thách thức lớn nhất mà nhãn hàng thường gặp trong các chiến dịch Influencer marketing ở Việt Nam:

  1. Xác định được Influencer chất lượng (Qualified Influencer);
  2. Cần số lượng lớn (vài trăm hoặc cả ngàn) Influencer chất lượng nhưng không đủ;
  3. Xác định được Influencer phù hợp với mục tiêu của chiến dịch.

Những trở ngại này góp phần làm hao hụt ngân sách của chiến dịch, nhưng nhãn hàng không có lựa chọn khác vì thiếu những metrics (chỉ số đo lường) để ra quyết định. Muốn có metrics thì phải dựa vào Big Data, AI và ML, vốn là những lĩnh vực được YNG đầu tư từ những năm 2011 bởi công sức của bộ phận R&D do thầy Thơ và anh Minh dẫn dắt.

Thầy Quản Thành Thơ: Cố vấn khoa học của mảng Nghiên cứu và Phát triển (Research and development – R&D) của YNG, từng tham gia nhiều dự án nghiên cứu về AI mà gần nhất là dự án “Dự đoán chuyến bay trễ theo phút” thuộc Đại học Công nghệ Nanyang (Nanyang Technological University - NTU), Singapore.

Anh Trương Anh Minh: Thạc sĩ ngành máy tính 8x rời Google để trở về Việt Nam và lựa chọn YNG để theo đuổi đam mê về AI.

R&D team YouNet Group: “AI và Machine Learning phát hiện 98% hồ sơ Influencers Việt Nam không đạt chuẩn của SociaLift”

Đội ngũ đằng sau sự ra đời của SociaLift. Từ trái qua: anh Trương Anh Minh, anh Nguyễn Anh Hòa (CEO YNG), Thầy Thơ, anh Nguyễn Hải Triều (President khối Mar-Tech YNG) và anh Linh Đặng (Product Head).

* Cơ duyên nào đã đưa thầy Thơ và anh Minh đến với SociaLift?

Thầy Thơ: Mình đang công tác tại Khoa học và kỹ thuật máy tính chuyên về những ứng dụng có tính học thuật cao, và cũng là giảng viên hướng dẫn của Hòa (CEO của YNG) trước kia. Ngày Hòa thành lập công ty có ngỏ lời mời mình về YNG để cùng phát triển team R&D, chính xác là từ 2011. Khi đó Hòa đã có tầm nhìn tốt, Hòa đã biết cần 1 đội chuyên làm sâu về học thuật thì sau này mới phát triển những cái lớn được. SociaLift chính là kết quả của những thành tựu xây dựng từ ngày đó.

Anh Minh: AI là một trong những lý do chính để Minh rời Google để tham gia vào đội ngũ SociaLift. AI là một trong những innovation mạnh nhất có thể giúp VN bắt kịp với thế giới nên Minh muốn tập trung vào đó. Nhưng để áp dụng AI thì phải xử lý cơ sở dữ liệu trước, và Minh cũng đã có cơ hội được tham gia xây dựng Data Warehouse cho YNG trước đây.

Khi đó ít công ty nào dám nhảy vào mảng này vì nó sẽ ngốn chi phí trong 1 thời gian dài và không ra tiền ngay. Tổng chi phí cho bộ phận R&D của YNG rất lớn, tính bằng triệu đô mỗi năm suốt 8 năm nay. Minh khá ấn tượng về điều đó. Vì vậy sự nghiêm túc của YNG khiến Minh tin là mình có thể tạo nhiều impact (tác động) cho VN hơn là làm một mắt xích nhỏ tại Google.

* Theo anh Minh, sự khác biệt lớn nhất giữa thị trường Influencer tại Việt Nam và thế giới là gì?

Anh Minh: Thị trường Influencer Marketing tại Việt Nam và thế giới có chút khác biệt. Ở nước ngoài, thông tin về Influencer thường được tập hợp từ kênh tin chính thống như News, Wikipedia... Còn ở Việt Nam, thông tin về Influencer được lấy từ nội dung trên Social media là chính. Đây vừa là cơ hội vừa là thách thức.

Cơ hội là ai cũng dễ dàng trở thành 1 kênh truyền thông và Influencer. Chỉ cần search hồ sơ của những ai có trên 5.000 followers, thì người Việt đã có khoảng 600.000 Influencers rồi. Nhưng trong 600.000 hồ sơ này, có nhiều hồ sơ influencer không chất lượng (hồ sơ ảo), khó phân biệt được. Đó chính là thách thức. May mắn là SociaLift giải quyết được thách thức này là bằng thuật toán của ML và AI, lọc thành công từ 600.000 hồ sơ này ra 10.000 Influencers chất lượng.

R&D team YouNet Group: “AI và Machine Learning phát hiện 98% hồ sơ Influencers Việt Nam không đạt chuẩn của SociaLift”

Thuật toán ML và AI của SociaLift đã lọc thành công từ 600,.000 hồ sơ ra 10.000 Influencers chất lượng.

* AI và ML làm cách nào tìm ra 98% hồ sơ Influencer không chất lượng?

Anh Minh: Có 3 bước sàng lọc mà trong đó ML và AI đã làm hết 80% công việc. Vòng 1 là nhận biết những hồ sơ mua like, hồ sơ không hoạt động trong vòng ít nhất 3 tháng... thông qua 1 thuật toán của ML, để loại từ 600.000 hồ sơ xuống còn 100.000 Influencers.

Vòng 2 xét đến followers của các Influencer này. Mình sẽ xem các followers này có phải là hồ sơ ít/không hoạt động (inactive) hay không, mà cộng đồng thường gọi là hồ sơ ảo. Với cả ngàn follower thì con người làm sao mà xem hết được, vì vậy AI đã giúp mình rà soát và tìm được khoảng 30.000 Influencers có tỷ lệ active followers (followers thật) trên 70%.

Đến vòng 3 các bạn trong team mới vào nhìn tận mắt 30.000 Influencers này để chọn lại còn 10.000 Influencers chất lượng. Không có AI, chúng ta gần như không thể kiểm nghiệm hết 600.000 influencers này.

Vừa rồi team có hỗ trợ verify (xác thực) chất lượng 500 KOLs cho một nhãn hàng lớn thuộc ngành hàng thương mại điện tử. Lúc nhìn lướt qua thì thấy 500 KOLs này có lượng follower, like, share, comment rất đẹp, nhưng khi chạy qua 3 vòng của ML và AI thì các tương tác này hầu như đều từ các inactive followers (followers ảo), đến 90% Influencer này có trên 50% inactive follower. Vậy từ 500 KOLs, còn lại chưa đến 50 KOLs có khả năng đem lại hiệu quả thực sự cho nhãn hàng.

* Vậy ML và AI chính là lợi thế của SociaLift trên thị trường Influencer?

Thầy Thơ: Hiện nay dân số Việt Nam là khoảng 95 triệu, nhưng có đến 120 triệu Facebook profile, 4 triệu Facebook Fanpage, 2,5 triệu YouTube channels, 1 triệu Instagram profile, mỗi tháng phát sinh hơn 1-2 tỷ comment mới. Mỗi năm con số này tăng theo cấp số nhân vì con người ngày càng giao tiếp nhiều trên Social. Khi dữ liệu quá nhiều thì xử lý dữ liệu sẽ vượt quá sức con người, vì vậy, việc sử dụng ML và AI vào xử lý dữ liệu nói chung và Influencer Platform nói riêng là điều tất yếu, và chính là điểm giúp SociaLift hiệu quả.

R&D team YouNet Group: “AI và Machine Learning phát hiện 98% hồ sơ Influencers Việt Nam không đạt chuẩn của SociaLift”

Bộ metrics phân tích độc quyền giúp đo lường, phân tích, đánh giá chất lượng của mỗi Influencer trong số 10.000 hồ sơ trải dài trên 50 ngành hàng, 70 nghề nghiệp, lĩnh vực.

Với giải pháp của SociaLift thì việc chọn Influencer dễ dàng, không còn cảm tính, chỉ cần dựa trên bộ metrics phân tích độc quyền của SociaLift, gồm có:

  1. Reach Score (Độ lớn của Audience)
  2. Relevance score (Sự liên quan của lĩnh vực của Influencer đối với ngành hàng của nhãn hàng).
  3. Sentiment Score (Phản ánh hệ số tích cực và tiêu cực trên tình cảm/thái độ của followers trên những nội dung của Influencer).
  4. Resonance score (Tỷ lệ tương đồng giữa nội dung bình luận của followers trong post của Influencer)

Hơn 10.000 influencers của SociaLift đều được xếp thứ hạng dựa trên 4 thông số này. Nhãn hàng chỉ cần nhìn vào đó vào để chọn lựa Influencer phù hợp.

Anh Minh: Việc đo lường và ứng dụng Resonance Score Minh chưa thấy ở nền tảng nào, dù là trên thế giới. Ở SociaLift, Resonance Score được phát triển dựa trên ý tưởng của một bạn trong team R&D, và phản ánh chính xác đến 85% ý nghĩa, giúp biết được những người bình luận trong post của Influencer có nói cùng nội dung chủ đề hay không.

Ví dụ, bạn Dũng cầu thủ khi đăng 1 post với nội dung thể thao, mà người ta không nói về thể thao, mà toàn nói về việc “đẹp trai quá!” thì không có liên quan, tức Resonance score bằng 0. Nếu trong post đó nhiều comment như vậy thì Resonance score thấp, và rõ ràng followers của Influencer này không thể hiện được việc hiểu thông điệp nhãn hàng.

R&D team YouNet Group: “AI và Machine Learning phát hiện 98% hồ sơ Influencers Việt Nam không đạt chuẩn của SociaLift”

Nhờ điểm Resonance (Tỷ lệ thảo luận liên quan đến thương hiệu), Nhãn hàng có thể đánh giá được hiệu quả Influencer trong mỗi chiến dịch.

Tuy nhiên, Resonance Score không phải cứ có AI là làm được. Vì thuật toán của AI chỉ đưa ra kết quả chính xác khi dựa trên lượng data vừa lớn và tốt. AI nó học từ sample (mẫu) nên chạy trên data sai sẽ cho ra kết quả sai, chạy trên data đúng sẽ cho kết quả đúng.

Khả năng quản lý dữ liệu khổng lồ và khả năng hiểu được dữ liệu cũng chính là 2 điều Minh tự tin nhất về nền tảng công nghệ ở YNG. Trong khi thị trường còn khá mới mẻ với Big Data thì YNG đã bắt đầu từ 2011. Chính việc đầu tư nghiêm túc từ sớm đã giúp SociaLift có data lớn, có quy trình để lọc được quality data, và có ứng dụng sâu ML và AI. Vì vậy, theo Minh lợi thế cạnh tranh của SociaLift chính là lợi thế của người đi đầu.

Còn AI hiện tại của SociaLift còn có thể đọc hình ảnh, biết được bao nhiêu người trong hình, bao nhiêu tuổi, có con hay chưa, có brand nào trong hình...chỉ chờ để đưa vào thực tế.

* Những lợi ích nào SociaLift sẽ cung cấp cho nhãn hàng trong năm tới?

Thầy Thơ: Recommendation system (Hệ thống đề xuất) và Planning complicated plan (Lên kế hoạch phức tạp). Khách hàng chỉ cần nhập ngân sách, ngành hàng, mục tiêu chiến dịch...hệ thống của SociaLift sẽ tự chạy ra 1 danh sách Influencer tối ưu, gợi ý thời điểm đăng tốt nhất, tự động lên lịch (auto-schedule) post đó, thậm chí đề xuất nội dung chia sẻ để có điểm Resonance tốt nhất. Đó là điều mà nhãn hàng sẽ được sử dụng vào 2020.

Đo lường và ứng dụng Resonance Score Minh chưa thấy ở nền tảng nào, dù là trên thế giới, nhưng đã được phát triển và sử dụng tại SociaLift.

Anh Minh: Dự án lớn nhất của team Minh hiện nay là xây dựng Intelligent Chatbot, một ứng dụng đỉnh cao của AI. Chatbot của SociaLift có thể hiểu cả một cuộc hội thoại dài bao gồm lịch sử nói chuyện trước đó, chứ không chỉ 1-2 câu như bây giờ. Khi người dùng nói ám chỉ 1 điều gì đó trong quá khứ, Chatbot này sẽ hiểu. Xa hơn một chút thì Chatbox này sẽ hiểu giọng nói trong các tin thoại.

Chatbot sẽ trở thành sản phẩm xu thế trong vòng 3 năm do với sự bùng nổ của E-commerce vốn đòi hỏi nhiều công nghệ trong khâu chăm sóc đối tác. Theo 1 khách hàng của YNG về vận hành xe thì một trong những trăn trở nhất của họ chính là giải quyết 1 lượng lớn tin nhắn từ hàng ngàn tài xế gửi đến liên tiếp mà không có 1 tổng đài nào làm xuể, tất yếu phải sử dụng Chatbot.

Có nhiều thứ YNG rất muốn làm, nhưng không thể làm một mình, mà cần nhiều bạn trẻ chung sức với team R&D để cùng phát triển.

* Môi trường làm việc ở team R&D của YNG như thế nào?

Thầy Thơ: YNG là nơi làm ML và AI nghiêm túc, hướng đến sản phẩm và làm ra được sản phẩm. Đây là điểm khác biệt của YNG. Vì vậy kỹ năng ML của các bạn sẽ được phát triển cả về học thuật và ứng dụng thực tế, giúp CV của các bạn đẹp hơn và dễ dàng tìm học bổng học cao hơn. Gần 50% các bạn trong YNG sau 1 thời gian làm ở đây đã có học bổng về ML ở Mỹ, Singapore hoặc châu Âu, chính thầy Thơ và Minh sẽ viết thư giới thiệu cho các bạn. Hiện có nhiều dự án lớn như Intelligent Chatbot và AI Formatic đang chờ các bạn cùng tham gia.

R&D team YouNet Group: “AI và Machine Learning phát hiện 98% hồ sơ Influencers Việt Nam không đạt chuẩn của SociaLift”

YNG là nơi làm ML và AI nghiêm túc, kiến thức và kỹ năng về ML của các bạn sẽ được phát triển cả về học thuật và ứng dụng thực tế, dễ dàng tìm học bổng học cao hơn.

Anh Minh: Một trong những điểm thú vị nhất của team R&D ở YNG là được sử dụng những công nghệ hàng đầu, thế giới dùng cái gì thì mình sẽ được dùng cái đó. Đồng thời các bạn sẽ được làm full stack, end-to-end, được thấy kết quả mình làm trong thực tế.

Ví dụ như khi lọc Influencer thì các bạn sẽ nhìn thấy ngay những bạn Influencer đang nổi. Những điều này sẽ giúp các bạn có cái nhìn thực tế và trải nghiệm gần nhất với thế giới, nên sau này muốn đi bất kỳ đâu để làm việc đều được.

Trong một môi trường mà các CEO sẵn sàng take risk (chấp nhận thách thức) và thật sự nghiêm túc với ML & AI như tại YNG thì các bạn chắc chắn sẽ phát triển, giống như Minh và SociaLift ngày hôm nay.

* Cảm ơn thầy Thơ và Minh vì buổi chia sẻ thú vị! Chúc SociaLift và YNG sẽ tiếp tục phát triển và mang lại nhiều lợi ích cho đối tác.

SociaLift là nền tảng dữ liệu Influencer lớn nhất Việt Nam với hơn 10.000 Influencers trên 50 ngành hàng và 70 nghề nghiệp, lĩnh vực. Được kế thừa từ thành công của social listening về công nghệ thu thập dữ liệu, cũng như kinh nghiệm nhiều năm về phân tích, đánh giá, đo lường insight người dùng, ngành hàng & truyền thông từ Social data của YouNet Group (với YouNet Media và Buzzmetrics), SociaLift hướng đến cung cấp giá trị hữu ích thực sự cho nhãn hàng trong việc lên kế hoạch và thực hiện các chiến dịch influencer marketing nhanh chóng và hiệu quả. Thông tin thêm tại: https://socialift.asia

Hoàng Trâm
Nguồn PV