Đại diện từ DAZIKZAK: "Chúng tôi muốn 'dân chủ hóa' data cho mọi nhãn hàng, agency"

Ra đời hơn 2 năm trở lại đây, DAZIKZAK - công cụ Social Listening thuần Việt đầu tiên vận hành trong môi trường tiếng Việt do chính người Việt phát triển đã mang dịch vụ này đến gần hơn các doanh nghiệp (DN) đặc biệt là các DN Việt Nam có nhu cầu nắm bắt thị trường thông qua việc lắng nghe mạng xã hội.

Brands Vietnam đã có buổi phỏng vấn bạn Phạm Nguyễn Phiên Phượng, thành viên kì cựu của DAZIKZAK và PGS.TS Lê Anh Cường, cố vấn chuyên môn của đội ngũ DAZIKZAK để tìm hiểu sâu hơn về câu chuyện ra đời cũng như những giá trị mà dịch vụ mới này mang đến cho các nhãn hàng, Agency và cộng đồng.

Công cụ Social Listening: Thế giới phổ biến, Việt Nam hững hờ

* Chào anh chị, mặc dù Social Listening có mặt tại Việt Nam khá lâu nhưng chưa có nhiều DN thực sự quan tâm đến dịch vụ này mà hầu hết chỉ tìm đến khi gặp khủng hoảng truyền thông. Theo anh chị, dự báo và ngăn ngừa khủng hoảng có phải là mục đích duy nhất của dịch vụ Social Listening?

Phiên Phượng: Thực ra Social Listening có nhiều ứng dụng đa dạng như khám phá tâm tư người dùng, phân tích đối thủ cạnh tranh, tối ưu hóa chiến dịch, khống chế khủng hoảng,...

Đối với truyền thông cái quan trọng nhất là “gãi đúng chỗ ngứa”, nếu biết khách hàng muốn gì xử lý đúng chỗ đó thì kết quả sẽ rất tốt. Chính vì thế, Social Listening còn được xem là biến thể của công cụ Nghiên cứu thị trường truyền thống.

* Có thể nói Social Listening có nhiều giá trị, nhưng theo quan sát của tôi, DN tìm đến Social Listening chủ yếu khi có nhiều vấn đề về khủng hoảng. Chị có thể chia sẻ về mức độ quan tâm đến Social Listening trên thế giới và Việt Nam như thế nào?

Phiên Phượng: Trên thế giới các DN rất chú ý đến việc bảo vệ danh tiếng và hình ảnh thương hiệu nhưng ở Việt Nam vấn đề này còn chưa được quan tâm đúng mức. Tuy nhiên, hiện nay nhận thức này đang dần được nâng cao và DN Việt bắt đầu “để tâm” hơn đến khủng hoảng, lắng nghe nhiều hơn từ khách hàng và cộng đồng.

PGS.TS Lê Anh Cường: Thời đại bây giờ thay vì tìm đến từng khách hàng để khảo sát chúng ta có thể lấy ý kiến một cách tự nhiên thông qua mạng xã hội, diễn đàn chỉ bằng vài cú nhấp chuột. Như vậy, cách tiếp cận thủ công như trước kia sẽ không đáp ứng kịp tốc độ. Trong thời đại 4.0, khi mọi thứ “ảo hóa” thì cần một hệ thống tự động như Social Listening để đáp ứng mọi thứ tốt nhất, nhanh nhất, chính xác nhất.

* Ngoài lý do này, theo anh chị còn có những rào cản hay khó khăn nào khiến DN chưa chủ động sử dụng dịch vụ này?

Phiên Phượng: Ở đây còn có một số rào cản khác: Thứ nhất là độ chính xác của ngôn ngữ, thứ hai là sự chính xác của kiến thức và ngôn ngữ chuyên ngành. Nói về độ chính xác, ông bà ta thường nói “Phong ba bão táp không bằng ngữ pháp Việt Nam”. Tiếng Việt không những phức tạp mà còn nhiều biến thể nhập nhằng. Trên văn bản báo chí thì tiếng Việt rất chỉn chu, đúng ngữ pháp, chính tả, nhưng trên mạng xã hội lại là câu chuyện khác.

Gian nan “người dạy máy”...đọc hiểu

* Anh chị có thể chia sẻ cụ thể hơn về bất cập do biến thể tiếng Việt gây ra khi DN áp dụng dịch vụ Social Listening?

Phiên Phượng: Trên thế giới Social Listening hoạt động tốt vì sử dụng trên nền tảng tiếng Anh. Nhưng đối với tiếng Việt lại khác hoàn toàn vì ngữ pháp tiếng Việt phức tạp, chưa tính đến nhiều biến thể khác nhau.

Đơn cử là Google Translate. Ai cũng biết Google là AI phát triển nhất thế giới nhưng khi dùng để chuyển thể từ tiếng Việt sang tiếng Anh thì nghĩa lại chệch đi khá nhiều.

Vì vậy, để có bộ máy thấu hiểu được tiếng Việt thì rất khó, phải xây dựng trên môi trường hoàn toàn bằng tiếng Việt thì máy mới có thể học được. Điều này cũng tương tự như quá trình dạy một em bé học nói, học viết, học đọc.

Hiện tại, DAZIKZAK đã thành công khi tạo ra môi trường chỉ có tiếng Việt. Đối với tiếng Anh kiểu “bồi” mà người Việt hay dùng trong giao tiếp thì chúng tôi xem nó như từ tiếng Việt và dạy cho máy học.

* Ngoài khó khăn trong việc “Việt hóa” ngôn ngữ thì việc chuyên biệt hóa, chuyên sâu hóa cho từng ngành hàng phải chăng cũng là một thách thức?

Phiên Phượng: Đó đúng là 1 khó khăn rất lớn. Một ví dụ đơn giản: nghe các mẹ bỉm sữa ngồi nói chuyện với nhau sẽ khác với nghe các ông bố yêu xe nói chuyện với nhau. Hay như mấy anh chàng sở hữu xe hơi thì hay gọi xe của mình là "vợ hai", điện thoại thì là “dế yêu”. Mình phải hiểu đó là chiếc xe, điện thoại,... chứ không thể áp dụng 1 cách hiểu chung vào để hiểu là cô tình nhân, hay một loại côn trùng nào khác.

* DAZIKZAK đã giải quyết vấn đề này và có những ứng dụng mới để đáp ứng nhu cầu NTD như thế nào?

Phiên Phượng: Để giải quyết bài toán này, chúng tôi quyết định tham vấn anh Cường và được tư vấn chia mỗi ngành hàng là 1 cơ sở dữ liệu khác nhau bởi mỗi ngành có phương pháp tiếp cận riêng.

PGS.TS Lê Anh Cường: Nếu nghĩ hệ thống đơn giản mà phát triển một phương pháp chung cho tất cả mọi thứ thì không bao giờ tạo ra hệ thống đáp ứng nhu cầu toàn bộ người dùng. Muốn chất lượng tốt, đạt mức hiệu quả cao thì phải tạo ra hệ thống riêng cho từng miền dữ liệu riêng thì mới có được chất lượng tốt cho khách hàng.

Đại diện từ DAZIKZAK: Chúng tôi muốn dân chủ hóa data cho mọi nhãn hàng, agency

"Xây dựng bộ máy thấu hiểu được tiếng Việt thì rất khó, tương tự như quá trình dạy một em bé học nói, học viết, học đọc", Phiên Phượng chia sẻ. Ảnh: DAZIKZAK.

* Cá nhân hóa, địa phương hóa, chuyên biệt hóa là điều DN nào cũng mong muốn nhưng để làm được từng nội dung cho từng ngành hàng trong môi trường tiếng Việt phức tạp thì hẳn không phải là chuyện dễ dàng mà có thể nói là điều phi thường.

Phiên Phượng: Đúng như chị nói đó là thử thách rất lớn, chúng tôi gặp rất nhiều khó khăn: khó khăn về kiến thức, kĩ thuật, đặc biệt khó khăn về thị trường.

Về kiến thức, ban đầu nhóm DAZIKZAK nghĩ rất đơn giản khi dùng từ khóa (key word) và quy luật (rule) để phân tích nhưng sau đó thất bại.

* Những thất bại các bạn đã trải qua cụ thể là gì?

Phiên Phượng: Độ chính xác của hệ thống rất thấp. Lúc đó chúng tôi rất nản, nghĩ rằng sẽ bỏ cuộc. Nhưng sau khi nhận sự động viên và gợi ý của chị trưởng nhóm về việc thử áp dụng Xử lý ngôn ngữ tự nhiên (NLP - Natural Language Process), Học máy (Machine Learning), Khai phá dữ liệu (Data Mining),…vào hệ thống, cả nhóm như được khai sáng.

Chúng tôi quyết định bằng mọi cách phải tiếp cận tiến bộ công nghệ mới này để cải thiện hệ thống của mình… Sau đó chúng tôi may mắn được gặp gỡ thầy Cường và nhờ thầy tham vấn.

PGS.TS Lê Anh Cường: Kỉ niệm đó rất thú vị. Tôi còn nhớ đầu năm 2016, khi được nhóm mời đến để tư vấn về hệ thống, tôi thấy nhóm vô cùng dũng cảm vì các bạn gần như không có kiến thức sâu về ngành này, đặc biệt là Trí tuệ nhân tạo (cười).

Nếu dùng quy luật căn bản thì sẽ không giải quyết được vấn đề vì bản chất ngôn ngữ là nhập nhằng. Thế nên cần có phương pháp hiện đại hơn và chuyên sâu hơn về mặt kĩ thuật. Bên cạnh đó, tôi tư vấn xây dựng lại đội ngũ, chọn những bạn lập trình giỏi và hiểu biết về Trí tuệ nhân tạo, từ đó mới đủ sức tiếp cận giải pháp xử lý bài toán này.

Đại diện từ DAZIKZAK: Chúng tôi muốn dân chủ hóa data cho mọi nhãn hàng, agency

PGS.TS Lê Anh Cường cùng Phiên Phượng chia sẻ về những khó khăn trong thời gian đầu hợp tác xây dựng hệ thống DAZIKZAK. Ảnh: Brands Vietnam.

* Bản chất ngôn ngữ là đa nghĩa, mỗi người hiểu một cách khác nhau. Huống hồ trong những ngành khác nhau, muốn hiểu được chính xác, rõ ràng đòi hòi chuyên môn cao, hiểu biết sâu và cả kinh nghiệm thực tế về ngành. Vì vậy người lập trình cũng phải hiểu sâu về ngành đó, vấn đề này các bạn giải quyết như thế nào?

Phiên Phượng: Chúng tôi tập trung vào tiếng Việt và chuyên ngành bằng cách phân hóa toàn bộ. Đối với tiếng Việt, DAZIKZAK có các bạn giỏi về ngữ pháp từ ĐH Sư phạm, ĐH Khoa học Xã hội và Nhân văn để tạo ra nền tảng vững chắc cho hệ thống.

Về chuyên ngành, để tối đa hóa độ chính xác, chúng tôi tìm các bạn làm dữ liệu huấn luyện cho từng ngành. Không thể có chuyện một bạn không hiểu về ngành xe hơi mà làm dữ liệu huấn luyện cho ngành xe hơi được. Bên mảng bóng đá, xe máy chúng tôi cũng sẽ làm tương tự.

Đại diện từ DAZIKZAK: Chúng tôi muốn dân chủ hóa data cho mọi nhãn hàng, agency

Nền tảng vững chắc của DAZIKZAK được xây dựng dựa trên sự am hiểu tiếng Việt và kiến thức chuyên biệt cho từng ngành. Ảnh: DAZIKZAK

* Tuy nhiên cái mà tôi thật sự quan tâm là vấn đề truy xuất nguồn gốc. Khi môi trường online phát triển thì nhiều người nói rằng số liệu offline không chính xác bằng online nhưng trên thực tế ngay cả số liệu trên mạng cũng không hoàn toàn chính xác? Việc truy xuất nguồn gốc các bạn có cam kết thực hiện hay không?

Phiên Phượng: Cái thực ở đây là chúng tôi cung cấp cho khách hàng những cái chúng tôi phân tích được, không có sự khai khống mà là những dữ liệu chân thực. Mọi cử chỉ trên mạng xã hội sẽ được nắm bắt và dữ liệu được chuyển cho khách hàng để họ có cái nhìn tổng quan hơn.

Anh Cường: Khác với nhiều hệ thống đơn thuần cung cấp báo cáo về Social Listening trên thị trường, DAZIKZAK có thể chỉ ra lý do tại sao nhờ vào tính năng cho phép truy xuất toàn bộ dữ liệu gốc làm cơ sở để đưa ra quyết định.

Lấy sự chân thực của data làm tôn chỉ hoạt động

* Anh Cường có nhắc đến nhiều công nghệ, về thời đại 4.0, về tự động hóa. Vậy DAZIKZAK đã được phát triển dựa trên những tính năng công nghệ ưu việt gì?

PGS.TS Lê Anh Cường: Có 2 nền tảng cốt lõi trong hệ thống này: Xử lý ngôn ngữ tự nhiên NLP và Học máy (Machine Learning). Học máy đơn giản là nếu chúng ta muốn máy làm tự động thì phải dạy cho máy học. Ví dụ nếu đưa hệ thống đã được dạy quả táo hay quả cam, máy sẽ học được mô hình để lần tiếp theo có thể nhận biết quả táo, quả cam.

Lĩnh vực học máy là quá trình phát triển hàng trăm năm nay. Rất nhiều công nghệ phát triển lên. Làm việc với đội ngũ DAZIKZAK, tôi được yêu cầu làm sao tư vấn công nghệ phát triển mới nhất hiện tại, để tăng sức cạnh tranh các hệ thống với nhau.

Chúng tôi phải dựa trên lý thuyết và công nghệ trên thế giới. Sau khi nắm vấn đề, chúng tôi phải cải tiến, chứ không chỉ đơn thuần ứng dụng cái đã có sẵn. Đấy chính là sự khác biệt của hệ thống này so với hệ thống khác. Chính vì sở hữu công nghệ riêng, tôi tin hệ thống này sẽ thành công.

Phiên Phượng: Công nghệ sinh ra để phục vụ cho con người. Nhóm luôn muốn tối ưu hóa công nghệ, tự động, chính xác và không phụ thuộc vào con người.

* Với những lợi ích và tính ưu việt vừa chia sẻ, anh chị thấy DAZIKZAK đang được đón nhận thế nào trên thị trường và những giá trị thực sự nào mang lại cho DN?

Phiên Phượng: Hiện tại DAZIKZAK phục vụ cho một số khách hàng là agency và nhãn hàng xe hơi. Khách hàng cảm thấy DAZIKZAK rất phù hợp cho công việc kinh doanh của họ, giúp họ nắm bắt được vấn đề nhanh chóng, chính xác. DAZIKZAK hiện tại đang được đón nhận rất nhiều trên thị trường.

Về giá trị, nhóm DAZIKZAK không chỉ muốn cung cấp những report chung chung mà muốn khách hàng có thể tiếp cận, tìm hiểu những vấn đề cụ thể, chi tiết, chính xác trên mạng xã hội. Đó là những giá trị to lớn mà DAZIKZAK mong muốn đem đến cho khách hàng khi sử dụng dịch vụ.

Đại diện từ DAZIKZAK: Chúng tôi muốn dân chủ hóa data cho mọi nhãn hàng, agency

Toyota, thương hiệu xe hơi Nhật luôn đề cao tính chân thực trong kinh doanh là một trong những khách hàng đầu tiên và hiện đang sử dụng DAZIKZAK. Ảnh: DAZIKZAK.

* Sau bao nhiêu nỗ lực cho sự ra đời và phát triển DAZIKZAK, các bạn có muốn bày tỏ sự chia sẻ nào với cộng đồng và người dùng tương lai của DAZIKZAK?

Phiên Phượng: DAZIKZAK đang phục vụ cho nhãn hàng, agency, và những broker cần nắm bắt thị trường và mong muốn những giá trị đích thực. Những khách hàng của DAZIKZAK là những khách hàng Nhật đề cao tính chính trực. Ví dụ Toyota đề cao giá trị chân thực và coi đó là điều thiết yếu trong kinh doanh. DAZIKZAK cũng xem đó là một tôn chỉ để đem lại giá trị của mình cho khách hàng.

*Cám ơn anh chị đã tham gia buổi trò chuyện ngày hôm nay và chúc cho DAZIKZAK sẽ mang lại làn gió mới cho sự phát triển của thị trường Social Listening tại Việt Nam, trở thành công cụ thiết yếu cho DN trong việc xây dựng, phát triển và bảo vệ thương hiệu ngay từ đầu!

Xem toàn bộ video Phỏng Vấn DAZIKZAK tại đây:

Khám phá hành trình lắng nghe cảm xúc mạng xã hội của DAZIKZAK tại https://dazikzak.com.

Nguồn PV