Nâng tầm năng lực dữ liệu cho tổ chức với mô hình IPTOP
Gần đây, báo chí liên tục cập nhật tin tức về việc nhiều công ty ứng dụng khoa học dữ liệu để biến điều không thể trước đây thành có thể như chế tạo ô tô tự lái, siêu máy tính “hạ gục” cao thủ cờ vây… Qua đó, cuộc cách mạng khoa học dữ liệu phần nào được hé lộ. Và điểm chung là phần lớn các công ty đều cố gắng nâng cao năng lực Data Fluency.
Theo ông Ramnath Vaidyanathan – Phó Giám đốc Nghiên cứu Sản phẩm tại DataCamp, con đường dẫn đến Data Fluency của một tổ chức phụ thuộc vào 5 yếu tố chính: Cơ sở hạ tầng, con người, công cụ, tổ chức và quy trình (viết tắt là IPTOP).
Mô hình này giúp nâng cao mức độ trưởng thành về dữ liệu (Data Maturity) của doanh nghiệp từ Data Reactive đến Data Scaling, Data Progressing và Data Fluency.
Data Reactive: Xây dựng văn hoá dữ liệu để tiến lên Data Scaling
Data Reactive là cấp độ đầu tiên trong thang đo mức trưởng thành dữ liệu. Ở giai đoạn này, các công ty hiếm khi truy cập và sử dụng dữ liệu, dẫn đến việc chưa hình thành văn hoá sử dụng dữ liệu (Data Culture). Quá trình thu thập và xử lý data của tổ chức cũng rời rạc. Và đội ngũ lãnh đạo cũng chưa đầu tư vào việc nâng cấp năng lực dữ liệu cho nhân viên hay xây dựng cơ sở hạ tầng (Data Infrastructure).
Thế nên, để nâng cấp từ Data Reactive lên Data Scaling, xây dựng văn hoá và cơ sở hạ tầng dữ liệu là mục tiêu hàng đầu. Công ty có thể bắt đầu bằng cách đặt ra những mục tiêu dễ thực hiện để các phòng ban liên quan thấy được tầm quan trọng của việc “đọc thông hiểu thạo” dữ liệu. Chẳng hạn, tạo ra dashboard thử nghiệm và các dự án đòi hỏi khả năng phân tích dữ liệu như đánh giá tỷ lệ khách hàng rời đi. Song song đó, doanh nghiệp cần phát triển cấu trúc dữ liệu (Data Architecture) và chuẩn hoá quy trình thu thập dữ liệu.
Data Scaling: Nâng cấp lên Data Progressive với cơ sở hạ tầng dữ liệu và mô hình tổ chức phù hợp
Ở mức độ Data Scaling, doanh nghiệp đã có văn hoá và chiến lược dữ liệu, tuy nhiên các yếu tố này vẫn chưa được xác định rõ ràng. Tỷ lệ nhân viên có các kỹ năng, kiến thức cần thiết liên quan đến dữ liệu còn thấp, khiến văn hoá dữ liệu chưa mạnh mẽ. Công ty cũng thiếu hụt kho lưu trữ và quản lý dữ liệu tập trung, dẫn đến việc gặp nhiều vấn đề về xử lý dữ liệu trong doanh nghiệp.
Chính vì vậy, doanh nghiệp cần tăng cường kiến thức về dữ liệu cho tổ chức. Doanh nghiệp cần tạo điều kiện để nhân viên truy cập vào kho dữ liệu bằng cách phát triển cơ sở hạ tầng và xây dựng kho lưu trữ tập trung. Ví dụ, việc lưu dữ liệu tập trung trên đám mây giúp việc truy cập dễ dàng hơn.
Nhờ kho lưu trữ và quyền truy cập phù hợp, nhân viên có thể phát triển các tiêu chuẩn chất lượng dữ liệu. Chẳng hạn, DataCamp lưu trữ dữ liệu trên Amazon Redshift (kho dữ liệu tập trung trên nền tảng đám mây) và quản lý hệ thống dữ liệu với Apache Airflow. Điều này giúp DataCamp giảm rào cản mà data silos thường gặp phải.
Ngoài ra, công ty cần triển khai mô hình tổ chức rõ ràng cho đội ngũ Data Scientist. Một số doanh nghiệp lựa chọn mô hình tập trung như Center of Excellence – nơi team sẽ tiếp nhận xử lý yêu cầu từ các bộ phận khác như tài chính, marketing, kỹ thuật. Một số doanh nghiệp khác chọn mô hình phi tập trung, trong đó, Data Scientist tham gia vào từng phòng ban và giải quyết nhu cầu của phòng ban đó. Vậy, tuỳ vào khả năng dữ liệu và mục tiêu kinh doanh mà công ty có lựa chọn phù hợp.
Data Progressive: “Thăng hạng” lên Data Fluency với công cụ và quy trình tiên tiến
Trong giai đoạn Data Progressive, mỗi team có ít nhất một nhân viên thông thạo dữ liệu để có thể phân tích, báo cáo các vấn đề liên quan. Tuy nhiên, doanh nghiệp vẫn còn khả năng nâng cao chất lượng dữ liệu và hoàn thiện cơ sở hạ tầng. Nhân viên có kỹ năng cần thiết liên quan đến dữ liệu nhưng đa phần chỉ dừng lại ở việc báo cáo mà chưa tận dụng được tối đa sức mạnh của chúng. Các quy trình và công cụ để xử lý dữ liệu chưa được chuẩn hóa.
Vì vậy, để đạt được cấp độ data fluency, công ty nên cân nhắc phát triển đồng thời các yếu tố: cơ sở hạ tầng, con người, công cụ, tổ chức, quy trình theo mô hình IPTOP.
Công ty có thể củng cố văn hoá dữ liệu bằng cách tập trung đầu tư nâng cấp năng lực dữ liệu cho nhân viên. Quá trình đào tạo cần diễn ra liên tục, và điều chỉnh phù hợp với vai trò của từng cá nhân và mục tiêu kinh doanh của công ty. Chẳng hạn, công ty viễn thông Mỹ AT&T đầu tư khoảng 1 tỉ USD để nâng cao năng lực dữ liệu cho 140.000 nhân viên trong vòng 10 năm. Ngoài ra, công ty có thể thúc đẩy văn hoá dữ liệu bằng cách khuyến khích nhân viên đưa ra quyết định dựa trên dữ liệu và ghi nhận những người tích cực quảng bá văn hoá dữ liệu của tổ chức.
Bên cạnh đó, công ty nên tạo ra các sản phẩm dữ liệu nội bộ (Internal Data Product) để quản lý hệ thống dữ liệu. Những sản phẩm này có thể được dùng để cải thiện chất lượng dữ liệu và theo dõi quá trình thực thi mục tiêu kinh doanh. Ví dụ, DataCamp cũng tự phát triển mô hình nội bộ cho phép các bên liên quan trực quan hoá những chỉ số kinh doanh một cách dễ dàng hơn.
Khi trình độ dữ liệu của nhân viên tiến bộ, công ty có xu hướng chuyển sang mô hình hybrid – kết hợp team Data Scientist với các bộ phận khác. Mô hình này tạo cơ hội cho đội ngũ Data Scientist xây dựng và chia sẻ công cụ phù hợp hơn với mục tiêu của từng bộ phận.
Hơn nữa, để đạt được mức độ Data Fluency, dữ liệu phải được tích hợp trong mọi hoạt động kinh doanh. Điều này giúp việc khai thác dữ liệu trở nên dễ dàng hơn và tính dân chủ hoá dữ liệu gia tăng. Chẳng hạn, năm 2019, Airbnb ký Data Quality Initiative cam kết đảm bảo chất lượng dữ liệu trong toàn bộ doanh nghiệp. Quyết định này giúp tăng cường văn hoá dữ liệu và củng cố niềm tin của các bên liên quan đối với dữ liệu của Airbnb.
Đạt Data Fluency với mô hình IPTOP
Data Fluency là trạng thái lý tưởng về độ trưởng thành dữ liệu. Mọi nhân viên đều có kỹ năng truy cập và hiểu dữ liệu họ cần để hoàn tất công việc của mình. Cơ sở hạ tầng vững vàng cùng công cụ phù hợp giúp việc ra quyết định của họ trở nên liền mạch hơn. Thêm vào đó, quy trình xử lý dữ liệu và mô hình tổ chức cho phép các bộ phận linh hoạt phối hợp với nhau, giúp tối ưu hiệu quả công việc đạt được.
Có thể thấy, con đường dẫn đến Data Fluency không phải là một đường thẳng tuyến tính. Điều này đòi hỏi một chiến lược dữ liệu rõ ràng. Biểu đồ dưới đây tóm tắt các bước mà tổ chức cần thực hiện để nâng cấp mức độ trưởng thành dữ liệu.
Theo Thảo Nguyên / Brands Vietnam
* Nguồn: Datacamp