Chiến lược xây dựng nhóm phân tích dữ liệu trong doanh nghiệp (P1)
Ngày nay, khi ngày càng nhiều doanh nghiệp nhận ra “sức mạnh” của dữ liệu trong việc đạt được các mục tiêu kinh doanh, hầu hết đều hy vọng có thể tận dụng dữ liệu trong chiến lược kinh doanh và sản phẩm của họ.
Điều này đòi hỏi phải tập hợp một đội nhóm xử lý dữ liệu mạnh mẽ có thể truyền tải một cách hiệu quả và chi tiết theo các khía cạnh khác nhau của doanh nghiệp. Để đi theo hướng “data-driven”, các công ty cần xây dựng 3 năng lực bao gồm: chiến lược dữ liệu, quản trị dữ liệu và phân tích dữ liệu.
Định nghĩa về 3 yếu tố mà doanh nghiệp cần có
- Chiến lược: Chiến lược dữ liệu là lộ trình mà doanh nghiệp tận dụng dữ liệu để đạt được mục tiêu. Chiến lược này đòi hỏi sự hiểu biết rõ ràng về nhu cầu dữ liệu vốn có đối với chiến lược kinh doanh. Vậy câu hỏi đặt ra là tại sao bạn thu thập dữ liệu? Bạn đang cố gắng kiếm tiền, tiết kiệm tiền, quản trị rủi ro, mang lại trải nghiệm khách hàng đặc biệt hay hướng đến tất cả những điều trên?
- Quản trị: Quản trị dữ liệu là một tập hợp các quy trình, vai trò, chính sách, tiêu chuẩn và số liệu nhằm đảm bảo sử dụng hiệu quả thông tin để giúp doanh nghiệp đạt được các mục tiêu của mình. Một chiến lược quản trị dữ liệu được xây dựng tốt sẽ đảm bảo rằng dữ liệu được sử dụng là đáng tin cậy, chính xác và luôn luôn có sẵn.
- Phân tích: Thuật ngữ phân tích dữ liệu liên quan đến quá trình phân tích dữ liệu thô nhằm đưa ra kết luận về thông tin từ đó mang đến những cải thiện tốt hơn. Thông thường, những người liên quan đến phân tích dữ liệu trong doanh nghiệp thường là kỹ sư dữ liệu, nhà phân tích dữ liệu và nhà khoa học dữ liệu.
Khả năng tận dụng dữ liệu của bạn sẽ phụ thuộc vào 3 yếu tố cốt lõi trên. Khi xây dựng một nhóm phân tích dữ liệu, những người đứng đầu thường phải đối mặt với những câu hỏi sau:
- Nên xây dựng quy mô đội ngũ như thế nào?
- Có bao nhiêu kỹ sư dữ liệu, nhà phân tích dữ liệu, nhà khoa học dữ liệu?
- Làm thế nào để nhóm phân tích tương tác với các bộ phận còn lại của doanh nghiệp?
- Cấu trúc cho nhóm phân tích dữ liệu như thế nào? Cấu trúc quản lý tập trung hay kết hợp với các bộ phận khác?
Định vị doanh nghiệp trong hành trình dữ liệu
Trước khi xây dựng nhóm dữ liệu, điều quan trọng là bạn phải biết mình đang ở đâu trong “hành trình dữ liệu”, vì điều này sẽ ảnh hưởng trực tiếp đến cấu trúc của nhóm. Doanh nghiệp của bạn có thể lớn mạnh, doanh thu tăng trưởng khá ổn định, tuy vậy xét về góc độ dữ liệu có thể vẫn chưa được tận dụng triệt để.
Data Maturity là một hành trình hướng đến việc nhận ra giá trị hữu hình từ Data Assets. ANATICS đề xuất một khuôn khổ đơn giản khi đánh giá Data Maturity, nơi đo lường khả năng hiểu biết về quá khứ, nắm bắt hiện tại và dự đoán tương lai của bạn.
Thành thạo dữ liệu là hành trình hướng tới việc nhìn thấy giá trị hữu hình từ dữ liệu của bạn. Trong hầu hết các công ty, mỗi bộ phận đều có bộ KPI riêng để hỗ trợ việc thực hiện chiến lược của công ty. Nhưng chỉ xác định chúng thôi là chưa đủ, KPI cần được theo dõi rõ ràng và bạn cũng phải có khả năng dự đoán kết quả trong tương lai dựa trên các KPI này. Khả năng này đến từ các kiến thức về tình hình hiện tại bạn đang sở hữu, và sự hiểu biết sâu sắc về dữ liệu quá khứ.
Xem xét một số ví dụ dưới đây:
- Marketing ROI: Xác định ROI thông qua nhiều kênh bằng cách sử dụng mô hình phân bổ đã xác định. Sau đó, hiểu sự phát triển của hoạt động phân bổ trong 12 tháng trước đó (hiểu được dữ liệu quá khứ) và đặc biệt là các yếu tố tạo ra sự phân bổ đó (chẳng hạn như xác định các kênh hoạt động, thời gian trong năm, sản phẩm...). Sau đó thực hiện theo dõi sự phát triển hàng ngày, hàng tuần, hàng tháng nhờ vào một công cụ báo cáo mà bạn tin tưởng (nắm được tình hình hiện tại); và dự báo ngân sách marketing của bạn dựa trên các mô hình dự đoán này (dự đoán cho tương lai).
- Sự hài lòng của khách hàng: Xác định thước đo mức độ hài lòng của khách hàng. Bạn nên tính toán sự phát triển của thông tin này trong 12 tháng trước, tìm hiểu các yếu tố tác động tạo nên sự tăng trưởng đó (quá khứ). Sau đó theo dõi mức độ hài lòng của khách hàng hàng ngày bằng các bảng tổng hợp báo cáo đáng tin cậy. Xác định hành động cần thực hiện ngay từ hôm nay để gia tăng sự hài lòng. Sự hiểu biết của bạn về quá khứ và trạng thái hiện tại về sự hài lòng của khách hàng sẽ cho phép dự đoán tỷ lệ khách hàng rời bỏ thương hiệu một cách hiệu quả (tương lai).
- Phân tích mô tả: Sự hiểu biết của bạn về quá khứ và hiện tại thường có được qua việc thực hiện phân tích/thống kê mô tả. Phân tích mô tả giúp tổ chức hiểu được hiệu quả hoạt động của mình bằng cách cung cấp ngữ cảnh giúp các bên liên quan mật thiết diễn giải thông tin. Ngữ cảnh này thường tồn tại ở dạng trực quan hoá dữ liệu, bao gồm đồ thị, trang báo cáo tổng hợp, báo cáo Ad Hoc đơn lẻ và biểu đồ. Khi đang phân tích dữ liệu để dự báo tương lai, bạn đang thực hiện phân tích dự đoán. Phân tích dự đoán là lấy dữ liệu lịch sử, đưa dữ liệu đó vào một mô hình machine learning để xem xét các mẫu chính. Áp dụng mô hình này cho dữ liệu hiện tại và kỳ vọng sẽ hỗ trợ dự báo trong tương lai.
Nhân sự “chủ chốt” trong nhóm phân tích dữ liệu
Nhóm phân tích dữ liệu thường bao gồm:
- Kỹ sư dữ liệu: Chịu trách nhiệm thiết kế, xây dựng và duy trì các tập dữ liệu có thể được tận dụng trong các dự án dữ liệu. Do đó, các kỹ sư dữ liệu thường làm việc chặt chẽ với cả nhà khoa học dữ liệu và nhà phân tích dữ liệu.
- Nhà khoa học dữ liệu: Sử dụng toán học và thống kê cao cấp cũng như các công cụ lập trình để xây dựng các mô hình dự đoán. Vai trò của nhà khoa học dữ liệu và nhà phân tích dữ liệu khá giống nhau, nhưng các nhà khoa học dữ liệu tập trung nhiều vào phân tích dự đoán hơn là phân tích mô tả.
- Nhà phân tích dữ liệu: Sử dụng dữ liệu để thực hiện báo cáo và phân tích trực tiếp. Trong khi các nhà khoa học và kỹ sư dữ liệu thường tương tác với dữ liệu thô, thì các nhà phân tích làm việc với dữ liệu đã được sàng lọc và chuyển đổi thành các định dạng thân thiện với người dùng hơn.
- Chuyên viên phân tích kinh doanh (Business Analyst – BA)/ Chuyên viên vận hành (Ops Analyst – OA): Tổ chức cải tiến các quy trình và hệ thống của doanh nghiệp. Tập trung vào việc thiết kế các bảng báo cáo tổng hợp giúp trả lời các câu hỏi kinh doanh và đề xuất giải pháp mới. Đối tượng này thường có sự nhanh nhạy và vạch ra ranh giới giữa CNTT – doanh nghiệp để thu hẹp khoảng cách nhằm nâng cao hiệu quả. BA/OA thường xuyên có một lĩnh vực kinh doanh cụ thể như marketing hoặc tài chính và khả năng hiểu biết về SQL của họ có thể bao gồm tổng quan cơ bản đến phân tích nâng cao.
- Trưởng bộ phận phân tích dữ liệu: Cung cấp giám sát chiến lược cho nhóm dữ liệu. Mục tiêu của họ là tạo ra một môi trường cho phép tất cả các bên khác nhau truy cập dữ liệu họ cần một cách dễ dàng, xây dựng các kỹ năng của doanh nghiệp để rút ra những thông tin giúp ích được cho kinh doanh từ dữ liệu và đảm bảo quản trị dữ liệu. Họ cũng đóng vai trò là cầu nối giữa nhóm dữ liệu và đơn vị kinh doanh chính, vai trò này cần một người có tầm nhìn xa để dẫn dắt đội kỹ thuật.
Quy mô của đội ngũ phân tích dữ liệu
Các công ty khác nhau sẽ xây dựng các nhóm dữ liệu có quy mô khác nhau và tất nhiên sẽ không có quy mô nào phù hợp với tất cả. ANATICS đã nghiên cứu cấu trúc của nhóm dữ liệu của hơn 300 công ty, với phạm vi 300-1.000 nhân viên và rút ra những thông tin chi tiết sau:
- Như một quy định chung, nên đặt mục tiêu có tổng số 5-10% nhân viên hiểu biết về phân tích dữ liệu trong công ty của bạn.
- Những nhân viên đầu tiên của nhóm dữ liệu hoàn toàn mới thường là kỹ sư dữ liệu và nhà phân tích dữ liệu. Chỉ với 2 vai trò này, các tổ chức đã có thể tham gia vào một số phân tích mô tả cơ bản. Khi xây dựng một nhóm lớn hơn, hãy suy nghĩ về bộ kỹ năng bạn cần. Một dự án dữ liệu điển hình yêu cầu các kỹ năng sau: cơ sở dữ liệu, phát triển phần mềm, machine learning, trực quan hoá, cộng tác và kỹ năng giao tiếp. Rất hiếm để tìm thấy những cá nhân sở hữu tất cả các kỹ năng này. Do đó, bạn nên biết mỗi ứng viên sở hữu kỹ năng nào bạn đặt ra để tuyển dụng hợp lý.
- Quy mô nhóm phân tích dữ liệu của bạn sẽ được định hướng bằng số lượng các báo cáo vấn đề kinh doanh và mức độ phức tạp của các vấn đề nghiêm trọng nhất. Xem xét quy mô lộ trình của bạn và xác định bạn cần bao nhiêu người để hoàn thành các dự án dữ liệu của mình trong một khoảng thời gian hợp lý. Nếu bạn nhận thấy nhóm dữ liệu của mình sẽ mất hơn một năm để hoàn thành các dự án, thì có lẽ đã đến lúc mở rộng nhóm. ANATICS khuyến khích bạn nên suy nghĩ về kế hoạch phân chia tỷ lệ giữa hoạt động dự án hằng ngày và hoạt động xây dựng mở rộng của nhóm. Nhóm phân tích dữ liệu của bạn nên tập trung vào công việc vận hành hằng ngày 2/3 thời gian và xây dựng cho tương lai khoảng 1/3 thời gian còn lại. Nếu nhóm phân tích dữ liệu của bạn dành toàn bộ thời gian để tập trung vào các nhu cầu hàng ngày, bạn đang gây nguy hiểm cho tương lai của công ty mình và có lẽ đã đến lúc phải mở rộng nhóm.
- Điều cuối cùng mà bạn cần cân nhắc đó là việc tuyển dụng nhân sự cho các dự án đòi hỏi chuyên môn cao. Ví dụ như bạn đang có 1 dự án về điều tra gian lận của Fintech, bạn nên tuyển những người có kiến thức chuyên sâu về ngành mà dự án của bạn đang cần.
* Nguồn: Towards Data Science