Machine Learning và AI: Ứng dụng vào SEO như thế nào?
Machine Learning (học máy) và AI (trí tuệ nhân tạo) khác nhau như thế nào? Những khái niệm này có thực sự giúp ích cho các chuyên gia SEO không? Đây là 2 câu hỏi mà rất nhiều người làm SEO đặt ra và chưa có câu trả lời thỏa đáng. Dan Fagella sẽ giải đáp câu hỏi này cho bạn.
Những độc giả thường hay hỏi Dan Fagella thông tin về học máy (ML) trong công cụ tìm kiếm, sau khi ông ta viết bài “Cách hoạt động của Machine Learning trong tìm kiếm” cách đây không lâu.
Bài viết này giúp bạn tìm hiểu cách triển khai tìm kiếm theo quan điểm của chuyên gia machine learning. Ngoài ra, còn định nghĩa và mở rộng một số khái niệm cốt lõi được thảo luận trong một cuộc phỏng vấn của cộng tác viên của Search Engine Journal với Jason Barnard và Dan Fagella của công ty Emerj.
Hơn nữa, Fagella đã nói chuyện với LHQ về các vấn đề một cách rõ ràng. Chưa kể, Emerj là một công ty nghiên cứu Trí tuệ Nhân tạo (AI) giúp các tổ chức sử dụng AI để:
- Gia tăng lợi thế chiến lược.
- Thông báo cho họ về cách chọn các dự án AI có ROI cao.
- Hỗ trợ các sáng kiến AI chiến lược.
Có một cuộc phỏng vấn video giữa người phỏng vấn tuyệt vời và một độc giả, người đang điều hành một công ty giúp các công ty khác kiếm tiền từ AI.
(Các công ty như Google, Bing, Amazon, Facebook,…)
Trước khi bắt đầu, bạn có thể xem video đầu tiên hoặc bạn có thể xem video ở phần cuối.
Đây là video chứa đầy thông tin thú vị, một số câu chuyện hài hước và một người có tên tuổi.…
1. Phỏng vấn: Machine Learning và AI trong tìm kiếm
Định dạng bài viết
Bài báo này được viết theo trình tự của cuộc phỏng vấn, thảo luận về những điểm cụ thể khi chúng đã được thảo luận.
Bài viết này sẽ xem xét các trích dẫn – phiên bản “cleaned up” về những gì đã nói trong cuộc phỏng vấn.
Câu hỏi nhanh với người phỏng vấn
Barnard bắt đầu cuộc phỏng vấn của mình bằng cách tuyên bố về machine learning. Ông ta nói: “Đó chỉ là một trong hàng nghìn, hàng trăm nghìn cách sử dụng AI và nó không phải là thứ thú vị nhất.”
Có một số cách sử dụng machine leaning thú vị. Chẳng hạn như tìm kiếm sự sống ngoài hành tinh, chữa khỏi bệnh … Đây chỉ là những điều tốt đẹp giả tưởng mà thôi.
2. Điểm khác biệt giữa Machine Learning và AI là gì?
Hãy cùng Fangella tìm hiểu cách phân biệt Machine Learning và AI
Theo Dan Fagella:
“AI khái niệm của nó rộng hơn Machine Learning .
Vì vậy, ML được xem là tập hợp con của AI.
Trí tuệ nhân tạo là bất cứ lúc nào chúng ta có cũng thể yêu cầu một máy tính làm điều gì đó mà không cần con người làm.
Rất phù hợp, rất khó để xác định bởi vì ngay sau khi chúng tôi hiểu nó, chúng tôi sẽ không gọi nó là AI nữa.”
Tóm lại, chúng ta nhận ra AI khi chúng ta thấy máy tính làm những công việc như con người mà thông thường những việc đó đòi hỏi sự linh hoạt của bộ não con người.
Hơn nữa, Machine Learning chỉ là một phần trong đó, được minh họa bằng:
Minh họa mối quan hệ giữa Machine Learning và AI
Theo trang web Emerj, họ đã định nghĩa lại khái niệm của Machine Learning và AI.
Trí tuệ nhân tạo (AI) là gì?
“Trí tuệ nhân tạo là một thực thể (hoặc tập hợp các thực thể cùng nhau hợp tác) nhận nguồn đầu vào từ môi trường, diễn giải và học hỏi từ các đầu vào đó. Đồng thời, thể hiện các hành vi, hành động liên quan và linh hoạt giúp thực thể đạt được một mục tiêu cụ thể trong một khoảng thời gian nhất định.”
Machine Learning là gì?
“Machine Learning là khoa học máy tính học giúp máy tính hoạt động giống như con người. Đồng thời, cải thiện việc học của chúng theo thời gian theo cách tự trị, bằng cách cung cấp cho chúng dữ liệu và thông tin dưới dạng quan sát và tương tác trong thế giới thực.”
Vì vậy, về cơ bản, AI bao gồm một loạt các hệ thống được thiết kế để thay thế con người hơn là Machine Learning, hoạt động theo một cách rất cụ thể. Nói chung, Machine Learning và AI tuy có điểm giống nhau nhưng cơ bản chúng vẫn có sự khác biệt.
3. Machine Learning đem lại lợi thế cho SEO không?
Trước khi đi sâu vào vấn đề này, chúng ta cần hiểu rõ bản chất Machine Learning có áp dụng trực tiếp vào SEO được không.
Không phải liệu bất kỳ công cụ SEO nào cũng có thể sử dụng được trong machine learning.
Khi tôi đang nghe cuộc phỏng vấn, bạn có thể tưởng tượng phản ứng của tôi khi Dan – một người mà tôi vô cùng kính trọng – đã vô cùng “sai lầm” khi nói rằng machine learning không phải là trò tiêu khiển hữu ích cho các chuyên gia SEO.
Hóa ra, anh ấy không sai.
Biết sử dụng machine learning không giúp bạn hiểu các tín hiệu xếp hạng. Nó chỉ đơn giản là giúp bạn hiểu hệ thống, trong đó các tín hiệu xếp hạng được cân nhắc và đo lường.
4. Đo lường AI hiệu quả
Vậy, hệ thống hoạt động như thế nào? Thành công được đo lường như thế nào?
Fagella thảo luận về một kịch bản như cách Microsoft Bing đưa công cụ tìm kiếm của họ vào Malaysia.
Lưu ý: Bootstrapping, trong ngữ cảnh này, đề cập đến việc thiết lập một hệ thống chứ không phải bắt đầu kinh doanh mà không có gì.
Nó cũng không phải là kỹ thuật khoa học dữ liệu để ước tính dựa trên các mẫu nhỏ hơn.
Anh ấy đề cập đến việc kéo một nhóm người bản ngữ làm nhóm đào tạo ban đầu.
Họ sẽ đánh giá kết quả mà hệ thống được thiết lập (có lẽ là trước khi hoạt động) và hệ thống sẽ học hỏi từ chúng, cũng như các kỹ sư.
Một khi hệ thống đạt yêu cầu – thường là điểm mà nó đơn giản là vượt trội so với các kết quả hiện có – nó sẽ được triển khai.
Và nhóm đào tạo được giảm xuống số lượng cần thiết để giữ cho hệ thống có hiệu lực và tiến bộ trong các lĩnh vực cụ thể.
Nếu thiếu một thuật ngữ tốt hơn, hãy gọi chúng là “Người đánh giá chất lượng (Quality Raters)”.
5. E-A-T trong Machine Learning
Barnard đưa ra một điểm quan trọng trong cuộc phỏng vấn để thu hút sự chú ý của độc giả.
Anh ta nói:
“Một ví dụ tuyệt vời là E-A-T hay chuyên môn, quyền hạn và sự tin tưởng.
Google nói, “Trang web này có thẩm quyền hay không? Là người hoặc chuyên gia của công ty và chúng ta có thể tin tưởng họ không? ”
Đó là phần quan trọng của Nguyên tắc đánh giá chất lượng (Quality Raters).
Vì vậy, không có cách nào thực sự để chúng tôi nói các yếu tố cụ thể là gì.
Nhưng chúng ta có thể cho rằng thuật toán đang được huấn luyện để tôn trọng phản hồi, từ người dùng cho đến tỷ lệ chất lượng (quality rates) của những gì họ cho là E-A-T.
Vì vậy, chúng tôi không biết các yếu tố xem xét ở đây là gì. Nhưng chúng tôi có thể nói rằng đây là những gì mọi người coi là E-A-T.
Và đó là những gì chúng tôi nên tập trung vào, bởi vì đó là nơi máy móc sẽ thu được kết quả.”
6. Thông tin cơ bản Machine Learning và hệ thống “Living breathing”
Khía cạnh quan trọng đến machine learning mà cũng là những gì Jason và Dan đề cập, chính là cách mà machine learning hoạt động.
Hay là mô hình giám sát, mô hình mà chúng ta cũng nên tìm hiểu và làm rõ.
Trong trường hợp này, hệ thống machine learning không chỉ đơn giản là một thuật toán tĩnh – được thiết lập và sau đó triển khai ở dạng cuối cùng.
Nhưng đúng hơn hệ thống đã được lập trình trước khi triển khai (ví dụ: trong giai đoạn khởi động được đề cập ở trên).
Sau đó, liên tục thiết lập để tự kiểm tra và điều chỉnh. Tiếp theo, thông qua so sánh với mục tiêu cuối cùng mong muốn và kết quả thành công, thất bại trước đó.
Ở phần đầu của một số phần giới thiệu machine learning của công cụ tìm kiếm, sẽ có một tập hợp bắt đầu các truy vấn và kết quả “known good”. Known good nghĩa là các truy vấn cho ra tập hợp kết quả đã làm hài lòng người dùng. Bên cạnh đó, các thuật toán sẽ được đào tạo về điều đó.
Sau đó, nó sẽ được đưa ra các truy vấn mà không có kết quả “known good” để tạo ra “phỏng đoán” của riêng nó.
Ngoài ra, tạo ra một điểm số thành công dựa trên “known good” sau đó được tiết lộ.
Hệ thống sẽ tiếp tục làm điều này, ngày càng tiến gần hơn đến mục tiêu.
Gắn giá trị cho độ chính xác của nó và điều chỉnh cho lần thử tiếp theo.
Cuối cùng, câu trả lời “known good” cần được loại sang một bên và hệ thống cần biết cách nhận ra điều tốt từ các tín hiệu bên ngoài và biến đó thành mục tiêu.
Ví dụ: chấm điểm của Người đánh giá chất lượng hoặc số lượng lớn người dùng tương tác với kết quả SERP.
Nếu người đánh giá chất lượng hoặc tín hiệu SERP chỉ ra kết quả không hoàn hảo, kết quả đó sẽ được đưa vào hệ thống và việc điều chỉnh trọng số tín hiệu được thực hiện – mặc dù có lẽ chỉ trên quy mô lớn.
Một tín hiệu tốt sẽ thông báo thành công nhanh hơn.
Cung cấp cho hệ thống một cookie, có thể nói như vậy.
Cookie trên hệ thống
7. Tín hiệu được lấy mẫu
Khi chúng ta nghĩ về các tín hiệu, chúng ta có xu hướng nghĩ đến các liên kết, anchors, HTTPS, tốc độ tải, tiêu đề,…
Trong cuộc phỏng vấn, Barnard và Fagella đưa ra một số ví dụ về tín hiệu bổ sung mà hầu hết chắc chắn được sử dụng trong một số truy vấn.
Những điều chúng ta cần lưu ý và sử dụng để truyền cảm hứng cho những ý tưởng khác (giống như Stevie vậy).
Các tín hiệu môi trường như:
- Các ngày trong tuần.
- Ngày trong tuần so với cuối tuần.
- Nghỉ lễ hay không.
- Các mùa.
- Địa lý và cách nó kết hợp với các tín hiệu khác.
- Thời tiết
Dan nhấn mạnh đưa ra điều gì đó giống như sự gia tăng đột biến trong các tìm kiếm xung quanh “chest pain” vào thứ Hai có thể kích hoạt khả năng hiển thị dữ liệu cấp 3. Chẳng hạn như mẹo nhận biết cơn đau tim, vào ngày hôm đó.
8. Mục tiêu của Google
Dan cũng đưa ra một điều thú vị để tất cả chúng ta cân nhắc:
“Thực tế của vấn đề là trọng số của những yếu tố đó luôn nghiêng và thay đổi dựa trên những gì Google muốn làm để có sự liên quan tốt hơn. Những gì Google muốn làm giảm khả năng ứng dụng gamification (game hóa) vào hệ thống của chúng tôi.
Họ muốn thay đổi các quy tắc của mình chỉ để đảm bảo rằng bạn không biết họ là gì.
Bây giờ, nếu họ có thể làm cả hai việc cùng một lúc thì chúng ta cứ thế mà tiếp tục làm.
Nhưng gần như chắc chắn rằng họ đang điều chỉnh cho cả hai mục đích đó.
Để ngăn chặn nó bị gamification và cũng để cải thiện mức độ liên quan mà họ luôn muốn làm cả hai. “
Các thay đổi đối với thuật toán được thực hiện chỉ nhằm mục đích loại bỏ các chuyên gia SEO khó tính.
9. Con người là nguồn đầu vào
Như đã đề cập ở trên, một người tên là Stevie.
Điều quan trọng cần nhớ là mặc dù không có ai tại Google quyết định cụ thể một cái gì đó như cơn mưa ở Boston sẽ dẫn đến việc tăng các yếu tố xếp hạng có lợi cho X. Tuy nhiên, có một người quyết định liệu thời tiết có nên được kiểm tra như một tín hiệu xếp hạng khả thi hay không và đã tìm ra cách để thiết lập các bài kiểm tra như vậy.
Như Dan đã nói:
“Google không phải là Chúa. Con người chỉ đơn giản nói: “Tập hợp dữ liệu này mà chúng tôi nghĩ có thể được sử dụng để thông báo cho danh mục tìm kiếm này trong khu vực địa lý này và bằng ngôn ngữ này.
Hãy tiếp tục và cho phép điều đó.
Sau đó, chúng ta hãy thu thập một số phản hồi từ nó và xem chúng ta có thể mở rộng việc sử dụng dữ liệu thời tiết sang các danh mục tìm kiếm khác hay không. Tiếp theo hãy xem xét hành vi người tiêu dùng.”
Cơ bản thì Stevie là người quyết định kiểm tra cái gì và kiểm tra nó như thế nào.
Anh ta huấn luyện 1 cái cỗ máy, tinh chỉnh và giám sát kết quả từ nó.
Sau khi hoàn tất và nếu thành công, họ có thể xem xét mở rộng sử dụng ban đầu nếu có, như Google đã làm với RankBrain. Google đã lấy nó từ các truy vấn chưa từng thấy trước đây.
10. Đầu vào của Google
Không chỉ có CTR hay bounce rate, mà chỉ đơn giản liệt kê “sự hài lòng của người dùng” không phải là một tín hiệu mà là mục tiêu của máy.
Như đã thảo luận, một hệ thống machine learning cần được đưa ra một mục tiêu – thứ hạng để đánh giá kết quả của nó.
Bạn sẽ đưa ra mục tiêu gì cho một hệ thống machine learning được thiết kế để điều chỉnh cách xếp hạng các website?
Tất nhiên là tại sao một số tín hiệu hoặc sự kết hợp của các tín hiệu cho thấy sự hài lòng của người dùng!
Vì vậy, sự hài lòng của người dùng là một tín hiệu trong chừng mực nó được sử dụng để đánh giá mức độ thành công của kết quả SERP.
Và nếu tín hiệu tốt, các trang web có các tính năng như những trang tạo ra nó sẽ bị ảnh hưởng tích cực (đối với nó và có thể là các truy vấn tương tự).
Nếu người dùng phản hồi không thuận lợi cho SERP, các website có các tính năng như những trang đó sẽ không bị phạt nhưng sẽ được coi là kết quả không tốt cho những loại truy vấn đó.
Vì vậy, hành vi của người dùng không phải là một tín hiệu. Nó chỉ hoạt động giống như một hành vi do cách hệ thống machine learning hoạt động.
11. Nguồn đầu vào của Stevie
Nhân viên của Google, như Jason đã nói:
“… Stevie xuất hiện vào buổi sáng nói,“ Đúng vậy,
Chúng tôi đang đo lường điều này hôm nay.
Và đây là thước đo thành công.
Đó là thước đo thất bại.
Chúng ta nên tập trung vào các chỉ số nào để có chất lượng phù hợp?“
Stevie xác định các bài kiểm tra và các tín hiệu liên quan.
Stevie xác định các chỉ số thành công.
Và Stevie định nghĩa thất bại.
Máy làm phần còn lại.
Có thể và thậm chí có thể xảy ra rằng hệ thống machine learning đang tìm kiếm các tín hiệu khác có liên quan đến các chỉ số thành công tích cực.
Hơn nữa, báo cáo về những điều đó, hoặc được phép chỉ cần điều chỉnh trọng lượng của chúng cho phù hợp.
Hy vọng rằng điều đó sẽ không đi quá xa nếu không Stevie sẽ mất việc.
Nguồn tham khảo: https://www.searchenginejournal.com/machine-learning-ai-in-search/382454/