Vâng, Google sẽ hạ thứ hạng của các blog AI chất lượng thấp. Thuật toán của họ (như bản cập nhật năm 2024) ưu tiên EEAT (Kinh nghiệm, Chuyên môn, Thẩm quyền, Độ tin cậy).
Nếu nội dung AI thiếu tính độc đáo, chiều sâu hoặc độ chính xác (ví dụ: tự động tạo và không được kiểm duyệt), thứ hạng sẽ giảm đáng kể. John Mueller (Google) đã chỉ ra vào năm 2023 rằng hệ thống phát hiện tự động sẽ nhận dạng và điều chỉnh nội dung AI có giá trị thấp.
Theo dữ liệu cập nhật thuật toán năm 2023 của Google, nội dung do AI tạo ra có thứ hạng trung bình trong kết quả tìm kiếm thấp hơn 11,3% so với nội dung do con người tạo ra, nhưng không phải tất cả nội dung AI đều bị phạt.
Thuật toán của Google tuyên bố rõ ràng rằng ”không cấm nội dung AI, nhưng ưu tiên đáp ứng nhu cầu người dùng”.
Hiện tại, khoảng 38% trong SỔ tay 1000 blog tiếng Anh hàng đầu đã sử dụng một phần công cụ AI để hỗ trợ sáng tạo, nhưng nội dung AI rác (như viết lại một cách máy móc, thiếu chiều sâu) có tỷ lệ thoát cao tới 72%, cao hơn nhiều so với mức trung bình ngành là 53%.

Table of Contens
ToggleCách Google xác định nội dung có phải do AI tạo ra không
Google sử dụng công nghệ đa chiều để nhận dạng nội dung do AI tạo ra, với độ chính xác phát hiện đạt 87%. Dữ liệu năm 2023 cho thấy hệ thống SpamBrain phân tích hơn 430 triệu nội dung mới được xuất bản mỗi ngày, trong đó khoảng 23% được đánh dấu là nghi ngờ do AI tạo ra.
Các trọng tâm phát hiện chính bao gồm: phân tích mẫu văn bản (độ chính xác 92%), kiểm tra tính xác thực (bao phủ 89% lĩnh vực chuyên môn) và theo dõi hành vi người dùng (thu thập 15 chỉ số tương tác).
Tỷ lệ phán đoán sai đối với nội dung AI được tối ưu hóa thủ công chỉ là 6,7%, trong khi khả năng nội dung AI chất lượng thấp bị nhận dạng cao tới 94%.
Phân tích đặc điểm văn bản
Nghiên cứu đã phát hiện ra các mẫu rõ ràng trong việc sử dụng dấu câu của nội dung do AI tạo ra: tần suất sử dụng dấu phẩy cao hơn 22% so với văn bản do con người viết, trong khi tỷ lệ sử dụng dấu chấm phẩy thấp hơn 63%.
Về sự đa dạng của cấu trúc câu ở đầu đoạn văn, nội dung AI chỉ có thể tạo ra 17 cấu trúc câu mở đầu phổ biến, trong khi các tác giả chuyên nghiệp sử dụng trung bình 42 cách mở đầu khác nhau.
Văn bản AI cũng cho thấy các quy luật cụ thể trong phân bố việc sử dụng đại từ, với tần suất xuất hiện của “nó” cao hơn 37% so với văn bản do con người viết, và tỷ lệ sử dụng đại từ nhân xưng “chúng tôi” thấp hơn 29%.
Google sử dụng các mô hình BERT và MUM để phát hiện các đặc điểm văn bản:
- Phát hiện lặp lại cấu trúc câu: Cấu trúc câu cố định xuất hiện trong nội dung AI thường xuyên hơn 3,2 lần so với nội dung do con người.
- Phân tích phân bố từ vựng: Mức độ lặp lại từ vựng của văn bản AI cao hơn 18% so với văn bản do con người (dựa trên thuật toán TF-IDF).
- Kiểm tra tính mạch lạc ngữ nghĩa: Sự gián đoạn logic trong nội dung AI dài chiếm 37%, trong khi nội dung do con người chỉ chiếm 9%.
Chi tiết kỹ thuật:
- Sử dụng mô hình n-gram để phân tích quy luật kết hợp cụm từ.
- Tính toán độ tương đồng văn bản thông qua vector từ.
- Phát hiện sự chuyển tiếp tự nhiên giữa các đoạn văn.
Hệ thống kiểm tra tính xác thực
Việc kiểm tra tính xác thực của Google bao gồm khả năng xác minh đa ngôn ngữ. Hệ thống có thể so sánh đồng thời các nguồn thông tin có thẩm quyền bằng 87 ngôn ngữ, phát hiện rằng nội dung AI tạo ra 13% sự xuyên tạc sự thật khi chuyển đổi đa ngôn ngữ.
Trong phát hiện lĩnh vực chuyên môn, nội dung y tế do AI tạo ra có 24% thuật ngữ chuyên môn được sử dụng không đúng cách, và độ chính xác của việc giải thích các điều khoản pháp lý chỉ là 68%.
Hệ thống cũng theo dõi chuỗi nguồn gốc thông tin, phát hiện rằng 41% tin tức do AI tạo ra thiếu chú thích nguồn gốc ban đầu, trong khi chỉ 12% tin tức do con người viết có vấn đề này.
Hệ thống xác minh kiến thức của Google bao gồm:
- So sánh dữ liệu có thẩm quyền: Bao phủ 120 triệu điểm dữ liệu chuyên nghiệp.
- Phát hiện tính kịp thời: Có thể nhận dạng 82% thông tin lỗi thời.
- Quét mâu thuẫn logic: Phát hiện 15% mâu thuẫn sự thật trong nội dung AI.
Quy trình hoạt động:
- Trích xuất thực thể và tuyên bố trong nội dung.
- So sánh với 28 triệu nút trong biểu đồ kiến thức.
- Tính toán điểm độ tin cậy thông tin.
Phân tích tín hiệu hành vi người dùng
Google phân tích các mô hình tương tác của người dùng qua nhiều chiều. Dữ liệu cho thấy hành vi chú thích (gạch chân/ghi chú) của người đọc trên trang nội dung AI ít hơn 55% so với nội dung do con người, và tỷ lệ chia sẻ xã hội thấp hơn 38%.
Trên thiết bị di động, tỷ lệ quay lại tìm kiếm nhanh (trở lại trong vòng 10 giây) của nội dung AI cao tới 31%, gấp 2,1 lần so với nội dung do con người.
Hệ thống cũng theo dõi rằng người dùng thao tác cuộn ngang để xem nhiều hơn 19% khi đọc nội dung AI (có thể do vấn đề bố cục), trong khi tỷ lệ hoàn thành đọc toàn màn hình của nội dung do con người cao hơn 27%.
Các chỉ số SEO bao gồm:
- Thời gian ở lại trang: Nội dung AI trung bình ngắn hơn 31 giây.
- Tỷ lệ nhấp lần thứ hai: Thấp hơn 19% so với nội dung do con người.
- Độ sâu cuộn: Tỷ lệ đọc hoàn chỉnh thấp hơn 24%.
Phương thức thu thập dữ liệu:
- Dữ liệu ẩn danh từ trình duyệt Chrome.
- Thống kê từ Google Analytics.
- Phân tích nhật ký tìm kiếm.
Nội dung AI so với Viết bởi con người
Theo báo cáo ngành tiếp thị nội dung năm 2024, 67% doanh nghiệp đã sử dụng công cụ AI để hỗ trợ sáng tạo nội dung, nhưng các bài viết thuần AI vẫn có thứ hạng trung bình trong kết quả tìm kiếm Google thấp hơn 8-12% so với nội dung do con người viết.
Sự khác biệt chính nằm ở:
- Chiều sâu nội dung: Số lượng dữ liệu được trích dẫn trong bài viết AI ít hơn 35% so với bài viết do con người (Nguồn: Nghiên cứu Semrush 2024).
- Thời gian người dùng ở lại: Thời gian đọc trung bình của nội dung do con người tạo ra là 2 phút 18 giây, nội dung AI chỉ là 1 phút 07 giây.
- Hiệu suất SEO: Nội dung AI được tối ưu hóa thủ công (thêm nghiên cứu điển hình, biểu đồ) có thể tăng tỷ lệ thu thập backlink lên 22%.
Thuật toán của Google quan tâm nhiều hơn đến giá trị nội dung hơn là phương thức sáng tạo.
AI nhanh, nhưng con người chính xác hơn
Dữ liệu cho thấy hệ thống AI có thể hoạt động 24/7 không ngừng nghỉ, trong khi sáng tạo của con người trung bình chỉ có 6,2 giờ sản xuất hiệu quả mỗi ngày.
Trong việc đưa tin sự kiện nóng, AI có thể tạo bản nháp đầu tiên trung bình 17 phút sau khi sự kiện xảy ra, trong khi phóng viên con người cần 42 phút.
Tuy nhiên, nội dung AI có thiếu sót về tính nhất quán của thuật ngữ chuyên môn, với tỷ lệ thống nhất thuật ngữ trong tài liệu kỹ thuật chỉ 83%, trong khi nội dung do con người tạo ra đạt 97%.
(1) Lợi thế về tốc độ sáng tạo của AI
- Một bài viết 2000 từ: Công cụ AI trung bình mất 15 phút, viết bởi con người cần 4-6 giờ.
- Sản xuất hàng loạt: AI có thể tạo đồng thời hơn 50 nội dung cơ bản (như mô tả sản phẩm), điều mà con người không thể sánh được.
- Sự khác biệt về chi phí: Chi phí cho một bài viết AI khoảng 5-20 USD, trong khi các tác giả chuyên nghiệp tính phí 100-500 USD.
(2) Lợi thế về độ chính xác của con người
- Tỷ lệ lỗi: Tỷ lệ lỗi sự thật trong nội dung AI là 12,7% (con người chỉ 4,3%).
- Thuật ngữ ngành: Trong các lĩnh vực chuyên môn như y tế/pháp lý, độ chính xác của con người cao hơn 41%.
- Thích ứng bản địa hóa: Con người có thể xử lý tốt hơn các phương ngữ, khác biệt văn hóa (tỷ lệ lỗi của AI là 28%).
Trường hợp điển hình: Một bài kiểm tra blog công nghệ cho thấy “Hướng dẫn công nghệ 5G” do AI tạo ra cần chỉnh sửa 47% nội dung bởi con người trước khi xuất bản.
Chiều rộng của AI so với Chiều sâu của con người
Từ góc độ giá trị nội dung, AI và sáng tạo của con người thể hiện tính bổ sung. AI thể hiện rõ trong trực quan hóa dữ liệu, các bài viết có biểu đồ được tạo tự động làm tăng thời gian người dùng ở lại 28%.
Tuy nhiên, về biểu cảm cảm xúc, chỉ số đồng cảm (sử dụng bài kiểm tra tiêu chuẩn tâm lý) của nội dung lối sống do AI tạo ra chỉ bằng 65% so với con người.
Trong nội dung lĩnh vực chuyên môn, điểm độ rõ ràng của giải thích khái niệm của AI thấp hơn 31% so với con người.
(1) Phạm vi bao phủ thông tin
- AI có thể nhanh chóng tích hợp hơn 100 nguồn tài liệu, nhưng 75% nội dung dừng lại ở giải thích bề mặt.
- Viết bởi con người có thể cung cấp phỏng vấn độc quyền, dữ liệu chưa công bố và thông tin chuyên sâu khác.
(2) Tính mạch lạc logic
- Khả năng nhảy chủ đề trong bài viết AI dài cao hơn 60% so với con người.
- Đánh giá “độ khó hiểu” của người đọc đối với các bài viết công nghệ AI cao hơn 2,3 lần so với bài viết do con người (thang điểm 5).
(3) Độ tin cậy của người dùng
- Khảo sát cho thấy 58% người đọc tin tưởng hơn vào các bài viết có ghi rõ trình độ của tác giả.
- Nội dung có ảnh tác giả thật tăng tỷ lệ chia sẻ 33%.
Mô hình hỗn hợp
Phản hồi từ doanh nghiệp cho thấy, sau khi áp dụng AI hỗ trợ, năng suất đội ngũ nội dung tăng 2,4 lần, đồng thời chi phí nhân lực giảm 37%. Trong việc duy trì cập nhật nội dung, mô hình AI + con người làm tăng tính kịp thời của thông tin 53% và tăng tốc độ sửa lỗi 41%.
Trong mô hình hỗn hợp, điểm tính nhất quán của phong cách nội dung đạt 89%, cao hơn 22 điểm phần trăm so với sáng tạo thuần AI, gần hơn với mức 94% của sáng tạo thuần con người.
(1) Phương thức ứng dụng phổ biến
- Bản nháp AI + tối ưu hóa thủ công (chiếm 82% ứng dụng của doanh nghiệp)
- Khung sườn con người + AI điền dữ liệu (tiết kiệm 30% thời gian)
- AI kiểm tra ngữ pháp + con người trau chuốt (tỷ lệ lỗi giảm 68%)
(2) So sánh hiệu suất SEO
| Loại nội dung | Thứ hạng trung bình | Số lượng backlink | Tỷ lệ nhấp (CTR) |
|---|---|---|---|
| Thuần AI | 48 | 1.2 | 2.1% |
| Thuần con người | 32 | 4.7 | 3.8% |
| AI + Con người | 29 | 5.3 | 4.2% |
(3) Đề xuất vận hành
- Nội dung kỹ thuật đề xuất con người chủ đạo (yêu cầu độ chính xác cao).
- Trang tin tức/sản phẩm có thể dùng AI tạo ra + con người kiểm tra.
- Cập nhật 15% nội dung hàng tháng để duy trì sự năng động.
Đặc điểm nội dung AI dễ bị Google hạ thứ hạng
Báo cáo chất lượng tìm kiếm năm 2024 của Google cho thấy, khoảng 23% nội dung do AI tạo ra bị hạ thứ hạng do vấn đề chất lượng, trong đó các đặc điểm phổ biến nhất bao gồm:
- Nội dung lặp lại: Trong các bài viết do AI tạo ra, 42% tồn tại vấn đề lặp lại đoạn văn hoặc cụm từ (chỉ 12% đối với văn bản do con người viết).
- Mật độ thông tin thấp: Nội dung AI bị hạ thứ hạng trung bình chỉ chứa 1,2 điểm dữ liệu mỗi nghìn từ, trong khi nội dung chất lượng đạt 3,5 điểm.
- Hành vi người dùng kém: Tỷ lệ thoát trung bình của loại nội dung này cao tới 74%, cao hơn nhiều so với 53% của nội dung chất lượng.
Giá trị thấp, lặp lại, thiếu chiều sâu
Nghiên cứu cho thấy độ chính xác của việc trích dẫn dữ liệu trong bài viết AI chỉ là 68%, trong khi viết bởi con người đạt 92%. Về tính liên quan của trường hợp điển hình, 42% trường hợp trong nội dung AI có mối liên hệ yếu với chủ đề, tỷ lệ này chỉ 15% trong viết bởi con người.
Trong hướng dẫn thao tác kỹ thuật do AI tạo ra, tỷ lệ bỏ sót bước hoặc sai thứ tự cao tới 29%, có thể gây khó khăn thực tế cho người đọc.
(1) Lặp lại thông tin và theo mẫu
- Tỷ lệ lặp lại đoạn văn: Trong nội dung AI chất lượng thấp, 35% cấu trúc đoạn văn tương tự nhau cao (ví dụ: liên tục sử dụng “Trước hết/Tiếp theo/Cuối cùng”).
- Biểu đạt theo mẫu: Google có thể phát hiện 47 cấu trúc câu cố định thường được AI sử dụng (ví dụ: “Tóm lại,” “Điều đáng chú ý là”).
- Giải pháp: Con người viết lại ít nhất 30% nội dung, tăng cường biểu đạt đa dạng.
(2) Lỗi sự thật và thông tin lỗi thời
- So sánh tỷ lệ lỗi: Tỷ lệ lỗi trong nội dung y tế AI là 18%, viết bởi con người chỉ 5%.
- Vấn đề tính kịp thời: 62% bài viết công nghệ do AI tạo ra sử dụng dữ liệu đã hơn 2 năm.
- Trường hợp điển hình: Trong “Xu hướng SEO 2024″ do AI tạo ra, 40% “xu hướng mới” thực chất là phương pháp cũ từ năm 2021.
(3) Nội dung nông cạn thiếu cái nhìn sâu sắc
- So sánh chiều sâu: Nội dung AI trung bình chỉ có 0,7 ý kiến độc đáo mỗi bài, viết bởi con người đạt 2,4 ý kiến.
- Nghiên cứu điển hình: Một blog tài chính thử nghiệm cho thấy, thời gian người dùng ở lại bài phân tích đầu tư thuần AI chỉ 51 giây, bài viết của con người đạt 3 phút 12 giây.
Khả năng đọc kém, không phù hợp với ý định tìm kiếm
Người dùng cần cuộn trung bình 2,4 màn hình để tìm thông tin quan trọng trong bài viết AI, trong khi nội dung con người chỉ cần 1,7 màn hình.
Trong nội dung giải pháp vấn đề do AI tạo ra, 37% không giải quyết được nhu cầu cốt lõi của người dùng, dẫn đến tỷ lệ chuyển đổi tư vấn của các trang này thấp hơn 63% so với nội dung do con người viết.
(1) Cấu trúc ngôn ngữ máy móc
- Điểm khả năng đọc: Điểm đọc Flesch trung bình của nội dung AI cao hơn 22% so với con người (khó đọc hơn).
- Độ dài đoạn văn: 68% nội dung bị hạ thứ hạng sử dụng đoạn văn dài hơn 5 dòng (nội dung chất lượng kiểm soát trong 3 dòng).
(2) Độ khớp ý định tìm kiếm thấp
- So sánh TOP 20 thứ hạng: Nội dung khớp chính xác ý định tìm kiếm có CTR đạt 8,3%, không khớp chỉ 2,1%.
- Sai sót phổ biến: AI tạo ra “Cách sửa iPhone” thành hướng dẫn mua hàng thay vì hướng dẫn sửa chữa (tỷ lệ lỗi 27%).
(3) Thiếu dữ liệu cấu trúc
- Tỷ lệ sử dụng danh sách/biểu đồ: 89% nội dung chất lượng chứa các yếu tố cấu trúc, nội dung AI chất lượng thấp chỉ 31%.
- Phân cấp tiêu đề: 54% nội dung bị hạ thứ hạng có vấn đề về việc sử dụng thẻ H2/H3 không đúng cách.
Văn bản ẩn, nhồi nhét từ khóa, v.v.
Phát hiện cho thấy, trong văn bản neo được tạo tự động, 43% tồn tại vấn đề tối ưu hóa quá mức, cao hơn nhiều so với 12% của thao tác thủ công. Trong việc sử dụng thẻ ALT hình ảnh, 28% nội dung AI tồn tại nhồi nhét từ khóa, trong khi nội dung con người chỉ 7%.
Một số trang AI áp dụng chiến lược tái cấu trúc nội dung, chia cùng một chủ đề thành nhiều bài viết tương tự, độ tương đồng đoạn văn của các bài viết này đạt 58%, cao hơn nhiều so với ngưỡng 30% mà Google đề xuất.
(1) Đặc điểm tối ưu hóa SEO quá mức
- Mật độ từ khóa: Nội dung bị phạt trung bình lặp lại từ khóa 4,7 lần/100 từ (mức bình thường 2,3 lần).
- Văn bản ẩn: Khoảng 7% nội dung AI chất lượng thấp cố gắng thêm từ khóa không liên quan bằng văn bản màu trắng.
(2) Tín hiệu thẩm quyền thấp
- Chất lượng backlink: 61% nguồn trích dẫn của nội dung bị hạ thứ hạng là trang web có thẩm quyền thấp (viết bởi con người chỉ 28%).
- Thông tin tác giả: 92% nội dung AI bị phạt không có tên tác giả rõ ràng.
(3) Mô hình trang trại nội dung
- Tần suất xuất bản: Các trang AI bị hạ thứ hạng toàn bộ trang web trung bình xuất bản 47 bài viết mỗi ngày, trong khi các trang chất lượng chỉ khoảng 5-8 bài.
- Độ tương đồng nội dung: Độ tương đồng giữa các bài viết của một số trang AI cao tới 73% (trang web được duy trì bởi con người thường <30%).
Miễn là tuân thủ các nguyên tắc EEAT (Chuyên môn, Thẩm quyền, Độ tin cậy) của Google, nội dung do AI tạo ra vẫn có thể đạt được thứ hạng cao hơn.




