Google thêm tài liệu trợ giúp siêu dữ liệu trang web hợp lệ mới

dữ liệu trang web

Google đã thêm một tài liệu trợ giúp mới có tên là siêu dữ liệu trang web hợp lệ nói về cách Google có thể xử lý HTML không hợp lệ hoặc không nhất quán với các vấn đề xung quanh đánh dấu không hợp lệ. Google cũng đã cập nhật tài liệu trợ giúp của mình về các liên kết tiêu đề với một phần mới về “không có tiêu đề chính rõ ràng” trong phần khắc phục sự cố.

Tài liệu trợ giúp về siêu dữ liệu trang web hợp lệ

Tài liệu trợ giúp “sử dụng siêu dữ liệu trang hợp lệ” mới có thể được tìm thấy tại đây và tài liệu này có nội dung “sử dụng siêu dữ liệu trang hợp lệ đảm bảo rằng Google có thể xử lý đánh dấu HTML cho các trang của bạn. ” “Google cố gắng hiểu HTML ngay cả khi nó không hợp lệ dữ liệu trang web hoặc không phù hợp với tiêu chuẩn HTML, nhưng lỗi trong đánh dấu có thể gây ra sự cố với trang web của bạn trong Google Tìm kiếm,” tài liệu cho biết thêm.

Ví dụ: nếu bạn sử dụng một phần tử không hợp lệ trong phần đầu, Google sẽ bỏ qua bất kỳ phần tử nào xuất hiện sau phần tử không hợp lệ. Đây là vấn đề nhiều hơn đối với dữ liệu lược đồ hoặc dữ liệu có cấu trúc nhưng cũng có thể ảnh hưởng đến các khu vực khác mà Google có thể không hiểu một phần tử trong HTML của bạn. Google cho biết bạn chỉ nên đặt siêu dữ liệu hợp lệ bên trong . Siêu dữ liệu hợp lệ bao gồm các phần tử HTML sau:

  • title
  • meta
  • liên kết
  • script
  • Phong cách
  • cơ sở
  • noscript
  • mẫu

Google đã thêm không sử dụng các phần tử không hợp lệ trong phần đầu: Các phần tử sau đây không hợp lệ khi được sử dụng trong và do đó không được Google Tìm kiếm hỗ trợ dữ liệu trang web khi được đặt trong :

  • iframe
  • img
  • Bất kỳ phần tử HTML nào khác
dữ liệu trang web
dữ liệu trang web

Cập nhật liên kết tiêu đề mục trợ giúp tài liệu gặp sự cố khi chụp

Google cũng đã cập nhật tài liệu trợ giúp về liên kết tiêu đề của nó ,dữ liệu trang web tài liệu này ban đầu là xuất bản vào tháng 10 2021 . Trước tiên, Google đã đổi tên tiêu đề phụ từ “Tránh các sự cố thường gặp với các phần tử tiêu đề” thành “Khắc phục sự cố thường gặp”. Google cũng đã thêm một phần mới có tên “ không có dòng tiêu đề chính rõ ràng ” có nội dung:

Khi có nhiều hơn một dòng tiêu đề lớn, nổi bật và không rõ văn bản nào là dòng tiêu đề chính của trang. Ví dụ dữ liệu trang web: một trang có hai hoặc nhiều dòng tiêu đề sử dụng cùng một kiểu dáng hoặc yếu tố tiêu đề. Nếu Google Tìm kiếm phát hiện có nhiều dòng tiêu đề lớn, nổi bật, nó có thể sử dụng dòng tiêu đề đầu tiên làm văn bản cho liên kết tiêu đề.

Cân nhắc đảm bảo rằng dòng tiêu đề chính của bạn khác biệt với văn bản khác trên trang và nổi bật là nổi bật nhất trên trang (ví dụ: sử dụng phông chữ lớn hơn, đặt dòng tiêu đề trong phần tử h1 có thể nhìn thấy đầu tiên trên trang, v.v.).

Tại sao chúng tôi quan tâm dữ liệu trang web?

Nói chung, người làm SEO phải được cập nhật trong tài liệu trợ giúp dành cho nhà phát triển Google Tìm kiếm. Nhiều bạn đã đọc qua những tài liệu này một hoặc hai lần.

Tìm hiểu về các tài liệu mới đang được đăng và các thay đổi đối với các tài liệu hiện có có thể giúp bạn tiết kiệm thời gian tìm hiểu những gì đã thay đổi hoặc cách Google nhìn nhận SEO và Google Tìm kiếm. Hai thay đổi này có thể giúp bạn thông báo với các bên liên quan về cách tạo các trang tốt hơn hoạt động tốt hơn cho Google Tìm kiếm.

Vậy một dữ liệu trang web sẽ tự thu thập những gì?

Đa số những trang web ấy muốn biết càng nhiều về bạn càng tốt, bất kể mục đích của họ là gì: cung cấp dịch vụ phù hợp cho bạn hay cho bạn xem những quảng cáo phù hợp. Để có thể lấy được số dữ liệu này, những trang web sẽ đưa vào hệ thống máy của bạn những “cookie”, những file nhỏ được sử dụng để xác định xem người dùng trang web là ai.

Những file nhỏ ấy sẽ báo cho trang web xem bạn đã đăng nhập vào đó bao giờ chưa. Bản thân chúng cũng chứa dữ liệu: bạn sẽ không phải chọn thành phố mong muốn khi đăng nhập vào một trang web xem múi giờ hay thời tiết – bạn đã làm vậy trong lần ghé thăm trang web gần nhất, nó sẽ lưu lại giỏ hàng mua sắm đang dang dở ngày hôm trước của bạn, v.v…

Cookie vừa tiện lợi cho người dùng mà lại vừa tiện dụng cho bản thân trang web. Và nó cũng đóng góp một phần dữ liệu, kết hợp với những thông tin mà trình duyệt của bạn thu thập về, để gộp thành nhân cách trên mạng của bạn.

Giao thức bảo mật của trình duyệt yêu cầu các trang web chỉ có thể lấy dữ liệu từ cookie của chính họ mà thôi, nhưng bên cạnh đó có những cookie của bên thứ ba khác, không liên quan tới trang web nào cả nhưng vẫn tồn tại, được cài vào máy thông qua mạng lưới quảng cáo hay qua các công nghệ lần dấu người dùng khác.

Những cookie này chính là lý do tại sao bạn vừa đăng nhập vào dữ liệu trang web mua bán sách, các quảng cáo về sách sẽ hiện lên liên tục trong vòng từ một tới nhiều tuần.

Toàn bộ số thông tin này được sử dụng để nhận dạng chính bạn – người dùng xem bạn là ai, để có thể quảng cáo hiệu quả hơn. Dữ liệu từ việc ghé thăm trang web nào, tìm cái gì, những cookie lưu trên máy và cả dữ liệu từ trình duyệt của bạn sẽ được tổng hợp lại, phân tích xem liệu bạn sẽ muốn xem quảng cáo gì nhất.

Nhà cung cấp mạng Internet cũng có quyền truy cập được vào số dữ liệu này. Và họ cũng có thể làm tiền nhờ đó: họ có thể bán lịch sử tìm kiếm của ta cho các công ty quảng cáo, để họ có thể làm việc hiệu quả hơn. Những dữ liệu này nếu chia nhỏ ra thì không nhiều tác dụng, nhưng khi kết hợp lại, chúng sẽ thành một bản sơ yếu lý lịch khá chi tiết. Và nó vẫn còn chi tiết hơn được nữa …

dữ liệu trang web
dữ liệu trang web

… nhờ có các thông tin mà bạn cho không

Đó là những tìm kiếm bạn thực hiện khi đăng nhập vào Google, dữ liệu trang web là những thứ bạn bấm vào khi lướt Facebook, dữ liệu trang web ngày tháng năm sinh bạn cung cấp cho mọi thứ dịch vụ trên Internet. Vô số thứ khác nữa.

Bạn muốn sử dụng dịch vụ X thì nghiễm nhiên, bạn đồng ý cho dịch vụ X kiểm soát mọi hoạt động bạn làm trên nền tảng của dịch vụ X ấy. Hiển nhiên là họ làm vậy để cải thiện trải nghiệm người dùng, sửa đổi lỗi khi cần thiết, nhưng không thể phủ nhận rằng đó lại là một lượng dữ liệu lớn nữa ném vào cái đống dữ liệu đã lớn sẵn rồi.

Kết hợp lại, thì theo một cách nào đó, Google và Facebook còn hiểu bạn hơn người thân hiểu bạn, hay hơn cả bạn hiểu chính mình.

Năm 2016, Google sửa đổi chính sách bảo mật của mình, cho phép dữ liệu từ mạng lưới quảng cáo DoubleClick của họ có thể được nạp vào số dữ liệu họ đã có sẵn về bạn, để xây dựng nên một mạng lưới toàn diện về những thông tin về bạn và những gì bạn thích. Không phải công ty nào cũng làm được điều đó giống Google hay Facebook, nhưng những thông tin này có thể được bán qua mua lại một cách không mấy khó khăn.

Về cơ bản thì mọi thứ đều nằm gọn trong chính sách của từng công ty, từng dữ liệu trang web mà bạn tương tác. Bao gồm cách họ thu thập dữ liệu từ bạn, cách họ sử dụng những dữ liệu ấy, … Những chính sách này hầu hết ai cũng có thể truy cập và tìm hiểu.

Từ khóa:

  • Xóa dữ liệu duyệt web trên điện thoại
  • Xóa dữ liệu duyệt web trên iPhone
  • Xóa dữ liệu duyệt web trên Safari
  • Xem lịch sử tìm kiếm Google trên điện thoại
  • Cách xóa dữ liệu duyệt web trên Google Chrome
  • Xóa dữ liệu duyệt web trên máy tính
  • Dữ liệu duyệt web là gì
  • Lịch sử gần đây

Nội dung liên quan: