Gần đây , nhiều người chỉ để cập nhật Panda của Google là một trong đó xem xét những thứ như bao nhiêu quảng cáo và nơi quảng cáo được đặt trên một trang web như là dấu hiệu cho thấy chất lượng của một trang web .

Tất nhiên, có những yếu tố khác có thể là công cụ tìm kiếm sẽ xem xét khi có bàn thắng một trang web dựa trên tín hiệu chất lượng , nhưng tỷ lệ quảng cáo cho nội dung có vẻ là một tín hiệu quan trọng .

Nhiều trang web dựa vào quảng cáo như một nguồn thu nhập , và có thể cung cấp quảng cáo có liên quan đến một khách thông tin và nhu cầu giao dịch không phải là một điều xấu. Nhiều trang web đề cập đến các trang trại như nội dung chủ yếu cung cấp đủ thông tin để có các trang của họ xếp hạng cao trong công cụ tìm kiếm với các điều kiện nhất định mà không cung cấp một phạm vi và chiều sâu của thông tin về các chủ đề liên quan đến những điều khoản dịch vụ seo

Mục tiêu của họ là để thu hút du khách và nhận được chúng để nhấn vào quảng cáo được tìm thấy trên trang của họ. Một số các trang web nội dung trang trại làm điều này bằng cách sử dụng nội dung được tìm thấy trên các trang khác trên web, có hoặc không có sự cho phép hoặc cấp giấy phép của nội dung đó. Những người khác thuê người để viết bài với giá rất thấp , và không tập trung nhiều vào chất lượng thực tế của nội dung đó.

Hơn tại các diễn đàn Webmaster giúp đỡ miền Trung của Google, một kỹ sư tìm kiếm Google bắt đầu một chủ đề cho những người tin rằng họ đã bị ảnh hưởng tiêu cực bởi Cập nhật Panda người ” nên không ” có được. Tại thời điểm viết bài này có hơn 700 phản ứng trong chủ đề đó , Hãy suy nghĩ bạn đang bị ảnh hưởng bởi sự thay đổi thuật toán gần đây ? Trả lời ở đây .

Từ quảng cáo dường như là một trong những điều được xem xét trong bản cập nhật , tôi nghĩ rằng nó là thú vị để xem một hồ sơ bằng sáng chế được công bố từ Microsoft khám phá sự khác biệt giữa các hình ảnh được sử dụng như quảng cáo, và hình ảnh mà không phải là . Tôi tưởng tượng rằng một số người đưa quảng cáo dựa trên văn bản như Adsense của Google có thể xem xét thay thế một số các quảng cáo văn bản với các quảng cáo dựa trên hình ảnh . Tôi không chắc chắn rằng sẽ làm cho nhiều sự khác biệt . Như các bằng sáng chế của Microsoft chỉ ra, có nhiều cách để xác định xem một hình ảnh là một quảng cáo.

Nộp bằng sáng chế của Microsoft là một phương pháp đào tạo máy tính mà học như nó đi , để có thể phân loại hình ảnh như quảng cáo bằng cách nhìn vào một loạt các tính năng liên quan đến hình ảnh. Các ứng dụng bằng sáng chế là :

Phân loại hình ảnh như quảng cáo hình ảnh hoặc Không quảng cáo hình ảnh
Được phát minh bởi Mingjing Li , Li Zhiwei , Đông Phương Li , Bin Wang
Giao cho Microsoft
Ứng dụng bằng sáng chế Mỹ 20110058734
Công bố ngày 10 tháng 3 2011
Nộp : 12 tháng 11 2010

trừu tượng

Một hệ thống phân loại hình ảnh quảng cáo huấn luyện một bộ phân loại nhị phân để phân loại hình ảnh như hình ảnh quảng cáo hoặc hình ảnh không quảng cáo và sau đó sử dụng phân loại nhị phân để phân loại hình ảnh của các trang web như hình ảnh quảng cáo hoặc hình ảnh không quảng cáo. Trong giai đoạn đào tạo, hệ thống phân loại tạo ra dữ liệu huấn luyện của các vector đại diện cho hình ảnh và nhãn ghi rõ xem một ảnh là một hình ảnh quảng cáo, một hình ảnh không quảng cáo.

Hệ thống phân loại đào tạo một phân loại nhị phân để phân loại hình ảnh bằng cách sử dụng dữ liệu huấn luyện . Trong giai đoạn phân loại , hệ thống phân loại đầu vào một trang web với một hình ảnh và tạo ra một vector đặc trưng cho hình ảnh. Hệ thống phân loại sau đó áp dụng phân loại nhị phân được đào tạo để các vector đặc trưng để tạo ra một số điểm cho thấy cho dù hình ảnh là một hình ảnh quảng cáo, một hình ảnh không quảng cáo.

Trong khi điều này là quá trình cấp bằng sáng chế của Microsoft, cơ hội được rằng Google có thể được xem xét thông tin rất tương tự để phân biệt giữa hình ảnh được quảng cáo và hình ảnh mà không phải là .

Có một số lý do để phân biệt giữa quảng cáo và hình ảnh không quảng cáo. Một là một công cụ tìm kiếm sẽ không muốn bao gồm hình ảnh được quảng cáo trong kết quả tìm kiếm hình ảnh của mình . Khác có thể là để có được một cảm giác bao nhiêu quảng cáo là trên một trang so với nội dung không phải quảng cáo.

Các loại tính năng Kết hợp với phân loại

Nộp bằng sáng chế cho chúng ta bốn loại khác nhau tính năng có thể là công cụ tìm kiếm có thể xem xét , và ví dụ hoặc các lý do tại sao những tính năng rất hữu ích trong việc xác định có hay không một hình ảnh là một quảng cáo . Chúng bao gồm các tính năng văn bản, tính năng liên kết, tính năng thiết kế trực quan , hoặc các tính năng nội dung.

Một tính năng văn bản nhìn từ mà có thể được liên kết với một hình ảnh có thể được tìm thấy ở những nơi như URL của hình ảnh, văn bản ALT từ hình ảnh, hoặc văn bản bao quanh hình ảnh. Những lời này có thể cung cấp một dấu hiệu cho thấy hình ảnh là một quảng cáo , bao gồm cả những từ như ” pop-up” và ” quảng cáo. ”

Tính năng liên kết là những người liên quan đến nơi các liên kết liên quan đến một hình ảnh có thể chỉ . Thực hiện liên kết hình ảnh đến một trang trên cùng một trang web mà hình ảnh được tìm thấy, hoặc đến một vị trí khác nhau mà có thể là một máy chủ quảng cáo hoặc một trang web, nơi một mục quảng cáo có thể được mua.

Một tính năng thiết kế trực quan xác định nơi một hình ảnh trực quan được đặt ra trong một trang web.

Tính năng nội dung của một hình ảnh liên quan đến nội dung của hình ảnh , và có thể bao gồm :

Tỉ lệ của hình ảnh,
Định dạng hình ảnh ,
Cho dù hình ảnh là một bức ảnh hoặc một đồ họa,
Kích thước của hình ảnh,
Số màu sắc khác nhau của hình ảnh,
Tỷ lệ phần trăm của vùng màu xám của hình ảnh, và
Chỉ số cho biết hình ảnh có độ tương phản cao .
Một số các tính năng nội dung có thể hữu ích trong việc xác định có hay không một hình ảnh quảng cáo.

Chúng tôi đang nói với các tác giả của các bằng sáng chế mà một tỉ lệ có thể hữu ích trong việc xác định banner quảng cáo mà có xu hướng ngắn và rộng.

Các định dạng hình ảnh có thể xác định hình ảnh với nhiều khung hình (được sử dụng để cung cấp hình ảnh động ) .

Phân biệt giữa hình ảnh và đồ họa là rất quan trọng bởi vì hầu hết các quảng cáo có xu hướng đồ họa mà kết hợp thông tin về một đề nghị quảng cáo.

Kích thước rất hữu ích vì quảng cáo cần phải có ít nhất một kích thước nhất định để được nhận thấy .

Số lượng màu sắc được sử dụng trong một hình ảnh rất quan trọng vì hình ảnh quảng cáo thường có ít màu sắc khác nhau hơn so với hình ảnh không quảng cáo. Thuật toán Panda làm thay đổi thứ hạng từ dịch vụ SEO

Vùng màu xám là giá trị xem xét vì ” hình ảnh quảng cáo thường có khác nhau màu xám như một nền tảng . ”

Ngược lại được nhìn vì hình ảnh quảng cáo thường được tạo ra để có độ tương phản sắc nét.

kết luận

Trong khi bằng sáng chế này cung cấp một số ví dụ về cách một công cụ tìm kiếm có thể quyết định có hay không một hình ảnh là một quảng cáo hay không, có thể là có có những thứ khác công cụ tìm kiếm có thể xem xét là tốt.

Trong một hệ thống như một trong đó Google đang sử dụng để rerank kết quả tìm kiếm dựa trên “chất lượng” của các trang , rất có thể là khi công cụ tìm kiếm đang tìm kiếm các quảng cáo trên các trang nó không chỉ nhìn vào các quảng cáo dựa trên văn bản , nhưng cũng hình ảnh được quảng cáo là tốt.