Yahoo Thu thập dữ liệu sử dụng Đối với trang web Profiling

Gần đây tôi đã viết về một sự thích nghi của Yahoo PageRank, được gọi là PageRank tài nhạy cảm, trong đó yêu cầu mà rất nhiều dữ liệu được thu thập về khách truy cập đến các trang web, bao gồm cả cách kích chuột của họ và thói quen duyệt web.

Một vài ứng dụng bằng sáng chế của Yahoo từ tuần trước để tham khảo tài PageRank nhạy cảm trong khi mô tả bộ sưu tập các dữ liệu người dùng và dữ liệu Web, và hồ sơ xây dựng cho các trang web cụ thể dựa trên dữ liệu đó.

Một trong số đó tập trung vào cách cấu hình được tạo ra cho các trang web, để xác định những gì các trang web này là về và những gì loại hình giao thông cấp họ nhận được dựa trên hồ sơ xây dựng cho các trang web khác, nơi mà nhiều thông tin được biết về các trang web khác.

Việc nộp đơn sáng chế khác của Yahoo mô tả một số chi tiết về cách thông tin này có thể được sử dụng trong việc lựa chọn những loại tài liệu để quảng cáo trên các trang web như vậy, nơi hồ sơ đang được sử dụng để xác định bối cảnh ít được biết về các nội dung thực tế trên một số trang của những trang web.

Tie-in cho người dùng PageRank Sensitive bằng sáng chế dịch vụ seo Điều thú vị nhất đối với tôi là, và một số chi tiết được cung cấp về thu thập dữ liệu người dùng từ các thanh công cụ, các ISP, và các chương trình khác.

Các ứng dụng bằng sáng chế là:

Hệ thống và phương pháp cho profiling đích web

Hệ thống và phương pháp quảng cáo nhắm mục tiêu dân số

Được phát minh bởi Pavel Berkhin, Shanmugasundaram Ravikumar, Andrew Tomkins, và John Anthony Tomlin
Giao cho Yahoo
US Patent Application 20080028067
Xuất bản ngày 31 tháng 1 2008
Nộp: 27 Tháng 7 2006

Tạo Profiles và ước tính về giao thông

Ước tính lưu lượng truy cập, phân tích kích chuột và lưu lượng truy cập web profile đích có thể được tạo ra từ việc xem xét dữ liệu trong nhiều cách khác nhau, bao gồm từ:

a) profile đích web khác,

b) phân tích liên kết của các kết nối của các trang web với các trang web khác,

c) Phân tích lưu lượng của lưu lượng giữa các trang của trang web và các trang khác, hoặc trên các trang web ra,

d) Phân tích nội dung của các trang hoặc siêu dữ liệu như thẻ để xác định các trang web có nội dung tương tự hoặc thẻ ở nơi khác có thể sẽ được sử dụng để làm mịn.

Một công cụ phân tích lưu lượng truy cập có thể bao gồm:

a) Một máy phát điện mô hình để tạo ra một mô hình của lưu lượng giao thông trong khu web và

b) một công cụ phân tích lưu lượng giao thông để nhân giống đặc điểm của dân để profile đích web bằng cách dự đoán lưu lượng giao thông qua khu web.

Bộ sưu tập của Clickstream và dữ liệu khác

Một số trong những cách và những nơi mà thông tin được thu thập về người sử dụng và các trang web:

a) Trong khi mọi người đang đăng nhập tại cổng thông tin dịch vụ seo Website (như Yahoo)

b) Từ ISP thu thập thông tin, cần chú ý một ký-ins vào “hệ thống đáng tin cậy”, nơi có thông tin cấu hình (chẳng hạn như các mạng xã hội).

c) Từ ISP thu thập thông tin, nơi không có thông tin hồ sơ, nhưng một hệ thống dựa trên máy học có thể thu thập thông tin về sở thích của người dùng.

d) Từ thanh công cụ thu thập dữ liệu về người dùng (mẫu dựa trên người dùng thông tin)

e) Từ trang Web thu thập dữ liệu về khách truy cập (mẫu dựa trên vị trí của thông tin)

g) Thu thập từ dữ liệu đồ thị – những người sử dụng những cách có thể đạt đến một điểm đến bao gồm trình duyệt web, tìm kiếm, đánh dấu trang.

e) Trích từ dữ liệu cấu trúc trang web – từ một phân tích toàn cầu của một hoặc nhiều trang web và các cấu trúc của Uniform Resource Locators (URLs).

Một phân tích như vậy có thể tiết lộ rằng hai trang web có thể có cùng một chủ thể được liệt kê trong bản ghi DNS của họ, hoặc các trang web có thể sử dụng cùng một mẫu và do đó có khả năng có thể được quản lý bởi cùng một thực thể.

Tương tự như vậy, một trang web duy nhất có thể có hai phụ trang web được sở hữu bởi các cá nhân riêng biệt. Điều này có thể được tìm thấy bởi các công trình xây dựng cụ thể URL được biết đến như http://www.site.com/homes/jim, hoặc bằng cách phân tích các hành vi liên kết trên một trang web.

Cấu trúc của URL cũng có thể cung cấp một cái nhìn thứ bậc của sự gần gũi của URL. Ví dụ, http://www.site1.com/a/b và http://www.site2.com/a/c có chung http://www.site1.com/a tiền tố, và do đó có thể được xem là khá giống nhau.

Phần kết luận

Những tài liệu sáng chế cung cấp một cái nhìn vào cách một số dữ liệu thu thập được về cách mọi người sử dụng Web, và về Web riêng của mình, có thể ảnh hưởng đến cả hai tìm kiếm và quảng cáo trên Web.

Chúng tôi đã đưa ra một cái nhìn khác nhau nhẹ cách đây không lâu từ Google, trong sáng tạo của họ về cấu hình cho các trang web mà có thể được sử dụng, trong số những cách khác, để chống gian lận click – trong một bài tôi đã viết có tựa đề: Google tại Scene Crime: trang web Profiling , dự toán giao thông, và chống Click Fraud

Các phương pháp thu thập thông tin trong các ứng dụng bằng sáng chế, và sự sáng tạo có thể có của profile đích web như mô tả, sẽ làm cho việc sử dụng một tài khoản PageRank nhạy cảm nhiều hơn. Đó là một cái gì đó để xem xét.

Share this post


thiết kế logo theo phong thủy là rất cần thiết trong chiến dịch marketing quảng cáo video