Tạo thống kê từ Search Engine kiếm Logs (mở cửa sổ mới)

Làm thế nào thống kê được tạo ra từ các bản ghi truy vấn người dùng có thể có ích cho các công cụ để tìm kiếm và tìm kiếm?

Một ứng dụng bằng sáng chế Google công bố của Tổ chức Sở hữu trí tuệ thế giới, hệ thống và phương pháp cho Tạo thống kê từ Search Engine kiếm Logs (mở cửa sổ mới), khám phá cách thống kê như vậy có thể được tạo ra.

Việc nộp đơn liệt kê Olcan Sercinoglu, Artem Boytsov, và Jeffrey, A. Dean là nhà phát minh và đã được đệ trình với WIPO vào tháng 9, 2007. Nó được công bố vào ngày 22 tháng 11 năm 2007, và xuất hiện để hiển thị các trình đằng sau Google Trends. Nhưng nó cung cấp nhiều thông tin hơn.

Một ví dụ thực tế cuộc sống mà mở rộng theo cách thống kê như vậy có thể có ích là một nghiên cứu được tiến hành với sự giúp đỡ của hai nhà sáng chế được liệt kê trong hồ sơ sáng chế, Ngôn ngữ ưu tiên trên trang web và tìm kiếm của Google cho sức khỏe con người và thông tin thực phẩm.

Dưới đây là một mô tả từ đó giấy của phương pháp họ sử dụng để tạo ra các khuyến nghị từ các trang web liên quan đến sức khỏe, mà kết hợp truy vấn thông tin từ Google:

Để ước tính tỷ lệ phần trăm của các nhà xuất bản dịch vụ seo website mà dịch các trang web y tế và thực phẩm của họ, chúng tôi đo được tần số mà các tên miền truy xuất bằng cách Google chồng chéo cho các bản dịch ngôn ngữ của cùng một thuật ngữ tìm kiếm liên quan đến sức khỏe.

Để định lượng lựa chọn ngôn ngữ của người tìm kiếm từ các nước khác nhau, Google cung cấp ước tính tốc độ mà công cụ tìm kiếm của nó đã được truy vấn trong sáu ngôn ngữ liên quan đến tiếng Anh cho các thuật ngữ “cúm gia cầm”, “lao”, “tâm thần phân liệt,” và “ngô” ( ngô) từ tháng 1 năm 2004 đến tháng tư năm 2006.

Ước tính dựa trên mẫu 20% của tất cả các truy vấn Google từ 227 quốc gia.

Truy vấn thông tin có thể được sử dụng theo nhiều cách khác nhau cho các mục đích khác nhau, và những người như các nhà khoa học xã hội hoặc nhà tiếp thị hoặc các chính trị gia có thể có những động cơ khác nhau và cần phải nhìn vào dữ liệu khác nhau. Các ứng dụng bằng sáng chế mô tả những gì một công cụ tìm kiếm có thể thu thập, và làm thế nào nó có thể được sử dụng:

Một công cụ tìm kiếm nhận được hàng triệu truy vấn mỗi ngày từ người dùng trên khắp thế giới sẽ tạo ra một bản ghi truy vấn trong log truy vấn của mình, trong đó có thể bao gồm các thuộc tính như:

Thuật ngữ truy vấn đệ trình,
Một dấu thời gian cho thấy khi truy vấn được nhận bởi các công cụ tìm kiếm,
Một địa chỉ IP xác định một thiết bị duy nhất (ví dụ, một máy tính hoặc điện thoại di động) mà từ đó các thuật ngữ truy vấn được gửi,
Một định danh liên kết với một người dùng gửi các thuật ngữ truy vấn (ví dụ, một định danh người dùng trong một cookie trình duyệt web,
Cho dù các định danh người dùng được liên kết với một thanh công cụ hoặc ứng dụng khác hoặc dịch vụ mà người sử dụng đã đăng ký.
Một ví dụ được đưa ra trong một sử dụng cho các số liệu thống kê có thể là một nhà xuất bản đo “sự nổi tiếng của một cuốn sách mới được phát hành trong một thành phố cụ thể từ các tần số của các truy vấn có liên quan gửi bởi người dùng từ thành phố đó trong một khoảng thời gian nhất định.”

Zeitgeist và xu hướng nóng

Chúng tôi đã nhìn thấy một số phân tích thống kê truy vấn này từ Google mô tả trong blog chính thức của Google trong một bài đăng từ Artem Boystov tiêu đề như thế nào, chúng tôi đã đưa ra cuối năm Zeitgeist dữ liệu

Như ông nói với chúng ta ở đó, các thông tin Zeitgeist không cho chúng ta tìm kiếm nhiều nhất với các điều kiện, mà là những người đã tăng từ một năm đến tiếp theo trong các truy vấn được thực hiện tại Google.

Chia sẻ thông tin này về tìm kiếm tại Google đã được mở rộng thuận với Hot Trends của Google, và xu hướng. Công cụ thú vị để xem xét nếu bạn muốn xem những gì các loại từ ngữ và tin tức là kịp thời, theo tìm kiếm Google.

Phân tích truy vấn trong Tài liệu lưu trữ bằng sáng chế dịch vụ seo khác của Google

Làm thế nào khác của Google có thể sử dụng thông tin truy vấn liên quan? Có một số hồ sơ bằng sáng chế của Google mô tả cách các công cụ tìm kiếm có thể được sử dụng thông tin đó để gây ảnh hưởng đến thứ hạng của các kết quả tìm kiếm. Dưới đây là ba trong số họ có giá trị một cái nhìn:

Tài liệu Scoring Dựa trên phân tích Query
Phương pháp và thiết bị để sử dụng thống kê sử dụng trong thu hồi tài liệu
Phương pháp và thiết bị dùng để xác định giới thiệu tương đương cho một nhu cầu thông tin
Một số khía cạnh của phương pháp mô tả trong việc nộp bằng sáng chế

Bảo vệ sự riêng tư – quá trình này cố gắng để bao gồm biện pháp bảo vệ để ngăn chặn việc tiết lộ thông tin có thể được truy nguồn từ các cá nhân hoặc nhóm nhỏ người dùng.

Ghi lại thông tin truy vấn – bộ phận khác nhau của những gì có thể được chứa trong một bản ghi truy vấn được mô tả, chẳng hạn như các thuật ngữ truy vấn, nhãn thời gian gắn liền với các tìm kiếm, địa chỉ IP được ánh xạ tới các thiết bị tìm kiếm đến từ, thông tin cookie hoặc thông tin nhận dạng người sử dụng khác, và có thể một cách để hiểu được ngôn ngữ kết hợp với một truy vấn.

Lấy mẫu Schemes – Đây có thể là không cần thiết phải xem xét tất cả các hồ sơ truy vấn kết hợp với một truy vấn, và các ứng dụng bằng sáng chế này mô tả một số cách khác nhau có thể lấy mẫu dữ liệu truy vấn đó sẽ chỉ liên quan đến việc tìm kiếm một tỷ lệ phần trăm của các dữ liệu – có lẽ 10 phần trăm đến 20 phần trăm. Mỗi truy vấn thứ năm có thể được xem, hoặc truy vấn có thể được chia thành các khu vực địa lý bằng cách sử dụng thông tin địa chỉ IP, và sau đó là một tỷ lệ phần trăm của những người có thể được thực hiện, do đó, có một sự đa dạng hóa các kết quả từ những nơi khác nhau.

Truy vấn Sessions – Số lượng hồ sơ truy vấn từ các địa chỉ IP cùng trong một khoảng thời gian nhất định có thể được hạn chế để tránh mẫu từ Nhưng, nhìn vào bản ghi truy vấn “bị hỏng bằng cách giả mạo dữ liệu truy vấn liên quan đến các hoạt động độc hại như truy vấn spam.” từ địa chỉ IP cùng có thể truyền đạt thông tin quan trọng. Ví dụ như:

Rất thường xuyên, một người sử dụng có thể gửi nhiều truy vấn liên quan đến các công cụ tìm kiếm trong một thời gian ngắn để tìm thông tin bạn quan tâm. Ví dụ, người sử dụng đầu tiên có thể gửi một truy vấn “nhà hàng Pháp, Palo Alto, CA”, tìm kiếm thông tin về các nhà hàng Pháp tại Palo Alto, California. Sau đó, cùng một người dùng có thể gửi một truy vấn “nhà hàng Ý, Palo Alto, CA” mới, tìm kiếm thông tin về các nhà hàng Ý tại Palo Alto, California.

Hai truy vấn được một cách hợp lý có liên quan kể từ khi cả hai đều quan tâm tìm kiếm các nhà hàng ở Palo Alto, California. Mối quan hệ này có thể được chứng minh bằng thực tế là hai truy vấn được đệ trình chặt chẽ trong thời gian hoặc hai truy vấn chia sẻ một số thuật ngữ truy vấn (ví dụ, “nhà hàng” và “Palo Alto”).

Hiểu Query Sessions – phiên Query có thể được xem trong thời gian rất ngắn từ người dùng cá nhân, giống như mười phút, với tất cả các truy vấn giả định là có liên quan, hoặc các phiên còn như hai giờ, khi các điều khoản đang được sử dụng xuất hiện có liên quan. Multi-tasking, khi tìm kiếm chắc chắn xuất hiện là không liên quan, chẳng hạn như một cuộc tìm kiếm một “apple ipod”, nơi các tìm kiếm khác là cho các nhà hàng ở Palo Alto, có thể được tách ra thành các phiên truy vấn riêng biệt, mặc dù họ sẽ tiếp tục được liên kết với cùng một người dùng và / hoặc thông tin cookie.

Truy vấn Extraction Heuristics – quy tắc hướng dẫn mà có thể được theo sau bởi quá trình này, chẳng hạn như một trong đó xác định rằng các truy vấn liên tiếp sẽ thuộc về cùng một phiên nếu họ chia sẻ một số thuật ngữ truy vấn hoặc nếu chúng được đệ trình trong vòng một khoảng thời gian xác định trước (ví dụ, mười phút) mặc dù không có thuật ngữ truy vấn chung giữa chúng.

Sử dụng Timestamps để Tổ chức Queries – timestamps khi phiên truy vấn bắt đầu (hoặc cuối) và các giá trị địa lý (từ địa chỉ IP) có thể là một cách khác để xếp đặt hồ sơ truy vấn, và có thể là usefrul cho tổng hợp thông tin về việc sử dụng các truy vấn. Xu hướng hoặc các ứng dụng Zeitgeist đề cập ở trên sẽ được hưởng lợi từ một tổ chức như vậy, mặc dù các thông tin có thể hữu ích trong nhiều cách khác, quá.

Phân vùng cho Query Session Records – những hồ sơ này là quá lớn đối với một máy chủ máy tính duy nhất để xử lý chúng một cách hiệu quả. Một PRECENTAGE tốt về việc nộp bằng sáng chế đi vào chi tiết về các chiến lược khác nhau để phân vùng các bản ghi truy vấn log, và tìm kiếm thông qua các thông tin đó. Nếu bạn quan tâm đến làm thế nào một số trong những phương pháp tiếp cận khác nhau có thể làm việc, các tài liệu bao gồm một số ví dụ mà có thể hướng dẫn bạn qua một số quá trình mô tả.

Giao diện cho thống kê liên quan đến khoản kiếm cụ thể

Các bằng sáng chế cũng cho chúng ta biết về cách họ có thể hiển thị một số số liệu thống kê về người dùng liên quan đến một thuật ngữ truy vấn cụ thể. Các ảnh chụp màn hình bao gồm không nhìn quá khác nhau từ tìm kiếm này Google Trends cho “ipod”.

Phổ biến trong các truy vấn theo thời gian – Chúng tôi có thể được hiển thị một biểu đồ hiển thị sự phổ biến của một thuật ngữ trong một khoảng thời gian cụ thể. Mỗi phòng trong số các điểm dữ liệu hiển thị trên một đường cong của thông tin mà có thể tương ứng với một tỷ lệ giữa số lượng người dùng đã nộp ít nhất một truy vấn liên quan đến cụm từ đó trong suốt một tuần cụ thể và số lượng người dùng đã nộp bất kỳ truy vấn trong tuần đó . Đỉnh và đáy trong đồ thị sẽ đề nghị rằng sự phổ biến của thuật ngữ thay đổi theo thời gian.

Tin tức bảo hiểm theo thời gian – đường cong khác có thể đại diện cho khối lượng tin tức về thời hạn trong cùng thời gian, với mỗi điểm dữ liệu trên đường cong nói với chúng ta về số lần xuất hiện của thuật ngữ trong tin tức của tuần đó.

Các thành phố, quốc gia, và Ngôn ngữ – Tabs có thể được hiển thị trong đó cung cấp thông tin thống kê về việc sử dụng các truy vấn cụ thể dựa trên các thành phố, quốc gia, và các ngôn ngữ. Dưới tab thành phố có thể là top 10 thành phố có số lượng người dùng lớn nhất đã nộp ít nhất một truy vấn liên quan đến thuật ngữ này. Những con số này có thể không thực tế số lượng người dùng tìm kiếm từ các thành phố, mà là aa giá trị bình thường. Sử dụng loại này có giá trị bình thường, chúng ta tìm hiểu về nơi làm gia tăng trong các tìm kiếm với các điều kiện cụ thể từ các thành phố hay quốc gia cụ thể hoặc trong các ngôn ngữ khác nhau đang diễn ra.

Phân loại theo thời gian hoặc địa – danh sách thả xuống cũng có thể được bao gồm trong đó phản ánh số liệu thống kê dựa trên các hồ sơ phiên truy vấn trong nhiều tháng nhất định, hoặc các quốc gia cụ thể.

Phần kết luận

Cũng quan trọng như chỉ số công cụ tìm kiếm của trang web có thể được, thì có thể nói rằng chỉ số của họ về thông tin phiên truy vấn có thể được chỉ là quan trọng, trong đó nó có thể cung cấp nhiều hiểu biết về những gì mọi người đang tìm kiếm, và làm thế nào họ cố gắng để tìm thông tin đó.

Thông tin về những người tìm kiếm, chẳng hạn như khi nào và nơi họ diễn ra, và làm thế nào chúng được sử dụng trong bối cảnh của phiên truy vấn có thể có ích cho các công cụ tìm kiếm, và cho những người khác – chẳng hạn như trong ví dụ của trang web sức khỏe liên quan nghiên cứu xung quanh mà tôi liên kết ở trên.

Có khả năng phân tích thông tin truy vấn người dùng có thể có ích trong việc cá nhân hóa kết quả tìm kiếm, trong thuật ngữ truy vấn có liên quan khác nhau, trong việc xác định chủ đề và điều kiện tìm kiếm kịp thời, mà là theo mùa, trong việc tìm hiểu làm thế nào mọi người có thể tìm kiếm các chủ đề khác nhau khác nhau, và trong nhiều cách khác.

Share this post


thiết kế logo theo phong thủy là rất cần thiết trong chiến dịch marketing quảng cáo video