Nhiều trang web liên quan đến các doanh nghiệp hoặc tổ chức cung cấp hàng hóa, dịch vụ hoặc thông tin liên quan đến người dân tại một địa điểm cụ thể, giống như vị trí của khách sạn hay văn phòng nha sĩ ở một thành phố nào đó, hoặc xây dựng quy chế cho một thị trấn cụ thể. Nhiều người tìm kiếm sử dụng các truy vấn tìm kiếm có thể không bao gồm thông tin địa lý trong một cách mà làm cho nó dễ dàng cho một công cụ tìm kiếm để giúp những người tìm kiếm tìm những trang web đó.

Nếu một công cụ tìm kiếm có thể hiểu được cho dù một tìm kiếm liên quan đến một vị trí địa lý cụ thể từ các truy vấn tìm kiếm, nó có thể cung cấp một tập hợp phong phú hơn các kết quả có chứa thông tin về địa điểm đó.

Điều này đúng bất kể có hay không các vị trí thậm chí còn là một phần của câu truy vấn. Ví dụ, nếu tôi tìm kiếm “pizza”, có một cơ hội khá mà tôi đang tìm kiếm một nơi pizza gần đó.

Điều này cũng đúng nếu tôi bao gồm một cái gì đó giống như một bước ngoặt trong tìm kiếm của tôi, chứ không phải là tên của một vị trí, chẳng hạn như một tìm kiếm cho “nhà hàng không gian kim,” tìm kiếm nhà hàng gần Space Needle ở Seattle.

Điều này có thể khó khăn, bởi vì một số truy vấn có thể dường như về địa điểm trên khuôn mặt của họ, nhưng không phải. Ví dụ, tìm kiếm cho “Phong cách New York bánh pho mát”, và rất có thể bạn muốn xem công thức nấu ăn, và không phải là trang về New York. Tìm kiếm “cà phê manhattan,” và rất có thể bạn muốn xem thông tin về các cửa hàng cà phê tại hoặc gần Manhattan.

Một bài báo từ Xing Yi của Đại học Massachusetts, và Hema Raghavan và Chris Leggetter của Yahoo! Labs, Khám phá cụ thể Geo Intention Users ‘trong Web Search (pdf), khám phá làm thế nào họ có thể sử dụng một chương trình phân tích ý định địa lý có thể hiểu hay không có ý định từ phía người tìm kiếm để xem các thông tin có liên quan về mặt địa lý như là một phần của kết quả tìm kiếm của họ. Chương trình này liên quan đến việc sử dụng của một “thành phố mô hình ngôn ngữ” mà tính toán xác suất mà một số từ và ngôn ngữ trong một truy vấn cho thấy một quan tâm đến thông tin cho một thành phố cụ thể.

Bản tóm tắt từ giấy nói với chúng ta:

Phát hiện người dùng ‘ý định địa lý cụ thể và tiềm ẩn trong tìm kiếm dịch vụ seo website rất có thể giúp người sử dụng thỏa mãn’ nhu cầu thông tin.

Chúng tôi xây dựng một hệ thống phân tích ý geo sử dụng giám sát tối thiểu để tìm hiểu một mô hình từ một lượng lớn các bản ghi web tìm kiếm cho khám phá này.

Chúng tôi xây dựng một mô hình ngôn ngữ thành phố, mà là một đại diện xác suất của ngôn ngữ xung quanh việc đề cập đến một thành phố trong các truy vấn web.

Chúng tôi sử dụng một số tính năng có nguồn gốc từ các mô hình ngôn ngữ:

(1) xác định tiềm ẩn geo ý định của người sử dụng và xác định thành phố tương ứng với ý định này,

(2) xác định xem địa ý định được cục bộ xung quanh vị trí địa lý hiện tại của người dùng,

(3) dự đoán các thành phố cho các truy vấn có một đề cập đến một thực thể mà nằm ở một vị trí cụ thể.

Kết quả thí nghiệm chứng minh tính hiệu quả của việc sử dụng các tính năng có nguồn gốc từ các mô hình ngôn ngữ thành phố. Chúng tôi thấy rằng

(1) hệ thống đã có hơn 90% độ chính xác và hơn 74% độ chính xác cho các nhiệm vụ phát hiện các thành phố ngầm ý định độ địa lý của người sử dụng

(2) hệ thống đạt được nhiều hơn 96% độ chính xác trong việc xác định các truy vấn địa lý tiềm ẩn là các truy vấn địa lý địa phương, các truy vấn địa lý khu vực xóm hoặc none-các

(3) các mô hình ngôn ngữ thành phố hiệu quả có thể lấy các thành phố trong các truy vấn địa điểm cụ thể với độ chính xác cao (88%) và thu hồi (74%); đánh giá con người cho thấy mô hình ngôn ngữ dự đoán nhãn thành phố cho các truy vấn địa điểm cụ thể với độ chính xác cao (84,5%).

Một số thống kê thú vị được đề cập trong bài báo:

13% các tìm kiếm liên quan đến một mức độ nào về ý định địa lý
50% các tìm kiếm liên quan đến mục đích địa lý không thực sự sử dụng một vị trí trong truy vấn (như tìm kiếm cho “pizza” hoặc “nha sĩ”)
84% của các truy vấn bao gồm các vị trí làm như vậy trên một cấp thành phố
Một số điểm thú vị khác từ giấy:

– Nếu một truy vấn với một ý định có liên quan về mặt địa lý là một trong những nơi mà vị trí không được nêu rõ, nhưng có thể được kết hợp với vị trí của người tìm kiếm, nó có thể làm cho tinh thần cho một công cụ tìm kiếm để xem các thông tin như địa chỉ IP (hoặc thông tin GPS nếu người tìm kiếm đang sử dụng một chiếc điện thoại di động) của người sử dụng để cung cấp các kết quả có liên quan tại địa phương.

– Một số truy vấn cho thấy một ý định địa lý có thể có một khu vực địa lý có liên quan đó là lớn hơn hoặc nhỏ hơn so với những người khác – người có thể sẵn sàng để đi du lịch chỉ có 10 dặm cho “pizza” nhưng sẽ đi 30 dặm một tốt “nha sĩ.”

– Một câu truy vấn với một ý định rõ ràng địa lý bao gồm hai phần – Địa điểm và phi địa điểm. Nghiên cứu các bộ phận không vị trí của những truy vấn rõ ràng có thể giúp một công cụ tìm kiếm hiểu các truy vấn mà phần vị trí không được bao gồm trong một tìm kiếm.

– Nếu mô hình ngôn ngữ sử dụng được một cách nhanh chóng đào tạo lại một cách thường xuyên từ truy vấn thông tin log và nhấp chuột, nó có thể giúp một công cụ tìm kiếm để thích ứng với những thay đổi theo mùa và cung cấp thông tin kịp thời, cho phép cung cấp câu trả lời thông tin vị trí để truy vấn như “bít tất đỏ tiếp theo trò chơi. ”

– Các chương trình phân tích ý định địa lý được mô tả trong bài viết này đã được huấn luyện với một tháng của Yahoo nhật ký truy vấn từ tháng 5 năm 2008, và thử nghiệm với một tháng của Yahoo nhật ký truy vấn từ tháng Sáu, 2008. Nó cung cấp một số thông tin chi tiết về các quá trình liên quan trong việc phát hiện hay không phải là một truy vấn có một số loại đích địa lý, và nơi mà các vị trí phía sau ý định đó có thể là.

– Trong tập huấn luyện của dữ liệu, khoảng 96.2 triệu truy vấn cấp địa thành phố của Mỹ đã được xác định. Trong set thử nghiệm, 96.700.000 truy vấn cấp địa thành phố của Mỹ được xác định. Nhìn chung, các nhà nghiên cứu tham gia vào nghiên cứu này tìm thấy 1614 thành phố khác biệt với các dữ liệu trong cả hai phần. Mô hình ngôn ngữ được tạo ra cho mỗi người trong số những thành phố này, để khi thông tin vị trí không liên quan đến một thành phố cụ thể được nhìn thấy trong một truy vấn, nó có thể được kiểm tra để xem nếu nó có liên quan đến thành phố đó (chẳng hạn như “không gian kim” là có liên quan đến Seattle, hoặc “Parade Macy” là có liên quan đến thành phố New York.)

Nếu bạn quan tâm đến làm thế nào một công cụ tìm kiếm có thể quyết định có hay không một truy vấn có một vị trí hoặc yếu tố địa lý với nó, bất kể có hay không các truy vấn thực sự khẳng định một vị trí cụ thể, bạn có thể muốn dành một chút thời gian với giấy này.

Nếu bạn có một trang dịch vụ seo web mà cung cấp hàng hóa, dịch vụ hoặc thông tin gắn với một địa điểm cụ thể, các quá trình được mô tả trong bài báo này là một số mà có thể giúp tìm kiếm đứng một cơ hội tốt hơn trong việc tìm kiếm trang web của bạn trực tuyến thời gian tiếp theo mà họ tìm kiếm cho “văn phòng luật sư , “hoặc” cắm trại gần công viên Shenandoah, “hoặc” Macy Parade Hotel “, hoặc sử dụng một số truy vấn khác có thể liên quan đến một ý định địa lý mà không bao gồm một vị trí thực tế.