Làm thế nào Google có thể Blend thông tin từ Feed Và chiết xuất dữ liệu Đối với Kết quả tìm kiếm

Trong kết quả tìm kiếm của Google, tùy thuộc vào truy vấn của bạn, khi nào và nơi bạn đang tìm kiếm, và những gì cài đặt trình duyệt và công cụ tìm kiếm của bạn có thể được, bạn có thể nhận được một bộ khác nhau của kết quả tìm kiếm hơn folks khác thực hiện tìm kiếm bằng cách sử dụng các thuật ngữ truy vấn tương tự.

Và những kết quả có thể bao gồm một hỗn hợp của các liên kết và hình ảnh từ các nguồn dữ liệu khác nhau bao gồm cả các kết quả web, hình ảnh, advertisments, doanh nghiệp địa phương, sách, sản phẩm, và những người khác.

Universal Search của Google cung cấp một hỗn hợp pha trộn của các kết quả mà kết hợp các kết quả từ một số respositories dữ liệu khác nhau vào cùng kết quả tìm kiếm.

Trong khi quảng cáo thường được phân đoạn từ các kết quả khác, phần còn lại có thể được pha trộn với nhau trên các trang kết quả. David Bailey, trên blog chính thức của Google, cung cấp một cái nhìn thoáng qua về cách những kết quả đã được pha trộn với nhau trong Đằng sau hậu trường với tìm kiếm phổ quát. Ông cung cấp một cái nhìn còn chi tiết hơn trong một bài đăng của khách tại Search Engine Land mang tên Xem An Insider của Google Universal Search

Sự pha trộn giữa các kết quả là thú vị, và chúng ta thấy pha trộn trên một quy mô nhỏ hơn ở những nơi khác ở Google, chẳng hạn như là một kết hợp của các kết quả tìm kiếm sản phẩm của Google từ nguồn cấp dữ liệu được cung cấp bởi các thương nhân và các thông tin từ các trang web thương mại điện tử được chiết xuất từ ​​những trang đó.

Một ứng dụng bằng sáng chế dịch vụ seo công bố gần đây của Google khám phá cách dữ liệu từ những nguồn cấp dữ liệu và trích xuất dữ liệu từ các trang web thương mại điện tử templated có thể được sáp nhập với nhau trong các kết quả tìm kiếm sản phẩm.

Đến cuối của ứng dụng bằng sáng chế, chúng tôi đang đưa ra một gợi ý rằng quá trình được mô tả trong ứng dụng bằng sáng chế này có thể có tác động đối với các loại thông tin và dữ liệu. Chúng tôi không cung cấp chi tiết hơn nhiều so với những điều sau đây, nhưng nó là một cái gì đó để giữ trong tâm trí.

Nó nên được đánh giá cao từ các mô tả trên đây của hiện thân mẫu mực của sáng chế mà nhiều điều chỉnh có thể có trong các phương án khác. Ví dụ, các phát minh có thể được sử dụng với các loại khác nhau của các cơ chế tìm kiếm, cơ sở dữ liệu và định danh mục (không chỉ là nhà cung cấp liên quan), chẳng hạn như tin tức, người / các mạng xã hội, Rao vặt, vv

Hơn nữa, trong khi các phương pháp mẫu mực để phân biệt giữa định danh mục thu được bằng cách sử dụng các phương pháp khác nhau đã được mô tả, những người có tay nghề cao trong nghệ thuật sẽ nhận ra từ những mô tả này mà các phương pháp khác nhau có thể được sử dụng mà không xuất phát từ tinh thần và phạm vi của sáng chế.

Các quy trình được mô tả trong vòng nộp bằng sáng chế này xuất hiện để hiển thị như thế nào dữ liệu từ các nguồn khác nhau có thể được pha trộn với nhau thành một loại kho lưu trữ hơn là làm thế nào dữ liệu từ các kho khác nhau có thể kết hợp với nhau thành Universal Search kết quả. Nhưng nó không có vẻ như nó giải quyết được một phần tiềm năng của câu đố – làm thế nào thông tin từ thức ăn và chiết xuất từ ​​các trang web thông qua các phương pháp khác nhau có thể được trộn lẫn với nhau.

Các phương pháp và hệ thống cho ra những kết quả tìm kiếm
Nhà sáng chế: Craig Nevill-Manning và Pearl Renaker
US Patent Application 20070244854
Xuất bản ngày 18 tháng 10 2007
Nộp: 26 tháng 1 2004

Trừu tượng

Hệ thống và phương pháp mà kết quả tìm kiếm đầu ra được mô tả. Trong một phương án, một công cụ tìm kiếm thực hiện một phương pháp bao gồm nhận một truy vấn tìm kiếm, xác định được đa số định danh mục đáp ứng các truy vấn tìm kiếm, xác định một nhóm đầu tiên của định danh mục từ đa số định danh mục, trong đó nhóm đầu tiên của định danh mục đã thu được bằng một phương pháp đầu tiên, xác định một nhóm thứ hai của các mục từ đa số định danh mục, trong đó nhóm thứ hai của định danh mục đã thu được bằng một phương pháp thứ hai, và gây ra các đầu ra của tất cả hay đa số các định danh mục, bao gồm việc cung cấp một cue để phân biệt giữa các định danh mục từ nhóm đầu tiên và các định danh mục từ nhóm thứ hai.

Thật khó để nói với một thời hạn sử dụng một ứng dụng bằng sáng chế hoặc bằng sáng chế có thể có bao lâu, và có hay không các quá trình mà chúng ta thấy được mô tả trong một nộp hồ sơ bằng sáng chế đã được phát triển và sử dụng, hoặc sẽ được phát triển, hoặc chỉ là những ý tưởng đã được phác thảo ra và không bao giờ có thể được sử dụng. Trong tài liệu này, việc tìm kiếm sản phẩm Froogle được nhắc đến, và chúng tôi biết rằng đã được thay thế bởi Google Product Search.

Có lẽ takeaway lớn nhất từ ​​ứng dụng bằng sáng chế dịch vụ seo website này liên quan đến một gợi ý về cách Google dự định lấy thông tin sẽ được sử dụng để pha trộn với nhau để hiển thị trong tìm kiếm sản phẩm của mình. Thông tin về sản phẩm, và chiếm các định danh và thuộc tính có liên quan đến những sản phẩm, có thể thu được bởi các công cụ tìm kiếm trong một số cách:

1) Các thông tin có thể đến trực tiếp từ các nhà cung cấp sản phẩm có mặt hàng để bán trong các hình thức của một nhà cung cấp thức ăn chăn nuôi (có thể thông qua trình Google Base), đã được lưu trữ trong cơ sở dữ liệu sản phẩm.

2) Các thông tin về sản phẩm có thể được tự động trích từ các bài báo hoặc các trang cung cấp các mặt hàng để bán, một lần nữa được lưu trữ trong cơ sở dữ liệu sản phẩm.

3) Các thông tin về sản phẩm có thể được tự động trích từ các bài báo đưa ra các mục để bán được tìm thấy trên Web tại thời điểm tìm kiếm.

4) Các thông tin có thể được chiết xuất từ ​​các trang trên web bằng cách sử dụng một phương pháp tiếp cận khai thác thông tin dựa trên mẫu được mô tả trong một ứng dụng bằng sáng chế google mà đã chưa được công bố (ứng dụng bằng sáng chế Mỹ Ser. Số 10 / 675.756 nộp ngày 30 tháng 9 , 2003).

5) Các thông tin cũng có thể được chiết xuất từ ​​các trang mà bao gồm các sản phẩm có liên quan đến các truy vấn tìm kiếm bằng cách làm theo một quy trình không được mô tả chi tiết nhưng có liên quan đến một ứng dụng bằng sáng chế không công bố (ứng dụng bằng sáng chế Mỹ Ser số. 10 / 731.916 [Luật sư Docket số GP-078-04-Mỹ, 53051/293400 nộp] 10 Tháng 12 2003).

Tôi sẽ giữ một mắt mở cho hai ứng dụng bằng sáng chế cuối cùng. Các phương pháp tiếp cận liên quan đến các mẫu đã cho tôi tự hỏi có bao nhiêu nó có thể giống như một ứng dụng bằng sáng chế của Yahoo gần đây liên quan đến sự hiểu biết liệu một trang đang sử dụng một khuôn mẫu hay không, khi nhìn vào các trang khác trên cùng một trang web để xem nếu có một mô hình mà sẽ chỉ ra các sử dụng các mẫu.

Phần kết luận

Tại sao một công cụ tìm kiếm sản phẩm sẽ sử dụng một sự kết hợp thông tin từ cả hai nguồn cấp dữ liệu dữ liệu và thu thập dữ liệu trang cần trích xuất thông tin. Chúng tôi nhận được một cảm giác về lý do tại sao trong một so sánh động cơ gửi từ năm ngoái, cựu DoubleClick Execs Khởi ShopWiki:

Dữ liệu nguồn cấp dữ liệu làm việc cho các trang web sẽ gửi cho bạn một nguồn cấp dữ liệu. Vấn đề là cái đuôi dài. Nếu bạn muốn được toàn diện, bạn phải thu thập thông tin. Câu hỏi đặt ra sau đó trở nên chúng tôi thu thập dữ liệu và lấy dữ liệu nguồn cấp dữ liệu. Nếu bò không hoạt động, chúng tôi sẽ không được chính xác. Nếu các công trình thu thập dữ liệu, tại sao chúng ta cần được cho bú dữ liệu?

Tôi đã nói ở trên rằng những ý tưởng trong các ứng dụng bằng sáng chế này, lấy thông tin từ nhiều nguồn và pha trộn nó với nhau có thể áp dụng cho nhiều hơn là chỉ tìm kiếm sản phẩm. Microsoft đã chia sẻ một số ý tưởng để chiết xuất thông tin từ các trang trong một bài báo mà nhìn vào cả hai tìm kiếm sản phẩm và một trang web thư viện học tập trực tuyến, trong một bài báo từ tháng Giêng, 2007: Object cấp Vertical Search (pdf).

Khai thác dữ liệu khác từ các chỉ mục các trang Web mà chúng ta nghĩ về truyền thống khi chúng ta nghĩ về việc tối ưu hóa trang cho tìm kiếm Web. Thay vì những lời chỉ mục được kết hợp với tài liệu trên web, dữ liệu được thu thập về các đối tượng, về thực thể có tên như những người cụ thể hoặc những nơi hay vật hay sự kiện. Có những sự kiện liên quan đến các đối tượng có các thuộc tính và giá trị của họ.

Đối với một sản phẩm, chúng tôi có thể có con số mô hình, kích thước, màu sắc, các nhà sản xuất, số ID sản phẩm, một SKU (chứng khoán số lượng kế toán), và các thông tin khác, mà có thể được thu thập từ nhiều nguồn khác nhau trên mạng. Chúng tôi có thể xem chi tiết sản xuất và đánh giá sản phẩm và xếp hạng, và địa điểm cho những đánh giá và xếp hạng và cho các nhà sản xuất.

Đối với một doanh nghiệp tại một địa điểm, chúng tôi có thể có thông tin địa chỉ, giờ làm việc, ngày mở cửa, các loại thanh toán được chấp nhận, đánh giá và xếp hạng và nhiều hơn nữa. Thông tin này có thể được thu thập từ nhiều nguồn khác nhau, bao gồm cả trang điểm màu vàng, các trang web loại thư mục, các trang web khác, bao gồm cả các trang web của doanh nghiệp. Nó có thể đến từ một nguồn cấp dữ liệu do các chủ sở hữu của một doanh nghiệp có nhiều địa điểm.

Nếu bạn không chú ý đến cách cụ tìm kiếm đang lấy thông tin từ các nguồn cấp dữ liệu và trích xuất dữ liệu từ các nguồn khác nhau, bạn đang bỏ lỡ một trong những khu vực phát triển của các công cụ tìm kiếm như thế nào hoạt động.

Share this post


thiết kế logo theo phong thủy là rất cần thiết trong chiến dịch marketing quảng cáo video