|
這些和類似的特徵可用於基於出現在網頁上的單字對網頁進行分類。也可以想像的是,可以對這些文件進行註釋,以便可以使用分類資訊將它們與網頁相關聯。 將查詢的主題資訊與搜尋結果中出現的頁面的分類資訊進行比較,以確定頁面是否: 它與特定主題相關嗎? 是垃圾郵件嗎? 是否與主題無關或偏離主題? 儘管某些頁面可能包含查詢中使用的關鍵字,但這並不一定意味著這些頁面與查詢本身屬於同一主題。
因此,該專利解釋說,用戶輸入的資訊也用於為決策提供資訊: 點擊率– 在查詢的搜尋這些頁面在該查詢中出現的頻率。 點擊時間-使用者在搜尋引擎上被發現後造訪該頁面時在該頁面上停留的時間。 也可以使用其他未指定的相關導覽行為來確定頁面是否與基於 以色列 WhatsApp 號碼數據 使用者行為給予文件的分類相關聯。 基於主題的分類和點擊資訊的組合用於識別頁面是否與主題相關、偏離主題或垃圾內容。與主題相符的文件將被推送到搜尋結果中,而偏離主題或垃圾郵件的文件將被降級或從搜尋結果中刪除。 專利資訊: 基於使用者輸入資訊對文件進行分類的方法與裝置 發明人:吳軍、馮正珠、郭曲吉、錢哲 受讓人:Google 美國專利申請號碼:7,769,751 公開日期:2010年8月3日 提交日期:2006年1月17日 概括 如果該專利得以實現,將創建一個根據使用者輸入的資訊自動對文件(網頁等)進行分類的系統。
在運作過程中,系統會取得一系列「機密」文件。本文檔已被歸類為與特定主題相關。系統也會檢索與特定主題相關的查詢。這些查詢產生「查詢結果」。該查詢的結果允許使用者存取與該查詢相關的文件。 該查詢還包括「點擊資訊」。此資訊標識一個或多個使用者如何存取查詢結果。系統使用此點擊資訊來識別與一組分類文件無關或偏離主題的文件。一旦識別出此類文檔,系統就會移動所識別的文檔,以便將它們視為離題/垃圾郵件,並從機密文檔集中刪除這些文檔。
|
|