专利名称:一种互联网信息搜索聚合呈现方法专利类型:发明专利
发明人:李晓东,杨柳青,洪博,陈勇,耿光刚申请号:CN201410198228.6申请日:20140512公开号:CN103955529A公开日:20140730
摘要:本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则进行步骤3);3)根据该查询词利用所建索引进行网页检索,获得一候选结果集;4)将该候选结果集中的网页正文进行内容相似性对比,得到一系列的相似页面组{S1,S2,…Sk};5)对每一相似页面组Si,提取该组内所有网页的同质内容和差异化内容,并将其融合生成一新的页面Pi;6)将每一组Si及Pi作为应答内容返回,并保存到所述聚合内容库中。本发明可直接为用户提供有价值的信息服务。
申请人:中国科学院计算机网络信息中心
地址:100190 北京市海淀区中关村南四街4号1号楼
国籍:CN
代理机构:北京君尚知识产权代理事务所(普通合伙)
代理人:余长江
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容