垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的健康网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,再以搜索的方式满足用户的需求。
垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。
垂直搜索引擎的技术评估应从以下几点来判断
1.更新性
2.全面性
3.功能性
4.准确性
垂直搜索引擎大体上需要以下技术
1.Spider
2.分词、索引
3.网页结构化信息抽取技术或元数据采集技术
4.其他信息处理技术
垂直搜索没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的健康网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,再以搜索的方式满足用户的需求。
垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。
垂直搜索引擎的技术评估应从以下几点来判断
1.更新性
2.全面性
3.功能性
4.准确性
垂直搜索引擎大体上需要以下技术
1.Spider
2.分词、索引
3.网页结构化信息抽取技术或元数据采集技术
4.其他信息处理技术
垂直搜索没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。
