顺风:全息搜索之“格式化”搜索原理刍议
文/顺风
格式化搜索,指对特定的语法、搭配、韵律、意境、结构等相关格式的搜索,如对“主谓宾”结构的语句搜索、对仄起五绝的搜索、对特定句式的搜索、对特定主题的章句搜索,等等。
格式化搜索反映了搜索的一个强大功能,那就是由抽象回归形象、从关系复原结构的功能。传统搜索主要帮助用户了解特定的搜索对象,而格式化搜索则帮助用户按照一定的格式、要求获得非特定的搜索对象,这还是一个相对空白的领域。
格式化搜索的前提是对格式的界定,相对于目前传统搜索服务商做作的将全网内容进行索引的庞大工作而言,格式化搜索也可视为一种补充,或者说在传统搜索对内容的表意进行了表面的结构化的索引加工后,格式化搜索还对所有的信息的“格式”进行了特殊的另外一个角度上的加工,侧重于对联系性的处理。中文传统搜索的切词断句和语义分析等方面经验构成了一些领先的搜索服务商的重要的技术优势,而格式化搜索的先发者同样可以积累类似的技术优势,但其内涵和外延都大大超越前者,因为格式化搜索涉及到对垂直领域、系统领域和文本领域等诸多方面的格式化工作,这是一项任务艰巨、规模庞大的工作。
格式化搜索在知识挖掘、教育改革、规律总结、未来探索、文史和文学研究等方面具有较大的优势,在经济和商业领域更因为其对商业关系和经济联系的优势而具有特殊的价值。因此说,这是一种从哲学高度寻找设计和开发起点的全新搜索。
格式化搜索将在搜索技术、搜索经验、搜索输出、搜索排序、搜索赢利模式等方面都造成几乎重大变革,这是一项有待开拓的工作。俗言道,“问题比答案更重要”,既然格式化搜索的命题已经摆在人们面前,那就让有志创新开拓的朋友去执着地探索吧。
你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=6723734