首页 | 博客群 | 公社 | 专栏 | 论坛 | 图片 | 资讯 | 注册 | 帮助 | 博客联播 | 随机访问
顺风:转发8岁女儿最新诗作- -| 回首页 | 2008年索引 | - -顺风:全息搜索的特征(4篇)

顺风:全息搜索原理(7篇)

                                      

顺风:全息搜索原理(7篇)

文/顺风

谈全息搜索中“全息算法”的创新原则

按照“搜人”第一的原则,对于“人”和“关系”的搜索重于对于内容的搜索,由“人”和“关系”构成的“搜索环境”重于作为搜索工具的搜索引擎,大众和用户的参与重于搜索引擎技术,模式开发在全息创业中的地位重于技术开发,全息路径的后台优化重于页面输出、无动机搜索重于目的性搜索……上述区别决定了全息搜索相对于传统搜索体系的人性化特色,也决定了全息搜索成为一条完全区别于传统搜索模式的创新体系。但是,全息搜索在技术方面减少依赖并不代表丧失了独立的商业秘密,他的不可复制性不在于结构和模式,而在于隐藏于用户感受之后的大量的网络运算流程,全息算法是在全息模式的基础架构之后最大的宝藏。

传统搜索引擎基于网页分析和内容语法处理等方面积累的经验隐藏于用户感受之后成为核心的竞争力资源;全息搜索基于全息分析的算法体系则构成了一种更加超越的竞争力资源,而且与前者相比他具有更加强烈的大众智慧的色彩,以全息结构组织大众参与来开发全息算法,是全息搜索体系的创新。

全息算法体系遵循的原则包括:

(1)“相似性原则”,“全息相似”可以初步得出很多有价值的全息路径;

(2)“模糊性原则”,全息匹配更多情况下遵循没有特定目的随机匹配,对于 搜索结果不求过渡精确;

(3)“层次性原则”,全息相似、全息风暴等重要的全息算法一般在纵向不超过三个层次以上,而在横向则由用户自主选择;

(4)“分解性原则”,全息搜索算法积累、数据积累和经验积累都分解到不同的流程和空间通过相互间有效的数据交换形成统一的搜索智能;

(5)“搜人第一”原则,通过对于“个人化信息”及其全息关系的发掘利用来完善搜索环境、组织用户来进行搜索系统的自处理和自优化,“人”比“内容”更加重要是全息搜索的核心原则。

(6)“人机协同原则”,“用户参与和用户控制”与“机器运算和自动匹配”相结合,形成机器智能因人而进化、用户功能因机器而提升的人机互动、互助的搜索机制。

全息搜索环境优化中的竞争博弈策略

传统搜索系统中搜索引擎所代表的技术力量单兵突进、一支独大,而“搜索环境”和“搜索用户”这另外两大构成则严重萎缩,传统搜索服务商缺乏足够的目光和意识加大对于完善搜索环境和调动用户参与的投入,以致“搜索引擎”、“搜索环境”和“搜索用户”三个系统构成无法平衡发展,正如一个三角凳,一条腿越来越长,相对而言另外两条腿却日渐萎缩,在这样的凳子上用户怎么可能坐得稳呢?

换举一个例子,在一片荒芜的秃山中生存的原始人为环境所迫必须锻炼自身强大的野外生存能力,他甚至可能用一把木刀砍下很粗的树枝;而在水电暖等生活设施齐全、社会分工充分发展的现代城市中,文明人可能不具备以木刀砍下粗树枝的技能,但是因为社会化的协同分工,因为具备良好的外部生存环境,文明人照样生活得很好。相反,如果原始人凭着在恶劣的环境中积累起来的强大的生存技能进入一个完善、舒适的现代生存环境,他的原有的技能也许在荒山秃岭中可以让他在同类人群中自豪,可是对于文明人而言则毫无价值,原始人必须重新学习才可以适应进步的环境。反之,文明人抛弃了完善舒适的外部环境去荒山秃岭生存本身就是一个错误,他大可不必到那里学习所谓“木刀砍树枝”的技能,因为那对他而言既不是特长也没有意义。

传统搜索引擎技术转换一下外部环境,就可能成为“木刀砍树枝”的技能,而全息搜索就是要以搜索环境优化和用户参与控制来推动这一进程。试想如果被搜索网站或者页面能够具备更大的索引属性、具有更多的结构化标注、获得更自由的搜索反应、辅之以更完备的关系机制、结合以更加开放达到人性化的搜索协议和标准,那么搜索引擎面对一个大大优化了的环境的结果,难道不很可能会导致现有的搜索引擎技术成为“杀鸡的牛刀”吗?对于“杀鸡”这样的任务而言,“牛刀”的价值和意义又何在呢?所以说,全息搜索对于传统搜索的竞争是通过改变游戏规则和游戏环境来进行战略设计的。

恶劣的搜索环境下的搜索“百米赛”,传统搜索商已经跑出了30米甚至更远,后发的选手怎么可能追赶?就以中文搜索竞争而言,搜索领先者在中文语法处理、切词分词、搜索引擎技术完善等方面已经做到一个专业化的极致,后来者不改变游戏规则显然没有出路。因此,面对既有的“30米的差距”,全息搜索提出将“百米赛”改为“千米赛”甚至“万米赛”,引取“搜索环境”、“用户参与”两大新的竞争项之后,“30米的差距”就不再象原来那么可怕了。

柯达早在几十年前就发明了数码成像技术,但是为了维护当时在银盐成像技术市场中如日中天的垄断利益,柯达将数码成像技术尘封了数十年,直到来自外部的数码成像市场已经充分发育并且对其构成强大冲击,才被迫进行技术上的战略转性型。在目前占据强大优势地位的传统搜索服务商的立场上,听任或者主动推动“搜索环境”、“用户参与”两大新的竞争项成为竞争现实,不啻于柯达在刚发明数码成像技术之初就将他付诸商业化生产,意味着在传统搜索引取开发、服务器购置、人才储备等投入方面,在既有的用户习惯和体验、搜索服务品牌等积累方面,都产生巨大而不可预料的损失,因此传统搜索服务商对于全息搜索具有先天的拒绝和排斥的心理,两者的融合需要克服巨大的逻辑障碍、既得利益障碍和文化心理障碍。因此,全息搜索必须以独立的系统创新意识,以穿越“雷区”和“无人区”的胆魄和决心,开展基于“搜索环境优化”和“用户参与机制”的、包括搜索引擎技术创新在内的三大创新研发,全息搜索必须成为一项独立的、社会化的崭新事业。

也谈搜索结果的输出项扩展

搜索结果属于搜索界面的出口,其构成、形式、内容直接决定用户的终极体验,为了顺应关系搜索、互动文本搜索、延伸搜索、深度搜索、联系搜索的新要求,搜索输出项需要进行完善和扩展。

一、搜索输出项的升级

搜索输出项属于人机对称界面的中间环节,其升级主要包括两大任务:优化和扩展。优化是针对现有输出项进行结构和效率等方面的挖潜改造完善,可以视为搜索资源的内部挖掘;扩展是针对搜索发展趋势和用户需求而进行的从质到量、从形式到内容、从内部到外部、从战略到细节的各类输出项的综合创新。

二、搜索输出项扩展的目的和作用

1、搜索输出项扩展改变传统搜索的无限扩展和有限质量的现状,形成更加面向用户、更加深入、更加直接有效的搜索服务。

2、搜索输出项扩展是搜索智能的重要路径,也是搜索全面影响互联网流程的全新路径。

3、搜索输出项扩展是搜索向2.0升级的必要构成,也是影响搜索流程、搜索价值链、搜索产业、搜索主客体的主要方面之一。

4、搜索输出项扩展是动态的和不确定的过程,扩展的力量来自搜索的发展趋势和用户需求、用户意志,搜索的个性化输出将成为搜索产业竞争的新制高点。

5、搜索输出项扩展将推动搜索技术对人类社会知识信息的重组和再加工机制,也将推动人类社会知识信息的自我繁衍和再生产。

三、搜索输出项扩展的原则

一是综合性原则。与搜索目的面向信息、个体、关系、价值相对应,搜索输出项将从目前的侧重信息和新闻内容向可以搜索的所有对象扩展,与之相适应的,也将产生搜索社会化分工的内在要求和必然趋势。所以可以说,搜索输出项扩展既是搜索技术的社会化,也是搜索产业链的社会化。

二是纵深性原则。搜索输出项扩展的目的是为了形成区别于传统普遍搜索思路的全新的直接面向深度需要的专门搜索,在主体、客体、流程、价值分享等方面都体现出相当的系统性,与传统搜索输出项相比,扩展搜索的输出结果将表现出更加鲜明的专题化、个性化、专业化和体系化。

三是有限性原则。搜索输出项扩展的是对无限信息的有限加工输出,因此必须通过更加精细化的后台算法和对用户数据的个性化匹配,按照内容的字外组织原则和联系搜索、关系搜索、互动搜索的要求,形成内容量有限、质量高端的搜索输出。

四、搜索输出项扩展的要求

一是扩展的目的性明确,直接而且唯一的服务于个人;

二是扩展的对象清晰,对于搜索输出的形式、内容、结构、效率等进行结构化设计;

三是扩展的产业属性强烈,直接联系搜索业内竞争格局的改变,双方互为作用;

四是扩展的产业派生性具体,与之相配套的将发生深入的社会分工,随之诞生一批全新的搜索配套服务商,改变目前搜索服务商“大而全”。从这个角度看,搜索输出项的扩展也会带来搜索产业链的扩展和开放。与行业垂直搜索一样,功能配套型的扩展搜索也将兴起。

五、搜索输出项扩展的服务类型

1、顾问型搜索。根据于对搜索深度、广度、时效性的不同要求,通过商业定制和差异化服务,为高端搜索需求提供长年专业的顾问型服务,最终实现搜索引擎的高度智能化服务,将搜索引擎转变和升级为搜索机器人。

2、咨询型搜索。针对用户研究、娱乐、生活、随机等特定需求,形成系统而有针对性、匹配性的专项咨询搜索,提供用户可控制的搜索输出项分级服务。

3、资料库搜索。对现有搜索资料库、知识库进行完善、扩展的同时,通过特定的搜索算法和资料组织体系,因如个人化的力量和人性的因素,变静态的、僵硬的、被动的搜索资料库为动态的、灵活的、主动的搜索资料库,全面提升搜索资料库的自我学习和自适应能力。

4、学术型搜索。针对专业学术研究人员的特定需求,通过搜索输出项扩展提供与学术研究的全面信息,包括学术动态、学术资料库、学术关系、学术活动、学术论坛、学术评级、学术测试、学术互动社区等各有关方面,进而形成动态变化的个性化学术搜索网站。

六、搜索输出项扩展的主要内容

搜索输出项扩展的主要内容包括输出效果、输出效率、输出项目、输出类型、输出结构、输出更新、输出传递、输出链接组织、输出方式、输出流程、后台支持、输出逻辑、用户控制平台、输出历史记录、输出分析、输出管理机制、输出组织管理、输出方向、输出时效、输出监控、随机输出机制、输出量、输出评价等若干方面,共同构成搜索2.0的重要组成部分。

全息搜索中的“搜人”第一原则

在搜索“内容”和搜索特定的“人”之间,孰轻孰重?在全息搜索体系下,“搜人”是第一位的目标,这也是其区别于传统搜索的重要方面。

传统搜索模式是面向对象的搜索,也是以内容为主要对象的搜索;而全息搜索模式中的搜索对象则包括了“人”、“内容”、“行为”、“联系性”等多个扩展的层面,并且全息搜索模式是面向对象之间的联系——全息关系——的搜索,是通过发现、挖掘饿优化全息关系来得到更加精确的搜索对象。可见,全息搜索在搜索流程、搜索目标方面都和传统搜索有内在区别。

“人”、“内容”、“行为”、“联系性”等全息搜索的不同对象中,最重要和最核心的对象是“人”,以对于人的搜索来驱动对于“内容”、“行为”、“联系性”等其他对象的搜索,是全息搜索的重要远。

“人”是互联网中最具备全息性的存在体,人也是互联网的主宰,人更是全息关系的生产和消费主体,通过对人的搜索,可以架设起一座对于诸多对象的搜索之桥。

在全息搜索中,内容不应该是生硬冰冷的被动的存在,而是通过与人的结合成为活跃、生动的生命力的载体,所有内容都因为与他发生全息联系的“人”的明晰化而诞生出全新的声明,内容是活的——或者说,全息搜索不象传统搜索那样以“死”的“内容”为主要的搜索对象,而是先通过对于“人”的搜索使“内容”“活”化,进而实现“活”的“内容”的搜索。

“语义网”的设计思维也是希望让内容“活”化,但是主要是通过对于互联网的语法的整体性重设、从技术整体和标准的总体性出发来让内容具备更加强的被理解性;全息思维则不紧急侧重于技术“激活”内容,而是直接解决内容的“活力”重塑的问题,以人对于内容的作用来“激活”内容。

全息搜索是以“人”在全息机智下的系统力量来改善搜索环境、激活搜索对象,据以对抗传统的“搜索引擎”单一主导的搜索系统。在一个完整的搜索系统内,“搜索工具”“搜索环境”“搜索主体”是具有互补性的三大构成,传统搜索基本忽略了“搜索环境”、“搜索主体”的意义,一味依赖作为搜索工具的“搜索引擎技术”来保证整个系统的威力和效率,可惜越是按照这样的思路发展,最终越是加剧整个搜索系统的生态失衡。

单一的搜索引擎的开发和完善并不代表全息搜索的全部,形成完善的搜索生态才是全息搜索创业所面临的核心任务,而作为“搜索主体”的“人”是其中最革命的要素,因此对于“人”的搜索,构成全息搜索的第一原则,这也是全息搜索与传统搜索的重点区别——一种从面向内容、搜索引擎主导向面向“人”、用户主导的全面转变。

浅论深度搜索综合分析的四大领域

从发展趋势看,“深度搜索”将成为新一代搜索的核心特征,搜索最终将成为直接面向对人类社会关系的全面搜索。从目前搜索功能的宏观发育阶段看,基本还停留在数据库基础建设和流程挖掘层面,搜索输出处于一种浅层的对搜索结果的初加工结果,但在不远的将来,搜索必然向搜索流程的多次加工和搜索输出项的个性化方向演进。在竞争中即将出现出现的搜索升级,其核心特征是从浅表搜索向深度搜索的进化,分词、切词技术、内容相关性分析、内容归类等搜索的技术逻辑必须通过深度分析和综合分析为上述革命提供支持。总体而言,笔者认为搜索的综合分析包括以下方面:

一、搜索的用户分析

用户分析的目的:了解用户搜索喜好、习惯、目标、心理、个性、知识、行为、专业、交往、创作等方面的基础信息,据以确定更加个性化的搜索指向、搜索输出项、输出界面、搜索所进入的分类数据库、搜索的性质界定、搜索结果的定量定性以及差异化服务中的搜索费用确定等,用户分析使搜索结果从目前输出项千篇一律向多样化转变,使搜索起点从共用大型蜘蛛抓取数据库向复杂分类数据库和搜索过程数据库转变,使搜索内容从知识信息的简单构成向知识、信息、关系、逻辑、技术等方面的复杂构成转变。搜索的“用户分析”视其结构要求,可以分为用户许可分析和非用户许可分析;搜索“用户分析”技术遵循过程封闭和自动输出原则,搜索服务商的工作人员不得介入和调用具体搜索过程信息并且接受第三方监督,以充分保护个人隐私。博客、SN等2.0形态构成搜索用户分析的重要基础,或者可以说搜索用户分析是互联网进入2.0时代所必然出现的趋势性事件,搜索与博客等的相互作用既互为基础也互为因果,紧密联系而构成互联网2.0时代的全息特征。

二、搜索的流程分析

搜索流程分析包括搜索引擎流程分析、用户搜索流程分析、信息流分析、注意力流分析、评价流分析、信用流分析、价值流分析六大部分,分别从搜索服务商内部流程、用户围绕知识心理消费娱乐等不同目的进行的搜索综合流程、信息和内容组织机制及其流程、受众浏览阅读流向、网络价值的开放性评价信息流、个人信用流向等角度构建第二代搜索系统的未来帝国。由上可知,第二代搜索是基于互联网全面迈向

2.0时代的内在要求,而在个人参与性、个人价值实现性、个人关系自组织性、个性搜索等方面实现全面突破的一个全新的搜索系统,他远远超出了现有搜索体系的范畴,属于一种建设于互联网全面变革基础上的开放型搜索系统。他既是技术体系,也是文化体系,更是价值体系,同时还是一种全新的全息文化体系。

三、搜索的文本分析

现有搜索文本分析的对象基于传统互相联网的信息结构和秩序而设计开发,随着技术进步和网络、社会的全面升级,搜索文本分析的未来必须重视以下必然发生的趋势变化:一是文本互动性增强后给搜索带来的全新内容环境;二是3G移动技术对于搜索目标内容的形态、搜索用户的行为、搜索流程的开放性、搜索商业价值分配格局等方面的影响;三是关系文本、互动文本、深度文本、联系文本的四大变革将给搜索带来的要求(笔者将另文论述);四是传统媒体必然发生的纸媒介质向电子纸张介质的升级;五是个人越来夜深入的融入技术、传播和内容信息,现实与互联网越来越交融,将给搜索带来新的要求;六是个人化、个性化的搜索需求将不再仅仅局限于文本搜索,那么在与关系搜索、个性搜索、职业搜索、产品搜索、管理搜索、人的搜索等众多门类并存不悖的时代,文本搜索应该如何寻找自身的合适定位,如何定义和认识自身在搜索服务体系中的作用?

四、搜索的关系分析

搜索的对象从内容向其他很多方面扩展,是搜索融入生活的必然结果。搜索服务于个人的生存、娱乐、交往、学习、工作、自我实现等的同时,对个人、个性、个人价值的搜索总和共同构成了关系搜索。“关系搜索”的核心工具之一在于搜索的关系分析,具体必须对于内容与人、人与人、内容与内容之间的逻辑关系、结构关系、制度性关系、利益关系、历史关系、社会关系等进行全面深入的关系分析。搜索的关系分析的目的,直接服务于社会化搜索和个人化搜索的双重目标,直接贴近于网络和现实中的社会生活的各个细节,直接着眼于网络与现实的融合,直接着力于内容、个性、商务、沟通等开放维度的全息运用。

综合而论,搜索的用户分析、流程分析、文本分析、关系分析共同构成搜索综合分析的主系统,而用户分析在新的搜索竞争时代将成为其中最基础性的子系统,流程分析将顺应互联网与现实的融合趋势发生

最革命性的变化,文本分析将在综合搜索分析时代走进深度创新和内涵挖掘的发展阶段并且接受其他搜索门类的全新挑战,关系分析能力将决定最高水平的搜索力进而决定全新的搜索竞争力量对比。
全息搜索系统中网页重要性排序的思路
传统搜索将网页所指向的链接体系进行比较,在此基础上对搜索结果排序,但是这一思路属于在搜索环境极度恶化的传统搜索系统中不得以而为之的选择,传统搜索系统无法直接得出页面对于用户的重要性,只能够从大众的和宏观的立场寻求可间接量化的数据支持或者说链接出路,粗略而大致的保证搜索结果排序的准确性。

但是,传统搜索结果排序对于用户价值判断是基于一种间接而得的整体性价值比较,正是因为传统搜索缺乏个性化数据,无法针对用户的个人化需求判断页面的价值,所以搜索结果排序越来越和千变万化的不同搜索用户需要相脱节。我们固然可以把传统搜索排序看作一种社会化的价值排序,更加侧重于页面在整体的网民行为中的价值比较;我们现在更要重视一种在社会化价值分析基础上引入个人化需求因素的个人化价值排序,这就是全息搜索体系中的关系性排序。

关系性排序是通过用户自身的网络生存及其关系资源,直接将用户的全息关系作为判断网页重要性的基础,其中“网页重要性”不再象传统搜索引擎那样面对同样搜索关键词得出的搜索结果千篇一律,而是在对同样的词搜索后不同的用户出现不同的结果,排列顺序既适当保留和考虑社会化的链接性价值,更充分考虑用户本身的需求、素质及其社会关系的因素,决定页面重要性的不再仅仅是内容和链接等“死”的因素,而要引入更多用户行为、用户关系等活的因素。

在全息系统中,同样的事物对于不同的用户具有完全不同的价值和重要性,并且能够尽可能的予以清晰和界定。一般而言应该有两大关系标准,一是用户内部关系标准,比如与用户的最近的、最急迫的、最核心的、投入产出比最高的、最内涵性的需求相关的事物或者页面,应该获得更大的重要性权重;二是用户外部标准,比如对于用户最核心的、有好感的、深度沟通或者接触的、协调分享价值的好友们更加重要的事物或者页面,应该获得更大的重要性权重。

在两大关系标准以外还设置了一系列的辅助标准,比如用户对搜索结果进行判断和选择时反映出的页面意义、用户在参与搜索流程中所依赖的用户信用值、用户关系圈子的逻辑凝聚度、用户特殊性所带来的关系噪声等等,这些都构成关系型页面排序的系统要素。

全息搜索中的关系型页面排序相对于传统的基于链接和内容的页面排序而言,在技术实现方面的要求更低,在用户调动和参与、控制方面走得更远,在个人化用户体验方面更加动态和精准,在搜索环境优化方面的贡献更大,在数据基础方面更加系统和立体,这一思路提供了关于“page rank”以“用户关系”为基础的另外一个方向,其中最大的意义是打通了关系和内容的通道,让他们共同服务于搜索系统流程的各大环节。

也谈决定搜索内容细分策略的八个方面

正确的内容细分策略主要取决于以下八个方面:

1、对于深度搜索的关系搜索、互动搜索、延伸搜索、联系搜索四大属性的理解程度;

2、对于目前搜索巨头在搜索发展历史中所处的初期发育阶段定位的认识;

3、对于搜索作为技术、文化、价值三位一体的全息服务本质的把握;

4、对于个人、个性、个人价值与互联网的关系的深刻认识;

5、对于以信用积累、价值评判、内容细分、个人自组织、流程分析为抓手的新一代搜索体系的把握;

6、对于在内容和个人、关系之间进行自如的价值、注意力、模式切换的设计能力;

7、对于搜索流程中的公共领域隐私保护机制的自觉尊重;

8、对于博客、SN等新模式的整合吸收能力。

【作者: 顺风】【访问统计:】【2008年02月13日 星期三 22:44】【注册】【打印

搜索

Google

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=6626588

回复

验证码:   
评论内容: