向量空间模型法。
向量空间模型法〔760101 813306 1110( 1,丫31\1〉与最近邻法类似,亦基于相似度的基础结果,从对应知识库中检索出与用户知识需求最接近的知识对象并提交给知识用户。所不同的是,向量空间隹型法中的相似度通过单一模式的“向量余弦值”作为量度,两个向量间的余弦值足够小,则表明彼此间足够接近。
实际运作中,对知识库中的每一知识对象建立其特征向量(在知识获取或建立知识推送模型时建立)7 :…,[,…, 仍“其中’见是该知识类型标识’可以是政务知识子库标识,也可进一步附加子库内的聚类索引标识。一般而言,当知识类型标识相同时,采用同一知识特征向量框架来统一描述该类知识对象。同一类别中的各知识对象的具体差异则由与知识特征向量相对应的权重向量&
…,队,10〉⑴忘叫矣1,[叫:1〉来区分,某一知识对象所对应的几维权重向
量即为该知识的特征视图。用户在提交查询要求时,首先确定所要查询知识的类型特征,10确定后由系统通过人~机接口基于知识特征向量框架自动生成用户需求向量框架,由用户对相应向量分量直接赋值,系统负责归一化检验,最终完成用户需求视图的建立及 (士,名,…,尤,叩丨⑴莓4姿1,工木 0。此时,用户需求视图与知识特征视图间可通过对应向量的数量积公 3心丨丨斯I⑶呻建立联系,㈨坤即为两者间的视图相似度,即
〔3〉模糊( )检索算法。
对于检索算法的设计,检索结果的精确性是一个基本要求。然而,在现实中模糊性与不确定性则是人类思维与客观事物的普遍特性。正如焦玉英等人归纳的那样,基于二值逻辑乃至多值逻辑基础的检索系统存在大量模糊因素;知识用户在表达其知识需求时,由于主客观条件的限制,不确切性和模糊性普遍存在;用户所表达出来的需求视图各方面显示的重要程度与其实际需求的重要程度往往存在差异;人类通常使用的自然语言能够表达不确定性和模糊性,使用接近自然语言的模糊语言进行检索更符合用户习惯。1965年,札德(。迅123( 10提出的模糊集合([瓜巧紀炫)理论,在各领域得到了广泛应用与发展,包括将其应用于对信息与知识的检索过程。目前,基于模糊理论的知识检索巳成为传统检索方法的重要补充。
建立合适的隶属度函数是模糊检索算法的核心,其对于灵活、准确表达用户知识要求以及提高知识检索的查准率与查全率意义重大。由隶属度函数计算
(未完待续) 声明:部分资料来自合作媒体及网络,不代表本站观点。关键字:知识,向量,用户,检索,模糊