(辽宁地质工程职业学院 辽宁丹东 118008)
摘 要:本文将着重对网络信息检索中关于数学查询语言与索引进行研究分析,并提出一些建议.
关键词:网络 信息检索 数学 查询语言
中图分类号:G633.6 文献标识码:A 文章编号:1674-098X(2011)7(c)-0000-00
1. 网络信息检索
1..1网络信息检索系统产生的原因
现代计算机技术以及信息技术的不断发展进步,网络信息也迅速的增长,并且内容涵盖了人类社会的各个领域.在人们用互联网进行信息搜索的时候,由于网络信息量大、范围广,导致各种信息就如同堆放在无人看管的仓库中,凌乱不堪.在这种情况下,人们想要快速方便的找到自己所需要的信息,无疑是一种很大的困难.网络信息检索引擎应运而生,通过一定的方法和特殊的计算机程序,将计算机在网上搜到的材料进行统一的分类管理,为人们提供快捷便利服务的一种系统.
1..2网络信息检索的工作原理
通过从互联网上来获取网页,然后对所获取的网页内容进行分类处理,把所处理的网页放入数据库中,并且对数据库中所包含的网页进行统一的分类处理,人们在输入关键词进行搜索之后,信息检索系统从存储信息网页的数据库中找出与关键词相符合的网页,并自动将所搜索出来的网页进行排序,这种排序是按照相关度数值进行排列的,相关度的数值越高,网页的排名就越靠前,然后网络检索系统将搜索到的超级链接的地址和页面的内容反馈给搜索的用户.
1..3.1通过全文进行检索
根据网络搜索结果的来源不同,全文搜索引擎又可以分为两类:第一种是拥有自己的检索程序,它能够自行的建议存储网页的数据库,在用户搜索时,对于搜索结果直接从自己的数据库中调用.例如: Google和百度.另一种是通过租用他人的数据库,然后用自己所需要的格式进行搜索结果的排列.
1..3.2通过目录进行检索
运用目录进行索引,虽然也具有搜索的功能,但却并不是真正的搜索引擎,只不过是按照目录分类的链接网站来进行列表.用户则可以不用去查找关键词,直接通过分类目录找到自己所需要的信息.目前新浪目录搜索在目录搜索中是最具有代表性的.
1..3.3元搜索引擎
所谓的元搜索引擎就是指,在接受了用户的搜索要求后,同时在多个搜索引擎上进行所需内容的搜索,然后将搜索的结果返回给用户.在给用户返回的结果排列上,有的会直接按照内容的来源进行结果的的排列,还有的用自己的规则对结果进行重新排列.
1..4网络信息检索的方法
1..4.1关键词
在进行网络搜索时,要准确、良好的运用关键词.目前的网络信息检索系统的智能化程度不高,它只能够在现有的数据库中,查找所匹配的关键词.
1..4.2运用加减号
在搜索的关键词前面,加入加号或者是减号,能够更好的限定所要搜索内容的范围,使得搜索到的内容更加准确.
1..4.3运用双引号
如果用户想查询的是一个词组或者是多个汉字,那么用双引号将所要查询的内容括起来,这样所搜索到的结果是最少的,也是最精确的.
1..4.4搜索引擎的选择
不同的搜索引擎由于设计目的和发展方向的不同,搜索出来的结果也有很大的不同.所以,用户在对搜索出来的结果不满意的情况下,可以尝试运用多种搜索引擎.
1..4.5逻辑词
通过逻辑词来辅助查找,可以进行更加复杂的搜索界定,使得搜索结果变得更加的准确.
2.网络搜索的现状
网络搜索引擎的最大优点是:信息的覆盖面大,信息更新换代快,而且搜索引擎能够将它认为相关数值较高的检索结果排列在搜索出来的结果前面,方便人们的浏览查阅.但是由于目前网络搜索引擎在使用的信息检索技术上智能水平有限以及对自然语言的理解能力也有一定的限制,导致网络信息的检索还存在着许多不足之处:
(1)网络检索的结果不够精确.
(3)由于目前的网络搜索引擎一般都采用关键词检索的方式,但是在许多情况下,用户很难简单地用关键词或者是关键词之间的组合来准确地表达自己真正需要的信息内容,表达困难导致了检索的困难.
网络信息检索的方法:网络信息资源的检索
(4)目前的搜索引擎主要是将网页的全部或者是部分内容下载到自己建造的网络索引数据库中,由于下载的页面许多是无用或者是暂用的信息,既影响了检索的速度,也增加了用户检索的负担.
3.数学查询与索引的研究
3..1数学查询与索引的现状
目前的数字图书馆一般利用的存储数学公式的格式,与计算机代数系统经常用的格式不同,需要经过格式的转换,为方便不同的需要和需求,带有数学公式的文档一般都会采用多种方式来编码,这样就会造成资源的严重浪费,也不利于数学资源的检索,使两者不能相互沟通.在网络数学搜索中,我们如果要识别不同格式存储的数学公式,那么就要把不同存储格式和不同表示方式的公式转化为同一种格式来进行存储和查询.所以首先要进行格式的转换,将其转化为一致的表现形式,才能进行有效的对数学公式进行检索和查询.
3..2数学公式查询语言的研究
这个搜索表达方式相对于常规数学表达方式来说要更加的准确和清晰,具有较高的一致性.通过这种完善的语言检索功能,使用户可以得到具体、准确的语言查询结果.这种语言查询除了能查询常规结构的查询描述外,还要就有检索双重结构、虚幻结构的语言查询语言表达方式,以完善查询的表达力度.在数学搜索过程中,还有一个重要的问题就是相关度.所谓相关度,顾名思义就是检索出来的内容与人们查询条件之间的匹配程度.对于搜索引擎来说,检索全率是很有难度的,所以目前搜索引擎系统对你搜索的精度是非常关注的.在进行语言搜索中,客户搜索的语言和搜索得到的信息适用率的高低,对搜索引擎用户来说具有重要的意义,同时也是考验搜索引擎系统的重要标准,是技术的核心问题.
3..3数学查询语言的解决办法
对于在同一数学公式中,也具有不同的语义、表达方式,得到的结果也不会相同,合理的采用基于语义的检索可以实现对这些表达式的检索.另一方面,为了更加明确客户的搜索需求,检索系统可以对不同需求客户的搜索进行历史记录,记录客户的足迹,总结客户的喜好,建立个人检索日记.等下次客户进行搜索时,系统会自动提示历史足迹供客户方便选择.数学语言检索中一个最重要的问题就是,判断用户的查询与数据库中存储数据之间的等价性.现有传统的搜索引擎之所以不能搜索数学公式和符号,另一个原因就是现有的语言查询系统只能检索文本资料,而无法识别和检索数学公式和结构.对于数学的检索中,不见要检索到所要查询的数学资料,还有检索到与其相关、语义相近的数学资料.这一程序大大增加了检索难度.所以,必须要解决的问题就是如何判断用户查询与数据库中存储数据的等价性.
4.结语
总而言之,为了能够更好的进行信息检索,人们需要对网络信息检索系统进行深入的了解和认识,只有熟练的掌握搜索工具,并灵活的运用它,才能在目前信息繁多的网络中,迅速的定位,得到自己需要的内容.
参考文献:
[1] 景珂.网络数学搜索中的数学查询语言与索引的研究.[J].计算机软件与理论.2009:20.
[2] 邢国军、刘林霞.浅谈网络搜索引擎.[J].科技信息.2010(17):80.
更多论文范文:https://www.mbalunwen.net