跳转到内容

全文检索

维基百科，自由的百科全书

本条目存在以下问题，请协助改善本条目或在讨论页针对议题发表看法。

此条目可参照英语维基百科相应条目来扩充。 (2019年5月15日)
若您熟悉来源语言和主题，请协助参考外语维基百科扩充条目。请勿直接提交机械翻译，也不要翻译不可靠、低品质内容。依版权协议，译文需在编辑摘要注明来源，或于讨论页顶部标记{{Translated page}}标签。

此条目的语调或风格或许不适合百科全书。 (2019年5月15日)
请根据指南协助改善这篇条目，并在讨论页讨论问题所在，加以改善。

此条目应避免有陈列杂项、琐碎资料的部分。 (2019年5月15日)
请协助将有关资料重新编排成连贯性的文章，安置于适当章节或条目内。

此条目没有列出任何参考或来源。 (2019年5月15日)
维基百科所有的内容都应该可供查证。请协助补充可靠来源以改善这篇条目。无法查证的内容可能会因为异议提出而被移除。

从文本或资料库中，不限定资料栏位，自由地萃取出讯息的技术。

执行全文检索任务的程式，一般称作搜寻引擎，它将使用者随意输入的文字，试图从资料库中，找到符合的内容。

全文索引的相关议题

语根处理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
断词/分词 word segmentation
倒排索引 inverted index

演算法、搜寻策略之模型

布林式 boolean
统计模型 Probabilistic model
向量空间模型 vector base model
隐性语义模型 Latent semantic model

评量之准则

查全率(recall rate)，查准率(precision)

开放原始码之全文检索系统

和中文有关的议题

断词
语法解析
古籍议题
多语言混合

优化

剔除字(Stopwords)
词性标注
规范文件(authority file)
知识体系，本体论(ontology)
超连结分析(page rank)技术

历史及未来之趋势

自由语句搜寻

参考

检索自“https://zh.wikipedia.org/w/index.php?title=全文檢索&oldid=54423734”

分类：

隐藏分类：