信毅学术文库跨语言信息检索中的双语主题模型及算法研究

【书名】 信毅学术文库跨语言信息检索中的双语主题模型及算法研究
【作者】 罗远胜
【出版社】 上海复旦大学出版社
【出版时间】 2015.12
【关键词】 情报检索研究
【摘要描述】 本书是基于双语主题空间的跨语言信息检索总体框架研究,在统一的框架下,从双语平行语料库抽取出一系列的主题构成每种语言的主题空间。
每种语言的主题空间独立存在,且通过双语语义对应关系建立双语主题空间。
双语主题空间反映了文档与文档、文档与词、词与词的语义对应关系,揭示了语言之间、语言内部的固有结构和内在联系,是抽象的概念空间,是各语言原始文档的中间表示。
表示方式可以是线性或者非线性的。
从数学原理上来说,两个主题空间是近似等价的。
我们将查询和文档投影到双语主题空间上,不需要直接翻译,可以实现跨语言的检索、分类和聚类
【中国图书分类号】 G252.7

在线工具导航