服务热线:15895595058
产品展示 Categories
联系我们 contact us
联系人:
陆先生
手机:
15895595058
电话:
0512-58628685
地址:
张家港市南丰镇
公司新闻
当前位置:主页 > 新闻动态 > 公司新闻 >
概率主题模型-数控滚圆机滚弧机价格低电动滚圆机滚弧机多少钱
添加时间:2018-02-08
随着信息技术的迅猛发展,人们可以获取大量的文本数据;例如:Web新闻、科技文献、数字图书、电子邮件和微博等。如何有效地组织和管理海量的文本数据,快速、准确地从中找到用户所需的信息,成为智能信息处理研究领域面临的挑战之一。为此,从大量文档中提取简洁摘要信息的多文档摘要技术吸引了研究人员的广泛兴趣。近年来,电子商务和社交网络的快速发展催生出大量的书评影评、网络聊天、产品介绍等形式的短文本。这些短文本数据包含了大量有价值的隐含信息,对人们的日常生活产生了很大的影响。与长文档处理方法相比,因为短文档词汇具有非常少的词共现信息,使得传统的多文档摘要方法直接进行处理时效果不佳。本文由 张家港市泰宇机械有限公司张家港全自动切管机 网站采集网络资源整理! http://www.qieguanjixie.com概率主题模型-数控滚圆机滚弧机价格低电动滚圆机滚弧机多少钱因此,有效地提供精简内容的多文档摘要技术具有重要的研究价值和现实意义。本文在长文档的摘要技术和短文档的摘要技术研究的基础上,提出几种基于带通配符序列模式和概率主题模型的多文档摘要技术算法。主要研究工作如下:(1)提出一种基于闭合模式的多文档摘要算法。从词的计算角度上说,已有的多文档摘要提取方法可以分为基于词的方法和基于本体的方法:基于词的方法很难处理一词多义和多词一义的问题,基于本体的方法考虑了词语的语义信息,但是受限于具体的领域。为了克服这些问题,本文探索利用闭合模式从多文档中提取最精简的句子和缩减摘要中的冗余,并提出一种基于闭合模式的多文档摘要方法。该方法通过联合每个句子中闭合模式的权重和闭合模式的分布,迭代地选择高得分且低相似于已选择摘要的句子,直到满足摘要长度约束。本文提出的的方法不仅具有基于词的方法的统计特性,而且保留了部分语义信息。实验结果表明:基于闭合模式的方法优于对比的其他方法。(2)提出一种基于用户评论的多文档摘要提取算法。用户评论里隐含了用户关心的主题,而多文档摘要的目标就是提取最符合用户关心的摘要,为此,利用用户评论辅助多文档摘要是一个很好的研究问题。概率主题模型作为最好的摘要系统方法之一,我们尝试使用概率主题模型提取摘要。首先,新闻文档是长文档,用户评论一般是短文档,它们的集合这里被称之为异质文档概率主题模型-数控滚圆机滚弧机价格低电动滚圆机滚弧机多少钱本文由 张家港市泰宇机械有限公司张家港全自动切管机 网站采集网络资源整理! http://www.qieguanjixie.com