DOI：10.3969/j.issn.1000-386x.2017.04.016

基于机器学习的多语言文本抽取系统实现

引用

摘要：

基于统计机器学习的信息抽取方法正日益成为研究的热点,在研究与应用方面虽然也产生了一些实用的基于机器学习的文本信息抽取框架与系统,但大多面临着交互性弱、可扩展性低、语言移植能力差等缺陷.为此,研究并提出一种通用可行的支持多语言的信息抽取框架,并基于该框架实现了一个原型系统.原型系统集成了最大熵、支持向量机两种机器学习算法,使用这两种算法对中英文文本的实验验证了系统的实用性.

关键词：统计机器学习、信息抽取、多语言、最大熵模型、支持向量机

所属期刊栏目：34

分类号：TP39(计算技术、计算机技术)

在线出版日期：2017-05-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：87-92,156

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于机器学习的多语言文本抽取系统实现