10.3969/j.issn.2095-2163.2016.06.005
基于SVM和CRF双层分类器的英文电子病历去隐私化
去隐私化是2014 i2b2/UTHealth中的一个任务,目的在于识别并移除电子病历中的隐私信息.本文提出了一种基于支持向量机(SVMs)和条件随机场(CRFs)双层分类模型的去隐私化方法,经过预处理将病历文本进行词切分(tokenize)处理,并在此基础上抽取4类特征,训练SVM模型对隐私信息实体边界进行划分并将结果作为特征添加到特征集中,通过CRF训练多分类器,并通过该分类器对各个类别的隐私信息进行识别.实验表明双层分类模型对于隐私信息识别是有效的,结果F值达到0.9110.
电子病历、去隐私化、SVM、CRF
6
TP391(计算技术、计算机技术)
2017-03-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
17-19,24