期刊专题

10.11897/SP.J.1016.2019.00190

一种基于模糊选项关系的关键属性提取方法

引用
模糊分析方法已广泛应用于医学实践包括对心理疾病的辅助诊断.属性约简方法在过滤冗余信息并提取关键信息时起到了重要作用,使整个临床决策过程更加准确和高效.这些方法抽取的有价值信息可以从新的视角揭示深层次医学知识.很多未经培训的参与者很难识别心理量表中选项间模糊的界线,即很难区分拥有相同意义但程度不同的选项.临床心理学自身的模糊性和心理测量数据的模糊性都将带来噪声.如果将心理测量数据中的属性看作信息系统的条件属性,利用降维算法可提取关键属性,从而简化对疑似患者的临床筛查过程.实际使用时,可对提取的关键属性或者拥有高权重的属性进行重点关注,从而迅速定位拥有异常关键属性的患者,对其优先处理.由此该文提出一种称为FOAD(Fuzzy-Option based Attribute Discriminant method)的基于模糊选项关系的关键属性提取方法,包括三个主要步骤:数据获取、模糊选项的选择与约简以及关键属性的排序与提取.每个参与者样本包含若干身体症状属性,为每个属性都选择一个程度选项.选择模糊选项时须同时考虑选择该选项的样本数量和选项的程度含义.而模糊选项约简算法作为整个方法的核心,可以将模糊选项合并到其他选项,以降低心理测量数据中选项的模糊度.实验中采用两个真实临床数据集验证FOAD算法的性能.首先使用各种属性提取算法对测试数据集进行处理,获取关键属性,然后将输出的关键属性作为条件属性,以诊断结论作为分类标签,利用逻辑回归方法对样本数据进行分类.实验结果表明:FOAD算法在不增加时间复杂度的前提下能将分类准确率普遍提高3.3%~14.1%.虽然选项约简操作造成部分信息的损失,但是合并模糊选项使选项分布更加清晰.FOAD作用下的LDA(Linear Discrimination Analysis)对各种参数敏感,尤其是对保留属性的个数.LDA的预测准确率从保留最少属性时提高6.7%,上升到保留最多属性时提高14.1%.PCA(Principal Component Analysis)算法选择的投影方向会使数据方差最大,保留的信息量最多,但分类效果差.因此FOAD算法很难应用于提高PCA的预测准确率,甚至在个别情况下,出现了FOAD引起PCA分类准确率降低的情况.此外,实验发现基于FOAD的LDA算法比其他属性模糊提取算法具有更高预测准确率.心理诊断数据具有明显的模糊性,一般的统计分析方法往往不能得到需要的结果.而利用最新的模糊集和粗糙集等特殊的数据预处理方法可以消除这种数据噪声,提高临床诊断效果.

选项约简、模糊集、医学数据挖掘、临床决策、属性提取

42

TP391(计算技术、计算机技术)

国家自然科学基金61772091,61802035;教育部人文社会科学研究青年基金17YJCZH202;四川省科技计划项目2018GZ0253,2018JY0448;成都信息工程大学科研基金KYTZ201637,KYTZ201715,KYTZ201750;成都信息工程大学中青年学术带头人科研基金J201701;成都市软科学研究项目2017-RK00-00125-ZF,2017-RK00-00053-ZF;四川高校科研创新团队建设计划18TD0027;广西自然科学基金项目2018GXNSFDA138005;广东省重点实验室项目2017B030314073

2019-05-17(万方平台首次上网日期,不代表论文的发表时间)

共13页

190-202

相关文献
评论
暂无封面信息
查看本期封面目录

计算机学报

0254-4164

11-1826/TP

42

2019,42(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn

打开万方数据APP,体验更流畅