10.3969/j.issn.2095-2163.2022.04.024
降低数据稀疏性的多维时序序列时间戳对齐方法
多维时序序列是指一组按照时间发生先后顺序进行排列的数据点序列,广泛存在于天文、医疗、交通等领域.囿于收集技术较差,或是序列的物理性质所致,时序序列记录中往往存在较多的缺失值和大量的不规则采样,使得时序序列的稀疏性大大增加.最终导致许多深度学习的时序序列分类算法等无法正常工作,出现算法效果差、算法训练时间过长等问题.面对这些问题,目前常用的做法是简单删减或是利用专家知识做重采样,前者会导致数据规模变小,后者使得算法成本增加.本文利用时序序列的时间戳数据构建了一种半自动化的预处理方法.在公共数据集MIMIC-III、Physionet和肾移植数据集上的实验表明本文提出的方法在基本不损失算法效果的同时,能够有效降低数据稀疏规模,并且平均能够节约42.1%的算法训练时间.
多维时序序列分类、深度学习、缺失值、不规则采样
12
TP319(计算技术、计算机技术)
2022-04-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
135-139