DOI：10.3969/j.issn.2095-2163.2022.05.002

融合实例频率加权正则化和神经网络的概率矩阵分解模型

引用

摘要：

针对大规模稀疏数据集上基于概率矩阵分解(Probabilistic Matrix Factorization,PMF)模型的缺失数据估计方法容易出现过拟合且迭代训练时间较长的问题,本文创新性地提出一种融合实例频率加权正则化(Instance-frequency-weighted Reg?ularization,IR)和神经网络(Neural Network,NN)的概率矩阵分解(IR-NNPMF)模型.一方面,充分考虑已知数据在数据集中的不平衡分布现象,并根据潜在因子相关的实例频率对其正则化参数进行加权处理,从而提高模型的泛化能力和预测精度;另一方面,引入神经网络来缓解模型迭代训练造成的时间消耗,提高模型预测精度的同时减少模型训练时间.最后,在4个真实数据集上的实验结果证明,和带标准L2正则化和使用传统梯度下降训练算法的经典PMF模型相比,本文提出的IR-NNPMF模型能够在提高预测精度的同时大大提高模型的训练速度.

关键词：概率矩阵分解、大规模稀疏数据、不均衡分布、正则化、神经网络

所属期刊栏目：12

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金;中央军委装备发展部航天飞行动力学技术国防科技重点实验室资助

在线出版日期：2022-06-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：1-10

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

融合实例频率加权正则化和神经网络的概率矩阵分解模型