10.3969/j.issn.1000-386x.2018.01.018
FM集成模型在广告点击率预估中的应用
目前广告点击率预估所用的模型对于稀疏、类别分布不平衡的广告数据学习能力有限.针对这一问题,在数据分桶采样的基础上,提出利用因子分解机集成模型进行广告点击率的预估.利用迭代决策树算法提取的高层特征作为因子分解机的输入特征进行自动组合,发现特征间的相关性,解决数据稀疏和不均衡分类问题.在Hadoop大数据平台环境中对迭代决策树算法+因子分解机的融合模型进行并行式训练,可减少时间成本.通过单模型实验、采样实验、模型集成实验以及模型对比实验,确定了最佳采样比例,并验证了集成基于因子分解机的集成模型的有效性.
CTR预估、FM集成模型、Hadoop大数据平台、互联网广告
35
TP311(计算技术、计算机技术)
北京市自然科学基金重点项目KZ201410011014;北京市教委科研计划面上项目KM201510011009;北京市教委科研计划面上项目KM201510011010
2018-05-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
107-111,148