本文使用基于协同过滤的算法处理用户观看节目的数据,解决两个问题:1、为用户推荐新的电视节目;2、对用户进行画像分析,为用户打上个性化标签。
针对问题一,首先对收视和回看的历史信息进行预处理,删去观看时间不足5分钟的信息,得到每个用户对每个频道的观看时间占比及观看频率。然后,通过将用户观看频率与观看时间按一定权重进行整理,使用基于用户的协同过滤算法(userCF),计算出用户相似度矩阵。接着,根据用户点播信息,计算得到节目点播金额占比、观看时间占比及观看频率,同样按一定权重进行整理,得到点播用户总频率,通过基于物品的协同过滤算法(itemCF),计算节目相似度矩阵。然后利用节目的相似度和用户的历史收视数据,给点播用户生成推荐列表;根据用户相似度矩阵与点播用户总频率,生成未点播用户推荐列表;整合点播与未点播用户推荐表。运用同样的方法整理附件2的电视产品数据。最后,整合附件1与附件2的推荐表,得到用户推荐节目清单。
针对问题二,首先根据节目类型和适宜人群构建产品标签体系。其次利用入网时间、观看节目及观看时间,构建用户标签体系。然后,建立标签编号,为电视产品信息进行标签编号,得到产品数据标签,进而得到已标签用户推荐表。最后,结合用户相似度矩阵,计算未标签用户的标签推荐列表,最终整合得到用户数据标签及用户推荐标签。
研究结果表明,协同过滤算法能够有效地根据用户的历史行为数据,为用户推荐个性化的电视节目,并对用户进行画像分析,为用户打上个性化标签。该方法能够帮助商家更好地了解用户的喜好,进行精准营销。