登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
6-4 数据科学在用户兴趣分群上的探索与实践 - 陆祁 爱奇艺
信息技术
2022-06-13
DataFunSummit2022:数据科学在线峰会
Angie
数据科学在用户兴趣分群上的探索与实践
01 数据科学VS 用户兴趣分群
数据科学的作用
:精密分析、结合业务、可解释性更强、解决实际问题能力强。
用户兴趣的计算
:反映用户对主题或事物的匹配价值和接受程度,包括中长期偏好和短期即时意图,应用于运营推荐、搜索广告等场景。
02 基于事实生成的用户兴趣标签
用户兴趣权重标签设计
:
比较性问题:同一用户的不同内容、不同用户的相同内容、不同用户的不同内容的可比性。
加权权重设计:时间衰减函数(内容、类型、明星、频道、时间、价格等)。
降权头部内容影响:起始值和行为稀疏用户处理。
研究主题:抽取多样用户行为,计算兴趣偏好,归一化得到0-1权重。
用户兴趣标签的验证与迭代
:
效果检验:盲测用户问卷检验排序性,线上ABTEST(如明星偏好权重标签)。
事实标签权重解释性:每天全量decay不适合实时场景,增加属性维度供业务方灵活使用。
用户兴趣结构化事实标签
:
显式行为:评分、弹幕、评论、关注、预约、收藏、内容分享、购买等。
隐式行为:快进、后退、暂停、倍速、站内/外搜索、下载。
细分用户行为,更准确捕获内容偏好。
03 基于内容聚类的用户兴趣分群探索
兴趣圈层定义
:喜欢相同内容的用户群体,通过算法发现内容关联性。
应用场景
:内容运营(数据支持)、内容供给规划(大数据驱动)。
圈层聚类基本思想
:用户相似度高则面向同一圈层。
用户圈层聚类系统
:
客观观影行为作依据。
颗粒度可控。
数据获取便捷。
内容相似度计算
:
使用距离计算公式(Jaccard similarity)计算任意两部内容观影用户相似度。
优化1:内容体量。
优化2:内容上线时间间隔。
优化3:频道规模差异。
内容聚类原理介绍
:
层次聚类:通过计算两两内容用户相似度,依次向上聚集。
图剪枝线:决定内容聚合颗粒度。
用户兴趣圈层示例
:
通过综合内容内核、用户特征等推测用户核心诉求。
不同兴趣圈层用户诉求差异通过聚类体现,传统内容标签难以表达。
非常感谢您的观看
你可能感兴趣
【T112017-教育生态与人才培养分会场】OpenDataOpenValue-数据科学合作研究平台的探索与实践
商贸零售
TalkingData
2017-09-20
【T112017-人本数据和智能分会场】Smart Data Lab-数据科学基础设施搭建的探索与实践
商贸零售
TalkingData
2017-09-20
虎牙-郑健彦-智能弹性在虎牙降本增效上的探索与实践
商贸零售
2023第十二届全球TOP100软件案例研究峰会
2024-08-21
6-4 大象时序 TimescaleDB 在专网领域的应用与实践
商贸零售
DataFunSummit2022:大数据存储架构峰会
2022-07-19
国内医疗真实世界数据在慢性病防治中的应用探索-神经科学法规与上市咨询服务
商贸零售
精鼎洞见
2024-11-19