大数据逻辑&朋友圈逻辑的推荐系统分析

时间:2019-05-28 07:00:01 来源:绍兴头条网 当前位置:轩轩家居 > PPT > 手机阅读

这是 阿拉灯神丁Vicky 的第 013 篇文章



推荐系统是“信息过载”时代下的必然产物,用来解决“信息不对等,供需不匹配”有强大的潜力。


朋友圈逻辑


微信7.0改版之后,公众号文章底部的“点赞”按钮变为“好看”,用户点击“好看”之后,文章便会出现在“看一看”栏目,用“好看”代替了“转发”,推荐转发成本变低,更净化了“朋友圈”,将朋友圈与文章分开,采用朋友圈关系链进行内容的分发推荐,大大降低了推荐系统的构建成本与难度。


微信7.0版“看一看”界面


大数据逻辑


基于大数据的推荐系统构建需要具备3要素:数据、算力、算法;


基于大数据的推荐系统主要是推荐引擎根据用户信息、内容信息、上下文信息预测最适合用户当前状态的内容,推送至用户界面,这就导致所有的内容分发权都基于平台的推荐算法,你无法掌控,你越看哪类信息该种类信息就越来越多。推荐机制也不是那好做的,就算是今日头条,其推荐机制也深受人们诟病。


今日头条“首页”界面


大数据逻辑与朋友圈逻辑的推荐系统刚好对应中心化与去中心化,也就是集权与分权;


而基于朋友圈的推荐系统是在产品和技术上对普通用户赋权,对你的社交圈赋权,看朋友分享的文章,如果朋友圈足够广泛,你的信息圈便可以无限延伸,因为你的朋友绝大多数是与你臭味相投的,用户往往能在这里看到你所关心的,因为你的朋友已经帮你筛选好了。


哪怕推荐系统基于朋友圈,其弊端也一大堆,当用户的好友越来越多时,发朋友圈也就越谨慎,即使可以设置部分人不可见,用户也懒得发了。


不能说哪种推荐机制好与不好不能直接通过预测评分测量,首先应该考虑的使用户满意度,比如点击率、分享率、阅读时长、观看时长,总之,用户喜欢那就是好的机制与策略。现在的推荐技术通常会倾向于流行度很高的或者热点信息,并且各个平台争先恐后的将热点push给用户,导致同质化信息泛滥,打破了用户底线,最终不免被用户卸载。


长尾效应在推荐系统设计过程中也异军突起,开始考虑将长尾信息推荐给用户,所谓长尾,就是分布在正态曲线两边相对平缓的部分叫“尾”,从人们需求的角度来看,大多数的需求都会集中在头部,也就是正态曲线中间凸起的地方,也叫作流行信息,分布在尾部的都是个性化的、零散小量的需求,这部分差异化的、小量的需求会形成一个长长的尾巴,这些非流行的、小量的、个性化的需求市场累加起来会形成一个比流行市场还大的市场。而推荐系统真正要做的就是联系用户与内容,解决“信息不对等,供需不匹配”的问题,一方面帮助用户发现对自己有价值的内容,另一方面把内容推荐到对它感兴趣的用户面前,从而实现消费者与生产者的供需匹配。


对于推荐系统的评估方法有三种:离线测评、在线测评、与用户调研;


离线测评是将数据集分为训练集和测试集,用训练集学习和调整参数及模型,用测试集来测试算法精度、运行效率是否达到目的。离线测评的目的最大的缺陷是脱离了用户,不以用户喜欢为目标的推荐都是技术、产品自身的意淫。


线上测评一般采用ABtest,差异化对比推荐系统是否真的帮助用户推荐了感兴趣的内容,推荐系统是否真的满足了用户,只有用数据来说话,自身的意淫没有任何效果,最终的结果只能将产品推向万劫不复之地。


基于朋友圈关系与基于大数据分析用户兴趣进行信息推荐的方式有着巨大的差异,差异在于你产品的调性是什么,你想培养或者说是打造那种用户关系,或者培养什么样的用户习惯。就微信而言,其是一款社交软件,无论是微信钱包、信息流、还是朋友圈、短视频都是基于自身产品的强社交逻辑,始终没有脱离产品本质,一切都是基于社交圈衍生而来。还是字节调动的今日头条、火山小视频、抖音都是基于强内容信息流打造,以内容信息为中心打造产品闭环,一切都是基于推荐模型与系统,两者分道扬镳,却又殊途同归。


我们不能说谁对谁错,存在的就是合理的,经得住时间考验的东西就必有其可取之处。


基于大数据与基于朋友圈两种推荐系统都有最现实的问题,冷启动。内容哪里来,没有内容何来用户,更谈不上推荐系统;用户哪里来,没有用户何来内容,更谈不上信息流。


先说微信吧,基于强用户关系,用户粘性高,拥有强大的用户基数,随着用户越来越多,关系越来越复杂,人与人之间的互动,信息的传播迅速的广泛。有个著名的六度空间理论,意思是你可以至少通过6个人就能认识全世界的任意一个人,可以这样算,假设一个人能认识超过25个人以上,经过7次介绍(间隔6人),一个人可以被介绍个25的7次方等于6103515625个人,超过60亿。所以信息的裂变以及传播的快与广可想而知,而且基于朋友圈的壁垒却更高,一旦做成了,其地位很难撼动。


对于今日头条,前期也是通过爬虫不断地从互联网上爬取信息,进行前期用户的大量积累,后期互联网开始重视版权,其才开始启动创作扶持。其实头条用户的兴趣流是可以培养的,因为大数据下的内容无限多,当用户越看什么,算法越推荐什么,会有种上瘾的感觉,因为用户会感觉到这是属于自己的地方,这是一款懂自己的产品,对于用户来说,哪个能更好的服务自己,用着舒心开心就可以了。


除非是专业的信息获取,可能就要通过搜索引擎了。而基于大数据的知识图谱也在迅速的发展,对于行业乃至能细分领域的信息获取,搜索引擎也在不断地完善,减少用户的信息获取路径。详情可参考我的另一篇文章《知识图谱发展的难点&构建行业知识图谱的重要性》。


针对安卓用户想提前使用微信7.0的,我这有个内测连接:https://support.weixin.qq.com/cgi-bin/mmsupport-bin/readtemplate?t=page/android_exp__index&clientversion=&exportkey=AUoyT9w1RQm9aodfiGG



上一篇如何判断汽车避震器坏了,只需知道这两点,车友:太实用了

下一篇看完反正我是不敢买牧马人了!硬汉在防滚架下的悲哀?

相关文章:

PPT本月排行

PPT精选