智能算法:个性化推荐到底是不是今日头条们的原罪
近日,人民网连发《不能让算法决定内容》、《别被算法困在“信息茧房”》、《警惕算法走向创新的反面》三篇评论文章,指出以今日头条为代表,单纯依靠算法推荐的平台存在价值观缺失、制造信息茧房、竞争手段屡破底线三大问题。
而后,人民网又发表文章《今日头条如何用算法打击“标题党”》,为算法正名。
人民网如此频繁的关注智能算法推荐,那么智能算法推荐到底是什么?于今日头条意味着什么?为今日头条带来了哪些问题?今日头条的智能算法推荐又当何去何从?
一、智能算法推荐是什么?
所谓智能算法推荐,是把合适的内容推送给合适的人,平台相当于流量分发机器。推荐算法大致分为三类:基于内容的推荐算法、协同过滤算法、基于知识的推荐算法,此外还有以加权、串联、并联等方式融合以上算法的方法。
相比人工推荐,智能算法推荐投入产出比更高、覆盖面更广、个性化程度更高,但风险把控能力相对较低。
近来年,智能推荐算法在信息分发市场中的地位越来越重要,甚至已呈现出算法推荐超过人工推荐的趋势。
尽管智能推荐算法五花八门,在内容分发市场发挥的作用也越来越大,但是算法没有思维,有思维的是隐藏在算法背后的人,算法的呈现形式由人的价值观决定,由人的利益驱使。
人工智能技术与服务提供商第四范式的互联网业务负责人周开拓在接受记者采访时表示:
“算法推送出的内容是企业自己在其中进行权衡的结果”
“人工智能,其实先有人工,后有智能,算法本身是没有倾向的。我们在推行的时候会把用户体验拆成两小块,一个是短期体验,另一个是长期体验。所以长期和短期体验的权衡,不是算法决定,而是人为决定。”
二、智能算法推荐于今日头条意味着什么?
2012年,移动资讯平台领域仍是腾讯新闻、搜狐新闻等传统PC端媒体的天下,其内容提供手段沿袭传统媒体模式:优质内容+编辑精选。然而随着泛娱乐化、社交化时代的到来,用户已不满足于被动接收信息,他们渴望生产内容、渴望创造影响力,传统移动资讯平台难以满足用户的个性化需求。
张一鸣紧紧抓住这一机遇,于2012年3月创立今日头条,致力于为用户提供个性化、社会化的移动资讯平台,基于数据挖掘,为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务。诞生仅一年多时间,今日头条便已在中国手机新闻客户端活跃用户分布榜单中占据一席之地,并高居用户满意度榜单榜首。
(图片来源:艾媒咨询2013年中国手机新闻客户端活跃用户分布)
(图片来源:艾媒咨询2013年中国手机新闻客户端用户满意度)
2014年6月,今日头条估值为5亿美元,截至目前,经过三轮融资,估计已近200亿,其估值在三年内增长约40倍。
据公开数据显示,2017年5月,今日头条激活用户数已经超过7亿,月活跃用户数超过1.5亿,单用户日均使用时长超过Facebook,达到76分钟,日均启动次数约9次。
智能算法推荐在今日头条的个性化服务及快速崛起中扮演着至关重要的角色。据了解,今日头条共有4万台服务器进行运算,来保证以秒级速度收集信息,对用户特征作出反应并推送信息,2016年更是成立人工智能实验室,主要研究自然语言理解,计算机视觉, 机器学习(算法与系统),人机交互等AI技术。
凭借着智能算法,今日头条快速抓取用户数据,精准分析用户需求,高效把关内容质量、进而实现个性化推荐,这也是今日头条能够杀出重围,在移动资讯领域站稳脚跟的核心优势。
智能算法推荐带来了哪些问题?
智能算法推荐于今日头条的发展功不可没,然而由于根据阅读量、阅读时长、转发量、过往阅读行业实施推荐,缺少必要的内容审核机制,容易导致为抓住用户眼球而牺牲文章质量问题的出现。
正如人民网《不能让算法决定内容》一文所说:
内容能否推送、推送给谁,由机器说了算,依据的标准就一条:能不能抓眼球、能不能吸引用户。单一的标准不仅容易忽视优质内容更为丰富的面向和维度,也增加了把关内容产品的难度和成本。
这也就不难理解,为什么即使事后不断处罚违规的内容账号,却无法停止劣质内容的再次生长。
今日头条质量低下问题已多次引起官方关注。
2017年以来,今日头条三度遭约谈,成为低俗内容重灾区。
- 1月6日,北京市网信办发现今日头条”头条问答“栏目多次登载”庸俗讨论话题“,对今日头条提出严肃批评,并责令其整改;
- 4月,央视曝光了今日头条向用户推送”艳俗“直播平台:火山直播
- 4月18日,北京网信办、市公安局、市文化市场行政执法部队联合约谈今日头条、火山直播等平台,责令限期整改。
- 7月,北京市网信办约谈今日头条、微博等网络信息平台,并永久”封杀“了一批”内容低俗“的违规自媒体帐号。
今日头条自己不生产内容,依靠智能算法抓取别人的内容,容易导致侵权问题的发生。粗略统计,近半年来,今日头条涉及的版权纠纷就有近10起。
今日头条内容质量低下、版权纠纷等问题的出现,真的是智能算法推荐的错吗?
人民网《今日头条如何用算法打击“标题党”》一文中提到,”很多“标题党”常用的内容元素其实都是可以在文本层面进行总结的,交由机器处理的效率会更高“,实则间接为智能算法推荐正名。
正如周开拓所说:
“人工智能,其实先有人工,后有智能,算法本身是没有倾向的”
“算法推送出的内容是企业自己在其中进行权衡的结果”。
内容质量低下,源于平台的利益目的及部分用户对“低俗”内容的需求。
今日头条的算法推荐与内容识别大部分是依靠用户的行为,会在用户浏览信息时智能抓取关键词,并给用户画像,对用户进行归类,进而根据关键词匹配出相关内容,最后将这些内容推荐给用户,若用户阅读的低俗内容多,则相应推荐的低俗内容也会多。
智能算法推荐是技术发展的产物,技术本身并没有错,只是在高速发展的背景下,承担了平台利益属性及部分用户“低俗“需求的罪过。
今日头条智能算法推荐的出路在哪?
人民网的一评、二评、三评,根源直指内容质量低下,为走出困境,今日头条需提高内容质量,重视人工编辑的作用。
1、今日头条迟迟不愿在提升内容质量上发力,源于其两难选择
今日头条的内容质量问题自成立之日起,便为大众所诟病,然而直至今日,仍是漏洞重重。2017年4月,经过北京市网信办、北京市公安局、北京市文化市场行政执法总队联合调查,今日头条并未能有效履行主体责任,在信息审核、应急处置、技术保障等方面存在制度缺失,在直播内容、用户分类管理、真实身份信息认证、处理公众举报等方面存在重大管理漏洞。
究其原因,在于剔除较为低俗的内容和作者会导致大量用户流失,而用户的流失又可能会使优质原创作者将重心转移到到其他自媒体平台。对今日头条而言,主动严格监管广告内容势必会影响其商业利益,但放松监管又会对平台信誉产生影响,两难境地必将经过一番博弈。
2、时至今日,面对官媒的连续实捶,今日头条不得不直面问题
9月21日,今日头条对人民网的三评做出回应称将“正视不足,勉力前行”,并指出,“机器学习和人工编辑,在现阶段,是相辅相成的。未来也是如此。再聪明的人工智能,也只是一个需要不断升级的工具,而人是不可替代的。这是一个不断磨合和优化的过程。这也是人民网三篇评论的价值所在。”
3、今日头条欲走出困境,提高内容质量、重视人工编辑的作用是关键,算法推荐+人工编辑是大势所趋
信息爆炸时代,如果沿用过去的人工推送的形式,显然会面临效率低下、难以满足“千人千面”的个性化需求等问题,而算法推送则大幅提升了推送效率和推送针对性,使用户从海量信息中解放出来。但是由于无法准确判断内容价值,单纯依赖算法进行个性化推荐容易导致内容质量低下,需要人工编辑修正对机器进行干预,降低点击率对算法推荐的影响,加强对高价值内容的人工干预,算法推荐与人工干预相结合将是大势所趋。
面对普遍存在的内容质量困局,已有平台开始实践算法推荐+人工编辑的优化路径。
- 2016年10月,一点资讯请来原新浪网总编辑陈彤做总编辑,CEO李亚在也毫不掩饰的说:陈彤加入一点资讯,就是因为机器算法有缺陷。
- 2016年12月16日,Facebook上线Fact-Checking(事实审核)机制,将用户举报过多的信息交付机构记者来判断,如果记者判断这则内容是假新闻,就会将内容标记为存在争议,一方面会在前端页面提示给用户此内容可能失实,另一方面会从分发量的角度进行控制。
- 2017年5月,扎克伯格发帖称Facebook会再招聘3000名内容审查员,在此次招聘后将会达到7500人。审查员会过滤社交媒体上的不适当内容,如恋童癖、身体暴露、种族仇恨等内容。
面对官媒的压力、大众的舆论,今日头条需及早完成流量与质量博弈,找到一条算法推荐和人工编辑的平衡之路。
作者:智能相对论(微信id:aixdlun):2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。
本文由 @智能相对论 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Unsplash ,基于 CC0 协议
低俗内容不是今日头条原创的,是那个原始数据来源的平台上的,只是因为今日头条的用户多信息量大,曝光率也就高了。算法背了这个锅。希望有关单位不要只盯着算法,还要整治低俗内容的来源。
但是这是今日头条的核心竞争力,现在要改的话,估计伤筋动骨。