抖音 视觉中国 资料图
当算法已经深刻融入日常生活中,平台应当如何管理算法,才能避免其无序发展、走向失控?
4月16日,澎湃新闻记者获悉,近期抖音在北京举办“安全与信任中心开放日”活动,首次对平台算法原理、平台治理体系以及社会关切的问题进行较为详细的披露。
抖音曾经多次因为算法,陷入舆论争议。去年农夫山泉董事长钟睒睒曾经喊话字节跳动创始人张一鸣,请求头条和抖音停止对一个中国公民的侵害,“今日头条你是实际控制人,同样你是盈利性企业。你是一个有足够量掌控舆论的平台企业,因为这样的背景,所以请你承担企业文明的规则。”
面对此前吴柳芳案件等带来的算法和流量质疑,抖音副总裁李亮曾经多次在公开平台回应,但始终未正面披露其背后的算法机制。
在此次发布会上,抖音算法工程师刘畅介绍,抖音推荐算法作为人工智能机器学习技术的重要应用场景,本质上是一套高效的信息过滤系统。
在抖音的实际应用中,平台推荐系统采取“人工+机器”协同的方式进行风险治理:由人工运营和治理体系为算法导航;同时多目标体系算法主动打破 “信息茧房”,为用户带来更丰富的推荐结果。
从推荐算法来看,抖音与国内外大部分内容推荐平台相似,包含召回、过滤、排序等环节,重点是学习用户行为。抖音基于用户行为的推荐方法包含多种技术模型,如协同过滤、双塔召回、Wide&Deep模型(均为推荐系统中常用模型)等。算法可以在完全“不理解内容”的情况下,找到兴趣相似的用户,把其他人感兴趣的内容推荐给该用户。
目前,抖音算法已几乎不依赖对内容和用户打标签,而是通过神经网络计算,预估用户行为,计算用户观看这条内容获得的价值总和,把排名靠前的内容推给用户。
谈到外界担忧的“信息茧房”问题,刘畅介绍,抖音算法在多目标建模体系下,设置专门的探索维度:一是对用户在平台上已经表现出的兴趣,尽可能推荐更多样的内容,通过多样性打散、多兴趣召回、扶持小众(长尾)兴趣等方法控制相似内容出现的频次。
二是帮助用户探索更多新兴趣,采用随机推荐、基于用户社交关系拓展兴趣、搜索推荐联动、“不感兴趣”不再展现等多种方式,让用户的主动行为影响推荐系统,使推荐更加个性化和多样化。
算法能学习、预估用户行为,但因其无法理解内容语义,对内容的理解存在不足,可能导致违法违规、不良内容被推荐传播。因此,算法在真实使用场景中,必须由平台治理对其进行约束和规范。
在内容治理方面,据抖音生态运营经理陈丹丹介绍,抖音的体系是“人工参与+机器学习”相结合的模式,并组建专门的平台治理团队为算法设置“护栏”,具体治理体系包括异常感知、标准定义、机器识别、人工研判、风险处置等过程。
治理流程秉持两大准则:第一:所有在平台发布的内容都会经过评估,流量越高的内容评估次数越多,标准也越严格。
第二:抖音内容审核采用“人工+机器”相互配合的模式,“机器”负责“宽度”评估所有投稿,“人工”负责“深度”,确保专业、敏感或疑难等问题尽可能精准研判。
创作者将内容上传至抖音后,首先进入机器识别环节。如果内容被识别出含有高危特征,将被直接拦截;若未命中高危特征但模型判断有问题,则会送至人工审核,若问题概率较低,则获得基础流量进入下一环节。
视频被举报、评论区出现集中质疑、流量激增等情况出现,均可能触发“人工+机器”审核。一旦内容在任一环节被处置,系统会立即停止进一步推荐和分发。
针对社会普遍关心的、对用户造成较多困扰的焦点问题,抖音成立数个专项治理团队,针对诈骗、网暴、虚假摆拍、未成年人保护、网络水军、AIGC技术滥用等一系列重大专项风险进行治理。例如,在不实信息治理方面,抖音于近日上线了辟谣卡,遏制不实信息的传播。
此外,抖音安全与信任中心网站已经处于试运行阶段,正广泛向用户、创作者、社会各界征集意见。
算法治理已成为当今平台面临的共同问题。此前中央网信办副主任、国家网信办副主任牛一兵在“坚持主流价值导向 推动算法向上向善”主题分享会上致辞时强调,中央网信办聚焦党中央关心、人民群众关切的算法问题,以压实网站平台主体责任为抓手,出台系列政策法规,构建算法备案、安全评估、监测检查、执法处罚等全流程监管体系,算法应用生态持续向好。
加强算法治理,是维护网络安全和意识形态安全的关键环节,是推动平台经济健康可持续发展的有力保障,是维护人民群众利益的具体行动。要内化导向要求,把准算法治理“定盘星”,坚持党管互联网原则,把主流价值导向贯穿算法设计、开发、应用全过程。要净化内容生态,守好算法应用“责任田”,加强网上正能量推送,严禁算法助推低俗信息传播,提高算法设计的透明度和算法运行的可解释性。
去年11月,中央网信办等部门联合发布的《关于开展“清朗·网络平台算法典型问题治理”专项行动的通知》提出,优化检索、排序、推送等规则的透明度和可解释性,预防和减少争议纠纷。以适当方式公示算法推荐服务的基本原理、目的意图、主要运行机制等,确保简单、清晰、可理解。