深圳幻海软件技术有限公司 欢迎您!

汽车之家李本阳:我不认为算法推荐模式会走向终结 | 技术人访谈录

2023-02-28

​嘉宾丨李本阳撰稿丨千山有人认为,在大数据时代每天都有海量信息产生,迅速捕获感兴趣的内容越来越难,因此智能推荐是必不可少的工具。也有人不以为然,认为这种基于用户画像分析的推荐形式会加速信息茧房的形成,隐形攫取了个人对于信息的主动选择权。如何看待智能推荐这些年的发展?知识图谱的构建如何为个性化推荐带来

​嘉宾丨李本阳

撰稿丨千山

有人认为,在大数据时代每天都有海量信息产生,迅速捕获感兴趣的内容越来越难,因此智能推荐是必不可少的工具。也有人不以为然,认为这种基于用户画像分析的推荐形式会加速信息茧房的形成,隐形攫取了个人对于信息的主动选择权。

如何看待智能推荐这些年的发展?知识图谱的构建如何为个性化推荐带来更多可能?目前有关算法规制的讨论会给未来带来哪些影响?围绕这些议题,《技术人访谈录》特邀汽车之家智能推荐内容理解团队负责人李本阳,聊一聊这些年他在这一领域的成长、观察和反思。

1、抉择:做最坏的打算,然后静待收获

你将面临的最大陷阱是误认为那些帮助你达到这个新职位的成功经验仍然有效。

——迈克尔・沃特金斯《最初的90天》

毕业于哈尔滨工业大学的李本阳在求学期间就择定了自然语言处理(NLP)作为专业方向,此后的职场生涯也专注AI方向,不断在自然语言处理、知识图谱、大数据计算、个性化推荐等方向积累实践经验。

谈到选择NLP的原因,李本阳首先提到了少年时的兴趣。“我一直很喜欢对底层逻辑的探究,比如高中时候喜欢物理,喜欢研究我们所在世界的运行机理;上大学的时候,常常类比机器和人的差异,更想探究智能的机理。”

另外,良师的引导也影响至深。“(当时)受哈工大关毅老师影响,常说NLP有我们一生都研究不完的课题,所以就选择了这条路。后来(工作了)也一直沿着这个方向在走。”

正式工作以后,李本阳进入百度,从工程师做起,逐渐成长为百度新闻产品技术负责人,后又出走大厂,先后进入大数据创业公司、医疗科技公司担任技术高管,直到如今在汽车之家带领智能推荐内容理解团队。

回顾一路履迹,李本阳显得淡然和审慎。他认为,作为一个技术人,期间经历的诸多转折“相信很多人也经历过,或者未来也会有相近的轨迹”。通常来说,工作初期会更注重学习和职业化,成长后会开始权衡技术与管理的平衡。

至于选择大厂还是创业公司,李本阳谈到:“对我来说,大厂资源多,规范性更好,相应的目标拆解也更细致,也有更多团队成果的积累,但是通常来说,每个人离公司整体的大目标更远一些,所处的阶段也更加稳定。而身处创业公司,很多工作都是从0开始,由于团队规模比较小,大部分事情都要从基础开始做,相应的变化也会更快。”

当年李本阳之所以从大厂出来,选择了一家创业公司,主要原因是“想经历一下公司发展的不同阶段,同时也想在这个过程中拓展自己的视野”。这并非一时兴起或热血上头,对于风险,他也进行了谨慎的预判。“我也评估过如果加入创业公司,公司没有成功的话,代价是否是我和我的家庭能承受的,这一点非常重要。做最坏的打算,剩下就是收获了。”

不过对于多数刚入职场的新人来说,李本阳认为“最好还是先去大公司历练一下”,以便养成更好的职业习惯,观察大厂的运作机制,这对未来成长会有更多帮助,后续再做其他选择也会更加得心应手。

面对环境的变化,固有的经验可能并不适用,如何让自己的职业技能与不同行业快速融合,李本阳也给出了个人的一些建议。

  • 保持学习心态,尤其是跨领域,能够快速学习掌握行业知识,以及技术结合点。
  • 尽量避免频繁地跨行业,最好能让自己之前积累的技术和经验在新领域依然有所发挥,这样也能减少对自身的消耗。当然所有经历都是宝贵的财富,关键要在得失之间做好取舍。
  • 技术本身是具有通用性的,保持技术竞争力。
  • 充分了解行业现状和背景知识,跟业内深耕多年的人多加交流,避免信息的不对称导致的失败。

彩蛋Q&A

技术人访谈录:最近有没有推荐的书单?

李本阳:在基础技术方面,我推荐邱锡鹏教授的《神经网络与深度学习》。对于职业迁移变化比较大的人,可能会思考如何快速融入职场角色,如何在变迁中快速落地,我推荐迈克尔・沃特金斯的《最初的90天》,这本书应该会对你有所帮助。目前我正在看的一本书是金惟纯的《人生只有一件事》。  

2、反思:以汽车为中心构建知识图谱的实践

人工智能是我们人类正在从事的最为深刻的研究方向之一,甚至要比火与电还更加深刻。

——桑德尔·皮猜

技术的变化日新月异,智能推荐领域也不例外。在李本阳看来,近几年智能推荐要解决的问题总体来说变化不大,常见的诸如冷启动、推荐准确、多样性等等,但在方法上变化却很快,比如多目标优化/多任务学习、多模态融合推荐、基于用户行为序列的学习方法、结合图谱知识图谱特征学习等。

而在推荐系统中,“内容理解”是不可或缺的部分。在门户网站时代,门户通过 "内容类型" 对内容进行整理,然后以频道页形式满足用户需求;在搜索/社交时代,搜索除了需要分类信息以外,还需要精确知道文本内容是 "关于什么的",关键词技术很好地解决了这个需求,谷歌在2012年提出的知识图谱概念又为解决实体歧义问题找到了可行路径。那么在智能时代,在内容理解方面又有哪些新的解决方案呢?

李本阳简要介绍了他目前带领的内容理解团队主攻的三大方向:

  • 内容刻画:包括对内容标签体系,分类、概念标签、兴趣词标签,质量:先验、后验质量;低质识别等,相似计算内容相似,图片相似,情感分析。
  • 内容生态:通过前面的多维度标签和质量刻画,分析内容生产和用户消费的关系,促进生产更多用户喜欢的内容,促进内容生态的不断提升。
  • 知识图谱建立:围绕以车中心的语义图谱,支持更多应用场景。

对于知识图谱的建立这一点,李本阳作了进一步补充。他提到,相比传统的推荐方式,算法推荐其实更为多元化,而且算法推荐除了要推得准确,还要进行多层面探索,增加多样性,从而给用户惊喜,破除信息茧房。“这里的探索也不应该是无目的的随机探索。知识图谱的多个实体关系,能更好地挖掘用户可能偏好的内容,为进一步探索带来更多可能。”

李本阳解释:“除了用户看到的物料内容本身,知识图谱能够带来额外的知识。比如看到奥迪某款车,通过知识图谱可以向上探索其是否喜欢德系车,是否喜欢同价位的车,是否喜欢同品牌的车等等。而且也可以使用图的embedding,丰富item/user的表示等,从而能给出更好的结果。”

汽车之家作为由导购、资讯、评测、口碑等多个板块组成的汽车服务类平台,在看、选、买、用等维度积累了大量的汽车数据。在此基础上,其技术团队构建了以汽车为核心的知识图谱,为更多应用场景提供支撑。

知识图谱是真实世界的语义表示,图谱构建过程中通常会面临较大的挑战。而且面向推荐的汽车知识图谱构建有其特殊性,对此,李本阳梳理了团队在实践过程中遇到的难点和特点。

  • 汽车领域拥有专业参数划分和多领域技术,所以如何让大众了解,而非专业了解,需要更多用户维度的图谱标签构建,比如空间大、豪华、舒适、奶爸适用等等。
  • 汽车是比较昂贵的商品, 用户购买必然不同于电商,需要更长周期的比较和分析。在看、选、买、用过程中需要针对不同的场景构建。
  • 除了买车,很多人对汽车本身也有浓厚的兴趣,同时话题可能延伸到社会、科技、娱乐等多个方面,这就涉及到对于以车为载体的阅读内容的兴趣刻画,比如对新能源技术感兴趣、对换电、事故有关注等等。

实践结果表明,通过构建知识图谱,把以汽车为核心的内容进行组织和挖掘,提供丰富的知识信息,结构化精准刻画兴趣,支持推荐用户冷启、召回、排序、展示等多个维度,为业务提升带来了积极效果。

彩蛋Q&A

技术人访谈录:《互联网信息服务算法推荐管理规定》于今年3月1日起实施,很多应用已陆续上线个性化推荐关闭键。在数据合规时代,算法推荐模式有没有可能走向终结?

李本阳:我不认为算法推荐模式会走向终结,相反,《互联网信息服务算法推荐管理规定》的出台可以让算法推荐模式更加稳健。一方面,它规范了推荐算法的应用,避免了大数据杀熟、诱导沉迷等乱象,设置了边界,避免算法被滥用,另一方面,算法仍然有很大的发挥空间,可以在合理合规范围内大展拳脚。  

3、管理:沟通要站在对方的角度来阐述

把“对”让给别人,把空间还给别人,不仅对别人有帮助,更有益于彼此的关系,何乐而不为?千万别再说“早就跟你说过了”,尤其是对孩子和员工。​

——金惟纯《人生只有一件事》

从工程师到技术高管,李本阳经历了从单纯的技术人员到技术管理者的转变。在他看来,这两者有鲜明的角色差异。

“技术人员更多关注的是技术方向,是项目解决方案,是自己的产出。而管理者更聚焦的是整体目标和团队产出,以及梯队建设、向上汇报、团队配合等若干事宜。两者在思维和行为上的差异,都是由此产生的。所以技术偏纵深,而管理更多呈T字形,既要有自己擅长的技术点,又要兼顾协作等多方面的事情。”

在团队协作中,沟通的艺术至关重要。李本阳分享了其在多年管理实践中的心得:

  • 团队协作的基础是有共同的目标,获得共同的收益。如果不满足需要更高层面的目标协同。
  • 如果目标是一致的,在合作之初就要建立合作的分工和配合机制。这样减少了过程中更多的问题,所谓“丑话说在前面”。
  • 沟通要站在对方的角度上来阐述,说明给对方带来的价值。这会让对方更容易接受。

在团队搭建上,李本阳也有一套自己选人用人的准则和评判标准。

“选人方面,我首先比较看重的是性格。我欣赏踏实的性格,这种踏实更多表现为靠谱,我能够放心地把具体的事交给他。其次是专业能力,最后是未来的成长潜力。对于不同阶段的人,看重的点也不同,比如刚毕业的同学,除了靠谱,更多还是看基本功和潜力。”

“用人方面,我是希望在完成团队目标的基础上,个人也能取得个人的成长。这应该是一个共赢的过程,所以我会规划每个人的方向,希望他们专注于某个方向,在各自的方向深耕,同时要打造良好学习的氛围,努力为团队创造提升自己的空间。”

4、未来:推荐会更加多元、规范

在智能推荐领域,李本阳从一名新兵成长为老将,摸爬滚打多年,对于这一方向的未来,他也有自己的判断。

其一,未来智能推荐会涉及到人的方方面面,除了以推荐信息流、商品的个性化,更多的将结合场景进行推荐,比如时间地点,使用应用相结合。

其二,推荐形式将更加多元化,包括内容多元,以及交互方式多元,通过交互增加显示的兴趣反馈等。

其三,推荐系统将更加规范化,避免滥用,同时在可解释性方面也会做得更加深入,让用户更多地理解推荐的原因,人机结合也将更加密切。

此外,面对近年来关注度渐高的“算法黑箱”问题,李本阳认为关于“算法透明化”的呼声有其正向意义。

“算法的透明,一方面是算法可解释,另一方面把相关算法公开化,首先有助于人们加强相互理解,而不是猜测。同时,透明的算法也可以让更多人依据算法提高效率,也有助于找到算法优化点迭代算法,从而提高参与各方的满意度。”

李本阳汽车之家智能推荐内容理解团队负责人


  • 哈工大计算机本硕,自然语言处理方向
  • 6年百度工作经验,6年AI与行业结合创业经验
  • 历任百度新闻产品技术负责人,大数据公司、医疗科技公司技术技术高管,现任汽车之家智能推荐内容理解团队负责人
  • 专注AI方向,在自然语言处理、知识图谱、大数据计算、个性化推荐等方向有丰富积累