作为一个生活消费决策平台,小红书内有多种场景在为消费者提供着信息获取的服务,广告主也可在各个场景通过广告触达消费者,如何跨场景进行高效的广告投放一直是困扰广告主的一道难题。
一、小红书全站指头简介
小红书是一个生活内容社区,更是一个消费决策平台。商家想在小红书内更多地吸引用户消费时,有多种渠道可供选择(下图从左到右依次为“发现 feed”、“搜索 feed”中的广告内容),多渠道的广告投放可以更大范围、更高概率地触达潜在用户,从而达到推广商品、服务消费者的目的。
然而,达成这样多渠道合力推广的效果并不容易,广告主需要在小红书的广告平台上分别构建“发现 feed”和“搜索 feed”的多个推广计划,并且每个计划都需要给出合理的配置(预算、关键词、定向、出价方式等),其复杂程度和难度可想而知,通过人工配置完成这种组合投放效率低下,难以形成“1+1>2”的协同效果。此外,“搜索 feed”广告的关键词和“发现 feed”广告的人群定向选择也是很多广告主一直以来的梦魇,选得过于宽泛效果不好,过于精准又拿量不够。
小红书“全站智投”便是为了解决上述商家的营销痛点推出的一款智能营销工具,配套了一系列智能化算法(智能圈词、智能定向、智能出价、智能预算分配)。如下图所示,商家只需给定整体预算以及目标成本(例如1000元预算,2元的互动成本)即可快速推广,平台会自动创建不同渠道的虚拟计划并提供全方位的效果保障。这里的智能化算法配备了广告行业内最先进的 AI 能力,基于大数据持续优化,帮助商家达成既定投放目标。
二、智能圈词
“搜索 feed”场景的广告投放通过关键词触发,为广告物料选择关键词对于搜索场景的投放效果至关重要。因此,如何圈选关键词也是困扰搜索客户的一大难题。针对此,我们通过物料内容理解、用户行为分析、E&E 优选等技术,搭建了智能圈词算法,根据客户的物料自动圈选优质关键词,在保证广告投放效果的同时,降低客户投放门槛。
智能圈词算法的工作原理如下图所示。我们采用了经典的“召回+优选”两段式架构,在召回阶段主要通过内容理解和用户行为建模两种方式结合挖掘潜在关键词。前者对广告物料内容做深入理解分析,利用“核心词提取”、“语义理解”、“多模态表示学习”等技术,提升物料信息抽取的有效性,并以此挖掘高精准关键词;后者则充分利用平台内的用户行为信息,借助图神经网络强大的特征提取和关系推理能力,发现更具意图扩展性的关键词。
优选阶段主要目标是从召回的关键词中选择效果更优的关键词,我们将其建模成 E&E(Exploit & Explore)问题:保证所有候选关键词都有概率被圈选,获得线上反馈数据,并根据投放反馈调整关键词的圈选概率,以确保广告投放的长期收益。
值得注意的是,小红书平台提供了多种不同的广告样式,客户可针对投放诉求自行选择,例如原生的笔记样式、面向客资收集的表单样式、优化商品销量的商品卡样式等。这种方式能够有效提升客户的投放效果,与此同时,也对智能圈词的优化提出了挑战:与笔记样式不同,表单和商品卡样式往往是简单的图文组合,能够直接获得的文字信息较少;另一方面,投放表单和商品卡广告的客户数量明显少于笔记类客户,广告量少、有效日志少等数据稀疏性问题凸显出来。
针对以上问题,我们首先利用 OCR、图片分类等能力,充分挖掘图片物料中的有效信息,并基于核心词识别、查询改写等方式对 OCR 结果进行扩展,丰富广告物料特征;在建模的优化上,我们在语义模型中使用对比学习方法,并引入客户历史投放信息优化训练集,将同客户投放的不同类型物料认定为相似物料,用于构建正样本,以此提升对表单和商品卡物料的建模能力;同样的,我们将“同客户投放”以及“物料同现”关系纳入图模型的建模过程中,以解决历史日志中表单和商品卡样式广告数据稀疏问题。
三、智能定向
在“发现 feed”场景,定向是决定客户投放效果的重要因素。全站智投中,我们提供了智能定向能力,客户无需显式表达目标人群,召回算法会优选符合客户目标表达的流量进行参竞。
全站智投提供了多种优化目标,如互动、私信、表单提交等,传统的做法会在召回阶段考虑多种目标,设置多个子召回通道进行 Top k 截断。这种方式一方面开发和维护成本较高,另一方面会导致客户错失一些符合成本目标的流量,无法发挥智能出价的最大效用,对大盘流量售卖效率有损。因此,全站智投智能定向采用了 Learning To Rank(LTR)的方式,对齐精排广告最终排序结果进行召回。从客户视角看,该方案让客户逼近全流量参竞,让智能出价有更大的空间优选流量,提升广告投放效果;从流量视角看,该方案提高了竞价链路的顺畅度,提升了流量分配效率。
如下图所示,具体实现层面,召回阶段根据广告最终排序采用 LTR Pointwise 建模,将复杂的排序问题化简为下发率(pSend)预估问题;模型设计采用经典的双塔结构,在满足召回性能要求的同时,优化模型预估的准确率。
四、智能预算分配
全站智投计划预算,会同时在“发现 feed”和“搜索 feed”场景被消耗,不同场景的流量价格和效果存在差异,因此,高效的控制不同场景的花费对最终的投放效 果至关重要。跨场景投放策略主要有两种核心思路:
1. 统一的智能出价模块直接进行流量粒度出价(Bid),不同场景提供流量以及流量价值预估分(pValue),如下左图所示。该方案能实时考虑计划的整体预算进行调控,架构清晰,但对系统要求较高,两个场景的投放系统耦合更重,转化率预估的能力也需要对齐。
2. 各场景先分配预算,场景内根据分配到的预算各自进行智能出价,如下右图所示。预算分配的结果对最终的投放效果影响很大,一步到位做到最优的预算分配结果比较难,但系统相对解耦,鲁棒性也更好。
小红书在不同场景已经建设了相对独立的投放系统,召回、预估等模块都有差异,考虑到系统鲁棒性和迭代高效性,我们选择了基于预算分配的方案。
预算分配的目标和客户投放目标一致,即预算和成本约束下最大化价值,假设对于任意场景,我们已知预算和价值之间的关系
,直接最优化求解即可得到各个渠道的最优预算分配。对于函数 的获得,业内常用的方案是通过成效预估技术来估计,但是实际的广告竞价环境波动大,难得到精准估计的
。因此,我们采用了一种启发式的动态调整预算分配的方案,该方案核心思路是基于预算消耗率和拿量成本调整场景预算:
- 计划新建时会初始化场景预算分配比例
- 每隔一定时间,根据各个场景的预算消耗率、投放成本以及约束超限情况,重新分配预算
五、智能出价
在实时竞价广告业务中,平台提供给客户的投放能力对其投放效果有显著影响。在传统的点击出价方式中,如何设定合理的出价以平衡拿量和目标成本对于客户来说一直是个难题,这使得各场景的投放门槛一直居高不下。
针对上述问题,在全站智投场景下,我们为客户提供了全自动带约束的最优化出价方案(MCB,Multi-Constrained Bidding),客户仅需给定优化目标、预算、目标成本,平台会根据商家的营销诉求在流量粒度实现高效出价,最大化商家的广告投放效率,在达成客户营销效果的同时提升平台流量效用。
关于智能出价的建模,我们把问题抽象成带约束的最优化问题,并基于线性规划的 primal-dual 方法把原问题转化到对偶空间进行求解,得到最优的出价公式。我们把智能出价问题做以下形式化,并得到最优出价公式:
如上形式化,该问题是一个带线性约束的最优化问题,我们可以直接求解得到最优的流量分配方案(即未知数
的值)。
但是站在客户的视角,只能通过在流量上的出价来影响是否竞得,因此我们希望能建立出价和竞得与否的关系,通过最优的出价方式来保障竞得流量最优。具体地,我们尝试把这个问题转换到对偶空间,来找寻客户出价和是否竞得的关系,最终得到含有一个超参数
的最优出价公式。得到了最优出价公式,基于该出价公式进行出价,就能筛选性价比最高的流量,保障投放效果最优(如下左图所示)。
在这个基础上,我们为每个全站智投计划,以前文的预算分配模块为场景分配预算,得到预算后的每个虚拟计划都会有单独的 MCB 模型对其投放效果进行在线优化。模型通过反馈控制的方式不断调整出价参数,使全天的投放效果在满足预算和成本约束的前提下,最大化竞得流量的价值。具体来说,每经过一定时间,MCB 模型就会从广告系统中获取计划的历史投放效果数据(如成本达成率、预算消耗率等),结合当前的出价水位以及未来竞价环境的预估,对出价参数进行动态调整,确保最终的投放效果(如下右图所示)。
六、未来规划
我们在小红书内各场景上,已经完成了跨场景联合投放的算法能力建设,未来新的流量场景的接入和投放(如单列发现 feed)会持续进行,为广告主带来更多的流量价值。此外,智能投放、智能定向、智能圈词以及智能预算分配,也可以通过更加先进的算法策略升级进一步提效。面向终态,跨场景统一出价的架构是更加高效的解决方案,随着系统能力的加强,我们也会逐步朝着这个方向进行尝试。