互联网搜索广告技能升级版,赶紧get起来
来源(广告买卖网) 作者() 阅读() 时间(2015/7/24 10:03:55)
正排数据存储的是推广组(ad-group)、推广计划(campaign)和客户(cust)的相关信息,如宝贝状态,销量,属性,类目,地域,以及推广计划的id,客户的id等。对候选集合的过滤就是根据正排数据来进行的。检索过程只负责检索出购买了这些竞价词的广告。根据正排数据来进行过滤的过程是由单独的一个阶段来完成的。
可以看到在搜索广告中检索过程是十分简单的,其实是一个精确匹配的结果,不像网页搜索引擎,需要支持多种语义
二、广告排序(Ranking)
检索完成后,就需要确定广告的输出顺序,需要兼顾用户体验和搜索平台的收益。这个阶段必须综合考虑竞价和相关性分数(例如ecpm)。目前有两种主流的方法,以赛马为例:
反应式(Reactive):选定一匹马,根据它的历史成绩来预测未来的表现
预估式(Predictive):根据体重,腿长等特征为赛马建模,找到这些特征在预测比赛名次终的重要程度,然后基于这些特征来给见过、未见过的赛马预测成绩。
当我们拥有对某赛马的足够信息的时候,就使用这些信息(反应性),否则使用模型(预测性)。
(一)分层排序
记得计算机界某大牛曾经说过,任何问题都可以通过增加一层来解决,在广告搜索引擎中也是通过分层的形式解决复杂问题的,大到匹配(Matching)和排序(Ranking),小到广告集合的处理,无处不在分层的思想。
在广告搜索引擎中,由海选、初选和精选三个阶段来配合完成广告的排序工作,其中海选和初选都是在做剪枝操作,尽量缩小问题的规模。广告和自然搜索的差异之一,就在于广告位相对自然搜索的位置,是相当少的。所以决定了在竞争激烈的情况下,排在后面的广告是没有机会展现的。因此可以考虑在早期过程就发现这些宝贝,然后干掉这些宝贝,此时每个宝贝的排序分数不需要非常精确,能达到一定的筛选效果就可以,这就是全量索引截断、海选和初选的思想。而最精确的打分,是发生在精选阶段的。一般都会采用单独的线上打分服务来完成的。
(二)全量索引截断
全量建索引的时候,会对倒排链超过一定数量的热词进行截断,根据排序分数来取这个倒排链下的top N个宝贝。
海选
广告搜索是轻检索,重过滤的。当检索阶段拿到的广告候选集合后,会进行海选。海选这个名称非常形象,这不就是歌手大赛的海选阶段吗?只有实力唱将才能脱颖而出。
初选
为了减少对线上打分服务的压力,海选阶段完成后,还需要经历初选阶段。