互联网商业广告出现在我们浏览的网页、APP或者朋友圈里,以信息流、轮播、开屏等多姿多彩的样式呈现在各种设备的前端页面上,是公司、广告主、消费者三方获利的有效渠道,那么今天就用10分钟时间,来了解互联网广告背后优雅的技术架构。
01 数据虚拟化概要
首先了解数据虚拟化技术,学习思路可以参考下面的思维导图。了解数据虚拟化的相关概念,包括体系架构和关键技术,以及利用数据虚拟化服务器构建虚拟化层的方法和原则,实现海量多源异构数据的管理。
数据虚拟化技术学习思维导图
数据虚拟化系统的目的是:针对异构、多源、多所有者的数据集,通过对数据资源的逻辑虚拟化,实现数据的集成管理并提供统一的访问接口,以便为各种数据消费需求提供跨数据源整合的数据服务。数据消费者不需要关心数据从哪些数据源来、如何集成,以及数据的存储位置与方式、访问接口等细节,数据虚拟化将这些技术细节对用户隐藏,通过一个逻辑抽象层集成管理、整合各个数据源。
数据的清洗、转换与加载在逻辑抽象层完成,实现用户以完全透明的方式访问所有数据源。用户只需通过统一的接口即可进行访问。
*注:资料参考书籍《数据虚拟化:多源异构数据集成之道》
02 互联网广告联盟的架构
互联网广告联盟是指集合中小网络媒体资源组成联盟,通过联盟平台帮助广告主实现广告投放,并进行广告投放数据监测统计,广告主则按照网络广告的实际效果向联盟会员支付广告费用的网络广告组织投放形式。
*注:概念来自百度百科
互联网广告联盟的架构
联盟架构分为3部分:
SSP:拥有大流量的网站、公众号、平台等可以提供广告位,帮助广告主进行商品的宣传,他们汇集的团体就是销售方平台;
DSP:广告主需要对自己的商品进行宣传,获得各种广告位来展示商品的信息,包括图片、文字和视频等,这一部分群体构成需求方平台;
ADX:如果仅仅通过点对点的交流,流量主和广告主的效率和实效都很差,这是就需要利用第三方技术在数以百万计的网站或移动端针对每一个用户展示行为进行评估以及出价的竞价技术,即ADX平台。
一次成功的广告展示所需的流程:
-
SSP向ADX请求广告后,ADX向DSP发竞价(bidding)请求,告知DSP本次曝光的属性,如物料的尺寸、广告位出现的URL和类别等;
-
DSP接到竞价请求后,在几十毫秒之内决定是否参与曝光竞价、竞价值是多少,把竞价的响应返回ADX;
-
如果ADX判定该DSP赢得了该次竞价,要在极短时间内把DSP所代表的广告主的广告迅速送到用户的浏览器上,进行前端的渲染。
03 数据虚拟化的应用
在互联网广告呈现时,通过同一广告联盟架构,但是每一位网民在页面上看到的广告推词都是有差别的,是与自己的搜索浏览行为密切相关的,具有个性化特征,这就涉及到数据虚拟化技术在广告推词上的优化。
推词的数据源可以分为7大类,包括用户属性、页面属性及接入设备信息等等,这些多源异构数据需要进行系统的管理,数据抽取就是将所需要的数据从源数据端抽取出来,源数据可能是结构化数据,也可能是半结构化数据,如HTML文件等。
数据虚拟化在互联网广告联盟方面的应用
例如搜索类广告在进行用户关键词提取时,需要获取用户信息和页面信息,其中用户信息就包括用户检索词、历史检索词等;页面信息是通过技术手段抽取页面标题、类型、网站特征等得到的,主要是从页面前端的半结构化数据里抽取信息。半结构化数据的特殊性在于它有自己的结构,需要挖掘出html文件里的数据。
数据抽取的过程分为全量抽取和增量抽取:
-
全量抽取就是指将源表和视图中所有的数据不做任何处理地抽取出来,一般只在初始化系统的时候使用;
-
系统初始化后一般采用增量抽取,就是抽取在上次提取以后数据源发生变化的记录。
将以上两类信息进行过滤后进行扩展和排序,排序的依据可能为CTR的预估或者是CPM的计算,最终将最优词传给广告位后台,再进行前端的渲染和呈现。
以上是数据虚拟化在互联网商业广告方面的应用简述,数据虚拟化与商业广告这两个词语背后都拥有庞大而优雅的技术架构,本文只是简要分享两者结合的一个场景。
欢迎大家关注公众号:通信大数据分析及应用
扫码: