简介
京东钼媒数据平台 是数字营销生态部门的数据集市,整合了集团内外部的线下特色数据能力。目标是以数据智能为核心,驱动线下营销业务发展,赋能广告主客户。
数据平台能力:
支持上层应用:
我的工作内容
数据接入:1)外部包括POI、AOI数据采买,POI行业深度数据爬虫,电信运营商线下轨迹及群像等数据采买,IOT设备采集数据接入。 2)内部包括集团标签、流量行为等数据资源接入,ID打通对接等。 挑战:针对不同的数据特征、合规及成本约束,制定合理、全面的取数方案。
数据治理:1)多方POI合并去重,定义标准地址层级,对POI深度信息进行抽取融合。 2)线上行为数据模型:刻画用户在线上对商品、店铺的浏览、关注、加购、下单等行为。3)线下行为数据模型:刻画用户在线下的到访地、到访轨迹、时段与频次。4)媒体数据模型:统一线下媒体,关联媒体网点POI、场景分类等信息。 挑战:多源异构数据的融合与提炼。
数据挖掘:1)客流估测模型:以运营商数据、IOT数据作为正样本,以POI数据、报点数据、用户画像、统计年鉴数据等作为特征因子,基于DNN对POI客流进行估算。估测精度达小区级,覆盖全国。 2)POI引擎:对非结构化地址使用命名实体识别、地址树等技术进行地址元素提取、补全,使用多种创新方法挖掘AOI。 3)线下行为标签:基于自有报点,挖掘用户高频线下行为类标签17个。
数据服务:1)POI相关,地址-POI匹配、POI查询、POI多维统计分析、POI客流、TA浓度;2)人群相关,ID映射、人群圈选构建、群像、交叉分析、TA浓度;3)媒体相关,媒体查询、媒体统计分析; 4)IOT数据接入,定义门店创建、设备绑定、数据上报相关接口。 亮点:接口的灵活性与通用性。
挑战:在满足数据合规情况下,对多源异构数据进行融合与提炼。
工作成果
- 完成数据平台建设,成为部门的核心能力之一;
- 涵盖POI 7000万+,有效客流POI 3800万+,ID总量30亿+,覆盖用户10亿+,标签数量6.2万+,屏幕1000万+;覆盖4000+ 品类,60+ 行业,5大线下场景;
- 提供广告营销一站式数据接口,成为星图(DMP)、钼媒智投(DSP)、M+(广告监播) 等上层应用的数据能力基石;
- 成为行业分析报告、外部联邦建模合作的主要数据源。