在数据中台概念清晰之前,各个互联网公司其实也都做很多的基础建设工作,只是没有明确地定义为数据中台而已。每个公司都在实践中寻找解决数据应用实践方法,例如构建指标体系解决指标口径不一致的问题;建设自助取数工具,业务自助取数不求人,开发人力释放专注于数仓模型建设;开发配置化的BI可视化产品,减少可视化报表对接口开发、前端开发人力的依赖;建设精准画像(DMP)平台,业务自助圈选目标用户进行精准触达,降低运营压力等。
可以把数据中台类比成汽车工厂,如果发动机、轮胎等零配件已经生产完毕,可以很快组装出一辆汽车。而Hadoop生态,集群建设,就像水电煤等基础设施,提供工厂运行所需能源支持,大数据平台,数据开发工具就像是机床设备,提供制造零配件的工具能力,而数据仓库的建设,则像是用机床加工好各自零配件,并且提供快捷的仓库索引目录,能够最短时间找到所需配件。
数据中台、数据仓库和数据湖没有直接的关系,在某个维度上他们为产生的价值形式不同的侧重,数据中台距离业务更近,更快速相应业务和应用开发的需求,可追朔,更精确。