数据魔方

数据魔方创立于2010年4月,是一个基于淘宝海量数据分析的商业数据产品,可以分析淘宝全行业的浏览、交易、收藏、搜索等数据,以及消费者的用户特征,可用于店铺数据化运营、市场行业研究等。 数据魔方也是淘宝首个全网商业数据产品,目前已经有超过5万的中高端卖家和企业在使用。 数据魔方技术架构,参照本文:http://www.tbdata.org/archives/1789 网址:http://data.taobao.com

量子恒道

量子恒道统计是淘宝官方唯一专注于卖家店铺经营数据的统计与分析产品,也是淘宝唯一能够提供实时店铺数据服务的商业产品。 2009年10月,量子恒道团队正式推出第一版店铺统计产品,在此后不到两年的时间里,量子恒道统计已经服务于超过200万淘宝卖家。 量子恒道统计不仅帮助淘宝卖家分析店铺的流量、转化、跳失、交易、收藏等经营数据,还提供多种流量来源及其效果的数据分析服务。 网址:http://lz.taobao.com

淘宝指数

淘宝指数是基于淘宝4亿消费者数据交叉分析的数据分享平台。 • 1、基于精准人群和CPV的数据 • 2、基于单品、品牌、店铺的数据,基于搜索的数据 • 3、长期的流行趋势,深度挖掘人群标签 • 4、基于消费者个人的购物数据 • 5、数据输出和可视化的创新尝试 网址:http://shu.taobao.com

淘宝情报

淘宝情报于2011年8月全面开放给淘宝百万卖家,是淘宝店铺经营的战地局势图,以数据记录每一天、每一个店铺的成长,揭示店铺在百万对手中的位置,披露同行业竞争变化与商机。 淘宝情报是淘宝第一份给卖家量身打造的数据情报。 网址:http://wo.taobao.com

汇金

汇金平台是淘宝订购、收费、结算、账务处理的业务支撑平台,为淘宝的各业务线完成软件服务订购、充值支付、服务开通、合作伙伴分成结算,商城保证金、技术年费管理、佣金、积分计费扣款,以及各新垂直市场的供应链结算业务。 汇金平台以基于各种业务建立了业务领域模型,产品的设计上充分抽象业务类型,形成通用性较高的产品解决方案,同时在结算、账务处理环节进行了严密的稽核、校验及预警机制来保证准确、及时地收费。产品上划分为产品管理、订购管理、计费结算、账务管理、数据监控,业务可以根据各自业务特征,选择在产品、订购、计费、账务各环节进行接入汇金,接入点后续的流程由汇金为您完成。 网址:http://pay.taobao.com

淘数据

淘数据,是淘宝数据平台对海量数据进行清洗、聚合,提炼之后产生的所有淘宝价值数据的集中展现平台。淘数据通过丰富的产品体系,为淘宝内部运营人员提供全面的数据服务,是淘宝网日常运营与管理的重要数据支撑工具 。

用户中心

用户中心是淘宝的用户数据中心,存储了用户的核心信息,包括用户名,密码,属性,身份证,支付宝绑定等等。是淘宝的一级核心应用,为淘宝的300多个应用提供服务,每天的访问量在200亿左右,注册用户数6亿左右。用户中心基本思路是采用分布式方式对用户信息的访问提供统一集中式管理,对外提供用户信息基础服务。用户中心为淘宝最稳定的系统之一,保证了淘宝每年4000亿的交易量。我们的目标是稳定为先,简单高效

云梯

全淘宝所有部门共享的统一分布式数据处理平台,整合hadoop,hive,hbase,timetunnel,datax,dbsync,天网调度等各项核心技术产品,支撑全公司所有研发人员,产品人员,运营人员,数据挖掘人员的数据采集,处理,分析,挖掘的各项需求。

计算平台:2000+ nodes   CPU:24000 core  Memory:48000G  Disk:24000片

数据规模:存储容量45P左右、综合资源利用率80%以上、日增商业数据50T/Day

计算任务: 计算任务数(50000+个/天)、 15%Map-Reduce作业,75%Hive作业 ,5%streaming作业

数据服务:报表查询(淘数据)、推荐引擎、量子统计、数据魔方、搜索平台的index building、广告平台的dump数据、淘宝指数、点击流日志分析、各类日志分析、搜索广告算法等