(本文首发于《程序员》8月刊,略有调整。你可通过pengchun#taobao.com联系到作者。) 淘宝网拥有国内最具商业价值的海量数据。截至当前,每天有超过30亿的店铺、商品浏览记录,10亿在线商品数,上千万的成交、收藏和评价数据。如何从这些数据中挖掘出真正的商业价值,进而帮助淘宝、商家进行企业的数据化运营,帮助消费者进行理性的购物决策,是淘宝数据平台与产品部的使命。 为此,我们进行了一系列数据产品的研发,比如为大家所熟知的量子统计、数据魔方和淘宝指数等。尽管从业务层面来讲,数据产品的研发难度并不高;但在“海量”的限定下,数据产品的计算、存储和检索难度陡然上升。本文将以数据魔方为例,向大家介绍淘宝在海量数据产品技术架构方面的探索。
NodeParty 北京聚会,4月16日举行
CNodeJS.ORG将于4月16日在北京举行一次node.js技术聚会,聚会上将深度探讨node技术,同时为node的爱好者提供了一个互相交流的机会。这也是CNodeJS成立来第一次线下活动。

近期评论