云铮
2003年初加入阿里巴巴,成功创建阿里巴巴dw,经历了阿里dw从创建到成熟运用。2005年,淘宝数据开始启动,调任淘宝,打造淘宝数据平台体系,推动商业智能体系建设,引入高端SAS,SPSS CLEMENTINE标准数据挖掘体系,并对第一批数据挖掘人员进行数据挖掘技术和实施流程培训。负责淘宝数据平台体系架构的每一次大的升级换代,历经oracle单机,到oracle RAC 4节点高端存储,到oracle RAC 12节点,到全球最大的oracle RAC 20节点,在到目前的2000台规模的hadoop 云梯分布式计算集群,数据体系在这些平台发展过程中平稳升级,对应用全透明,集群的规模在增加,任务job在 迅速扩展,得力于良好的应用架构,运维人员能轻松应对,实现高效,自动化运维。对国内外最新数据技术狂热,在和国内外业界行家交流和阿里,淘宝的实战中,糅合所学所见,无门无派,注重实效,自成一套淘宝数据体系建设和运用的实战方法。八年数据生涯的梦想是能够推动集团数据统一体系架构,为数据化运营,推动实现十年数据战略尽自己一份力。
泽远
毕业于华中科技大学光电子工程系,曾先后就职于华为,腾讯,从事过电子商务网站基础架构与中间件的设计开发工作。参与和主导过用户中心重构,商品中心重构,规则引擎开发、Web Server、高性能服务框架、分布式KV数据库的开发。
2010年加入淘宝,从事淘宝海量数据仓库的平台化建设工作。主导和参与过的项目有,Dbloader优化,DataX开发和数据同步平台、刀锋项目,指标系统,天网调度重构,告警平台,目前专注于数据服务平台化建议和流式数据处理。
主要兴趣领域有高性能服务器,Hadoop,数据仓库,企业应用架构与SOA。爱技术,也爱产品,关注技术背后的商业价值,理想是为淘宝数据开发之路贡献力量。
图海
6年多的数据行业相关经验,2009年加入淘宝,参与了淘宝数据部门从RAC平台向分布式平台转变的全过程,成功的搭建和维护了符合淘宝数据业务的分布式平台(2000台的hadoop集群)。
主要关注于分布式系统的应用优化,对于分布式存储和计算有比较深入的了解,通过技术和业务的结合,成功实现了降低2/3的存储优化效果和提升一倍运行效率的计算优化。
在数据库、海量数据存储、分布式系统等方面具备深厚的理论知识与实践经验,此外,对于Linux系统,脚本编程,架构设计方面也有比较浓厚的兴趣和经验。
薛奎
1998年参加工作,04年加入腾讯互联网事业部从事数据仓库建设,08年加入淘宝数据平台,有近7年的数据仓库工作经验,经历了从传统单节点oracle,到oracle rac集群,到Greenplum云数据仓库再到现在的hadoop云计算平台的平台转换,以及不同数量级的数据与不同业务需求的挑战;目前担任数据开发团队的TL,直接面对淘宝集市与淘宝商城的数据应用需求的挑战,如何将我们海量的数据转化为商业价值的挑战,欢迎更多敢于接受挑战的人与我一起面对。
剑英
2004-02-16加入淘宝,先后曾负责淘宝的SCM、APPops、Log analyse系统的建设,目前负责数据平台与产品部门的基础平台建设:MapReduce、Hdfs、Hbase、TimeTunnel、Hive,熟悉分布式数据计算存储同步平台和数据仓库方面的技术架构
毕玄
07年加入淘宝,被称为“国内OSGi第一人”,编写的《OSGi实战》和《OSGi进阶》两篇Opendoc,很长时间以来是OSGi领域仅有的中文文档资料。07年通过OSGi官方联盟的授权,建立了官方认可的全球第六个User Group。 09年与曾宪杰(华黎)合著《OSGi原理与最佳实践》,国内第一本OSGi中文书,全球第二本OSGi技术书。10年出版新书《分布式Java应用:基础与实践》。07—10年主要负责HSF,Notity等服务框架的实现,目前此服务框架大范围的在淘宝使用,每天经过服务框架的请求量为120亿+。 目前主要负责online海量数据存储和分析的实现。关键字: JVM SOA 高并发 高可用 网络通信 NoSQL
周忱
本科毕业后, 先后在几家公司做过flash开发、数据库开发、ECMAScript4虚拟机研发等。对基于字节码的虚拟机有一些了解,写过混淆器。07年回归学校读研,主要致力于分布式系统的研究,包括分布式数据挖掘算法、分布式数据库实现及分布式Online/Offline数据系统。开源软件的爱好者, Apache Hive Contributor.
在淘宝的经历:
09年1月实习, 实习期间维护过一段时间Hadoop; 将Hive引入淘宝替代Oracle RAC成为数据平台部门的主流数据仓库, 维护淘宝版Hive.
10年6月毕业后正式加入淘宝, 负责Hadoop及Hive研发.主要完成了极限存储的设计与实现, 云梯NameNode优化等项目.
目前在致力于Hadoop的效率与存储优化 关键字(熟悉的领域): 分布式系统 多线程 并发
空无
2009年6月加入淘宝,负责淘宝官方数据产品的研发,有近七年数据产品的开发经验,加入淘宝前在ClairNET负责维度系统的研发。擅长海量数据产品的架构、数据可视化的创新设计和实现。
目前负责数据魔方、淘宝指数等数据产品的研发和产品运营,致力于使用创新技术充分挖掘淘宝海量数据的价值,帮助淘宝真正成为一家数据化运营的公司。
数据魔方 http://data.taobao.com/ 是基于淘宝全量数据的商业数据产品。熟悉的领域:海量数据处理、WEB相关技术、数据可视化
玄难
有12年的电信移动CRM和BOSS系统的领域建模和技术架构经验,并带领团队完成以年为单位上百人的大型项目实施工作。 建立过一套J2EE基础开发平台。涉及前台UI的组件化和自动化,服务的定义和注册管理,数据的O-R Mapping、规则引擎、包括Process、Workflow、BPM、PageFlow的流程平台。系统的自动化部署,系统的个层面的运行期监控。在各种类型的项目和开发人员中得到了很好的应用。
对问题域的抽象建模和偏业务的技术架构有浓厚的兴趣和一定的实践经验。崇尚系统的模型简单、架构简单、代码简单为美。
2009年8月加入淘宝,负责汇金系统【汇金系统:是淘宝自有服务和第三方服务的售卖方式和价格定义、销售、服务开通、分成结算和最后的财务核算系统】的技术架构和团队管理工作。
元甲
中国海洋大学 数学系硕士,从2004至今一直从事bi应用相关领域,经历了从传统通信行业向电子商务行业的转化,关注领域,数据仓库的建设,数据应用和产品建设,通过系统化的数据解决业务应用上的问题。
冰夷
量子恒道总监,北京邮电大学 通信与信息系统硕士,从2004年至今 先后服务过阿里巴巴旗下雅虎中国、阿里妈妈、淘宝网。负责过雅虎中国、阿里妈妈以及淘宝广告与搜索事业部数据团队和系统建设,为业务运营、各技术系统、高层战略决策等提供数据、分析支撑。现致力于电子商务数据产品及服务的研究和推广,推动数据应用。
张中
哈尔滨工业大学 理学硕士,从2006年至今 先后供职于阿里巴巴旗下雅虎中国、淘宝
专注于:
1、 海量数据的离线分布式处理和在线流式处理
2、 基于REST模式的web 2.0高性能数据分析网站框架
3、 对开源关系型数据库(Mysql/Postgresql)源码有深入研究
同时关注:
4、 异构高性能并行计算
5、 相关推荐技术
逸客
北京邮电大学 计算机硕士,从2005年至今 先后供职于阿里巴巴旗下雅虎中国、阿里妈妈、淘宝网
1、多年数据仓库及数据挖掘经验,目前专注数据仓库、数据挖掘在互联网的应用
2、主导淘宝直通车数据系统和量子统计数据体系建设,并推动后台数据的生产应用
3、擅长数据仓库建模及性能优化,能整合来自业务的需求
4、在数据专题分析、用户行为分析等领域有较多研究