陈纯,腾讯数据平台部工程师,参与Gaia资源调度平台的开发,目前负责Docker的研发工作。爱好鼓捣源代码,对Hive、Yarn、Docker等开源项目贡献过代码。“从时间角度来看,大数据可以分成两类,一类是历史的大数据,即批式大数据;另一类是实时的大数据,即流式大数据。作个通俗的比喻,大数据等同于水库,那么存在水库里的水就是批式大数据,而随时流进水库的水就是流式大数据。”一开场,计算机应用专家、浙江大学计算机科学与技术学院教授、中国工程院院士陈纯就用一个通俗易懂的比喻把晦涩难懂的专业术语阐述得简单明了。