开源大数据平台全栈设计及创新应用

主题:   开源大数据平台全栈设计及创新应用主讲人:   王永坤地点:   松江校区一号学院楼140报告厅时间:   2017-12-12 13:00:00组织单位:   计算机科学与技术学院

      主讲人简介:

      王永坤,博士,目前供职于上海交通大学网络信息中心。2004年毕业于上海交通大学,先后任职于IBM和美国国家仪器公司。2011年从东京大学取得博士学位,曾获得东京大学奖学金、文部省及JSPS Global COE奖学金。之后供职于日本最大互联网企业Rakuten集团大数据部和Rakuten技术研究所,任数据科学家(Data Scientist)和首席软件工程师(Chief Software Engineer),负责大数据平台的架构设计、管理及应用。在PB级数据量、来自各行业的异构数据、以及日均十亿级别数据流的实时大数据分析系统方面,有多年企业级研究分析经验。在美日等国申请多项专利,发表多篇国际会议论文,任多个国际会议的组委会委员,以及IEEE Transactions on Computers等杂志的审稿人。ACM及CCF会员。

       报告简介:

       由于校内外数据的计算和存储需求不断增大,上海交通大学开始着手构建自己的校级大数据分析平台,并作为转化医学国家重大基础设施的计算平台。在这次报告中,我会分享一下数据平台搭建的第一手经验。从机器配置,到软件架构设计及安装配置(Hadoop、Spark等),到运维,再到一些相关的数据应用,特别是支撑了上海市开放数据创新应用大赛(SODA)的一些经验。

       语言:中文


编辑:向娟       撰写:李倩