麻省理工学院教授到访数据科学中心




masheng1

2015年10月28日,麻省理工学院计算机科学和人工智能实验室的Dr. Micheal L.Brodie到访北邮数据科学中心,为北邮老师和学生呈现了精彩的讲座,讲座在教三811会议室成功举办。

讲座由信息与通信工程学院马占宇副教授主持,信息与通信工程学院执行院长张琳教授、部分教师代表及多名学生参加了本次活动,会议室气氛热烈,现场座无虚席。整个讲座过程中,教授语言生动幽默,内容丰富,案例鲜活,让我们受益非浅,收获颇多。

masheng2

Dr. Micheal L.Brodie进行了以“The Emerging Discipline of Data Science”为题的讲座,从“什么是大数据分析”、“大数据分析是否是一种新的模式”、“数据究竟扮演着怎样的角色”、“什么地方最可能出现错误”以及“数据科学是什么”等方面,带领我们深刻且专业地审视了大数据及数据科学的发展、现在和未来。

在讲座中,教授首先对大数据和数据科学进行了精辟的阐述。随后,教授用鲜活的实例向我们表明了大数据为什么会出错以及什么地方最可能出错,并阐述了大数据研究的目的。最后,教授阐述了大数据分析的流程,包括数据的采集、合理的数据清洗、借助机器学习算法的数据建模等。

masheng3

大数据分析为多个领域贡献了有意义的成果,Dr. Micheal L.Brodie举例进行了详细的说明,包括粒子物理领域的研究(如希格斯玻色子),使用Fitbit数据识别和解决睡眠障碍,文学、戏剧和购物的推荐系统等。

在科学、工程、医疗保健等多个领域,50多个国家政府建立了数据驱动的策略制定方法。比如美国国立卫生研究院和总统奥巴马提出的“精密医学倡议”,目的是对于特定的人,在正确的时间,提供正确的治疗方法。希望数据驱动技术能加速找到治愈和预防某些慢性病的方法,这些方法更加准确、更适合特定人群,并且有更低的成本。

Dr. Micheal L.Brodie的讲述让同学们意识到了大数据的潜在价值,对这些潜在价值的挖掘和应用决定了数据的价值!

masheng4

Dr. Micheal L.Brodie不仅向同学们展示数据,而且系统地阐明了数据科学的研究方法和必须遵循的研究准则。

什么是数据科学?数据科学是An experiment over data,专注于将数据与准则和技术结合进行大量实验,通过这些准则和技术评估准确率和提高准确率、完整性和数据分析的可靠性。当然建立这些准则和技术可能会需要很多年。

大数据分析的产生引发了很多改变,从思维方式、解决问题的方法到问题处理的形式。大数据分析也为多个领域贡献了有意义的成果。

大数据分析结果仍然会带来风险。比如推荐错误的产品,错误的医疗诊断、治疗,或药物。考虑到这些潜在的风险和大数据分析成果的广泛应用,保证数据分析结果的正确性、有效性是非常重要的。大数据研究的目的是为了发现真理(Truth)、以证据为基础的因果关系(Evidence-based causality)、基于证据的相关性(evidence-based correlations)。

masheng5

在最后的互动环节,各位教师和学生都非常珍惜这个难得的机会,积极向教授提问问题,和教授近距离交流了在大数据认识、使用以及数据挖掘等方面的问题,纷纷表示受益匪浅。

讲座的整个过程中,老师和同学不仅更加深入的理解了大数据、大数据技术、大数据的应用和潜在价值,而且一睹大师的风采。