探究数据的奥秘:全球数据革命时代,上纽大如何立于学术前沿?

data science cover
2020年2月 23日

机器人是否可以创作扣人心弦的乐曲?社交媒体能否帮助理解抗抑郁药的效用?人工智能技术是否可以预测股市?

上海纽约大学的教授与学生们正在利用日新月异的强大数据科学工具,尝试寻找这些问题的答案。

每天,数以亿计的互联网设备与服务生成海量的原始数据——从消费者何时购买了何种商品,到人们的旅行地点和天数,再到每时每刻的热议话题……人类从未累积过规模如此庞大的原始数据,也从未拥有过如此强大的数据处理能力。

过去十年里,计算机科学家、数学家、统计学家以及来自其他领域的专家,通过机器学习算法和人工智能技术,以及特定领域的专业知识来厘清纷繁复杂的信息数据,从中获得真知灼见。于是,“数据科学”这一方法论与学科应运而生。该学科利用数学、统计学和计算机科学领域的知识,分析从交通运输、市场营销、人类学、政治科学、音乐、文学,以及人类行为等各个领域收集而来的大量数据。 

上海纽约大学工程与计算机科学学部主任Keith Ross教授表示:“通过数据科学所获得的洞见每天都在改变人们的工作、娱乐、社交方式,推动各个领域的发展创新。”

数据科学实践助理教授郭丽在加入上海纽约大学之前,曾在美国专业汽车评价公司凯利蓝皮书以及阿里巴巴集团担任数据分析师。她表示:“无论是从事市场营销、研发工作,还是金融工作,每个行业都离不开数据科学知识。”

 
 

data science cover

信息系统和商业分析助理教授Enric Junqué de Fortuny重点研究人为数据建模及其在商业中的应用。

 

“各大公司每天都需要做出大量决策,例如:Acme Marketing市场营销公司想要预测哪些消费者对某一产品感兴趣;一款糖尿病手机应用程序的开发者希望能推估病人的病情进展;面向青少年的社交媒体公司需要检查是否有用户提供虚假年龄信息,”上海纽约大学信息系统和商业分析助理教授Enric Junqué de Fortuny说,“在这些情境下,公司都需要在充满未知的环境里对人们的行为状态做出决策和判断,而数据科学可以减少决策过程中的不确定性。未来,随着企业和社会完成必要的数字化转型,消费者将享受更为优质的产品与服务,并最终从中获益。”​

 

充满机遇的世界,精心设计的课程

在这一全球数据浪潮的推动下,数据科学已成为上海纽约大学发展速度最快的专业。自2016年开设以来,已有超过十分之一的学生选择数据科学作为自己的第一或第二专业。Ross教授指出,上海纽约大学是首批开设数据科学本科专业的实行博雅通识教育的大学之一。

专业设置遵循数据科学的跨学科本质,要求学生不仅要掌握基础统计方法或算法,也要对运用数据分析工具的相关领域有所了解。专业下设有基因组学、人工智能、经济学等9个研究子领域,是全球数据科学领域学习模式最灵活、涉及范围最广的本科生项目之一。学校目前拥有12名数据科学骨干教师,专业背景不仅包括计算机科学和数学领域,还覆盖金融学、城市规划、神经科学等不同应用领域,未来计划纳入社会科学和数据科学方法论等领域的教授。

 

data science cover

2020届数据科学专业的学生Kelly Marshall曾在暑假期间,与工程与计算机科学学部主任Keith Ross合作编写强化学习新算法, 运用模拟神经网络教人工智能通过试错法提升表现。

 

专注于人工智能方向的2020届数据科学专业学生Kelly Marshall表示,这个专业最吸引他的一点,是能够培养对数据科学方法论的应用能力。除了主修数据科学,Marshall还辅修了中文和数学专业。他认为,每学期在学习专业课程的同时修读两门人文课程,有助于提升他在数据科学方面的学业表现。

“如果一个数据科学项目出了问题,通常是因为项目设计者过于信任计算机预测,而没有运用任何其他领域的知识,”Kelly说,“因此,上海纽约大学的数据科学专业强调研究者必须要对所应用分析的领域有所了解,这一点非常重要。”

去年暑假,Marshall与Ross教授合作编写了深度强化学习新算法。作为人工智能的重要分支,深度强化学习运用神经网络和试错法机制,来寻找针对顺序决策问题的最优策略,其应用包括机器人控制和下围棋游戏等。通常,本科阶段不会讲授深度强化学习的知识,但上海纽约大学的很多学生修读了概率论和计算机科学的高阶课程,他们有能力学习了解研究生阶段的课程内容。“即便是在机器学习导论课上,我们也会讲授通常在研究生阶段才会涉及的相关知识。”Ross教授说。

上海纽约大学的学生表示,教授为他们的学习和研究提供了许多支持与帮助,鼓励大家根据个人研究兴趣与能力勇敢探索。“大二那年,我参加了夏光宇教授组织的深度学习独立研究小组。课堂上,夏教授给我们展示了他和机器人合奏音乐的精彩视频,还告诉我们,‘你们现在就可以开始学习如何开展这样的项目’,这激发了我强烈的好奇心,”Marshall说,“在夏教授的讲解下,一些非常复杂的概念变得不再抽象难懂。很高兴能在大二时就与教授展开合作,我从没想到自己能在本科阶段就拥有如此宝贵的研究经历。”

 

科学无疆界

上海纽约大学数据科学项目的跨学科属性,意味着教授们的研究涉及现实生活的方方面面。

 
 

data science cover

在“网络分析”课上,信息系统与商业分析助理教授Bruno Abrahao与学生探讨数据科学项目。

 

在上海纽约大学信息系统与商业分析助理教授Bruno Abrahao的最新研究项目中,他与来自哈佛医学院、佐治亚理工学院和微软研究院的研究人员一起分析了数百万条推特帖子,探索服用精神类药物对患者的长期影响。研究团队采用了自然语言处理方法,先找出正在服用精神类药物的推特用户,然后创建人工智能模型以识别这些用户推文的特征规律。他们的研究论文在“全球人工智能协会网络与社交媒体大会” 上荣获“杰出研究设计奖”。Abrahao教授及其团队发现,对于自称正在服用某种抗抑郁药物的推特用户,其推文用语所体现出的情绪和认知状态,在服药前后显示出明显差别。Abrahao教授说:“我们的研究结果表明:未来,医疗保健机构可以利用此类社交媒体的数据分析结果,为病患提供更优化、更精准的个性化药物和治疗方案。”

 

data science cover

2019 年4月,计算机科学助理教授夏光宇做客造就“创造力”专场论坛,与现场观众探讨何为音乐智能,创造力的三个层次,以及人工智能是否可以让人们更具创造力等话题。造就是一个剧院式演讲平台,致力于分享最富创意的思想。

 

在上海纽约大学“Music X”实验室中,计算机科学助理教授夏光宇正在训练人工智能“音乐家”与真人一起合作表演。借助“特征学习”算法,夏教授的人工智能“音乐家”可识别出某位音乐家作品中的音调、音色、音量和节奏特征,并将其与音乐中的数百万种音调、节拍和结构组合进行比较,创作出一首模仿该音乐家风格的作品。夏教授的人工智能“音乐家”甚至可以即兴创作,与真人一同探索新的音乐方向。

作为一名专业笛箫乐手,夏教授希望这项研究成果可以帮助更多人欣赏、演奏并创作音乐。

“这是人性与技术的完美融合。” 夏教授说道。

 

data science cover

夏光宇教授和他的学生设计的“触觉教学长笛”,可根据演奏者的水平对教学方法进行灵活调整。

信息系统和商业分析助理教授Enric Junqué de Fortuny重点研究人为数据建模及其在商业中的应用。“在一项研究中,我们对数百万名受试者的大量细粒度行为数据进行了分析,随后对这些受试者的情况进行准确预测,包括他们对自己的生活是否满意,政治倾向为何,或是否有滥用药物的倾向。研究结果表明,通过数据科学工具,我们可以对这些看似难以揣摩的事件进行相当精准的预测!”

郭丽教授正在研究如何将统计分析与深度学习结合,从而提升人脸识别技术的识别率:“我目前研究的是基于面部图像判断人的年龄和性别。因为年龄预测实际上是一个有序变量,所以,我可以将传统统计学领域的有序回归与深度学习相结合,从而提高年龄和性别识别的准确度。”

 

data science cover

数据科学实践助理教授郭丽在加入上海纽约大学之前,曾在美国专业汽车评价公司凯利蓝皮书,以及阿里巴巴集团担任数据分析师。

 

日新月异的上海,技术改革的前沿

对于学校师生而言,除了在数据科学领域的科研实力与发展活力,吸引他们加入上海纽约大学的另一点在于上海这座城市本身的优势与潜力——它是原始数据和数据科学发展的孵化器。“中国的人工智能领域发展迅速,吸引了大量投资,创业公司蓬勃发展。和其他国家、地区相比,中国在数据源交换以及学术界和行业之间的交流方面也更加灵活自由。”Abrahao教授说。  

上海纽约大学已与位于上海的数家知名公司在数据领域建立了的合作,最近一次是2019年4月在汇丰中国(HBCN)的赞助下举办了首届数据建模大赛“Hack The Pearl”。比赛规定各支团队利用汇丰中国提供的历史大数据,开发模型预测客户购买投资理财产品的可能性。在对比了参赛团队的预测结果与实际情况后,汇丰中国从中选择获胜团队并为其提供实习机会。

Junqué de Fortuny教授担任了此次大赛的裁判和顾问。他表示,这种体验式学习经历十分宝贵,对同学们日后在像上海这样颇具活力的大都市发展大有裨益。  

“短短几年内,上海已从金融、航运中心转变为全球科技创新发展的引擎——从机器人酒吧,到人工智能芯片公司,再到无人驾驶汽车,但凡你能想到的,都能在这里找到踪迹,”Junqué de Fortuny教授说,“想要真正体验这些创新技术的活力与发展,唯一的途径就是参与其中。在上海纽约大学工作拓展了我的视野,让我对中国数字化转型及其对社会的影响有了更深刻的理解与认识。”