导航菜单
首页 >  约翰斯·霍普金斯大学数据科学硕士  > 揭秘约翰斯·霍普金斯大学

揭秘约翰斯·霍普金斯大学

揭秘约翰斯·霍普金斯大学

 

随着新冠病毒在全球范围蔓延,透明、真实的疫情数据备受关注。一段时间以来,在众多实时可视化数据发布平台中,约翰斯·霍普金斯大学的疫情数据频频出现在包括美国本土在内的多国媒体、机构的报道和分析中。

相关数据显示,从该疫情数据1月22日上线以来,每日平均使用量从1月底的2亿次,在3月初上升到每日12亿次,高峰时每日近20亿次。

统计数据的机构和网站如此之多,为何约翰斯·霍普金斯的数据更受青睐?这是一所什么样的学校?在科研、教学等方面有什么特色?它和中国大学又有哪些合作?

火爆的疫情地图背后:

权威的大学研究实力在“背书”

作为约翰斯·霍普金斯大学疫情可视化数据图的核心开发成员,过去很长一段时间,约翰斯·霍普金斯大学土木与系统工程学院博士一年级学生杜鸿儒一直在“连轴转”。他告诉记者,这一疫情可视化数据图由他的导师、该校系统科学与工程研究中心的劳伦·加德纳(Lauren Gardner)副教授倡议开发,最初的核心成员只有他和另外一位中国学生董恩盛。

“最开始,这一系统叫作‘约翰斯·霍普金斯大学系统科学与工程研究中心疫情可视化数据图’。”杜鸿儒介绍,在今年1月份,新冠肺炎疫情还未在全世界范围流行起来时,董恩盛就与导师达成一致意见,要做一个疫情数据地图,并于1月22日完成并上线了最早一版。最早数据的收集完全靠手动整理,每天最多更新4-5次,但随着疫情发展,这样的工作模式难以持续,2月1日,杜鸿儒开始加入。进入3月以后,数据已经可以实现每20分钟自动更新一次,并且加入了人工审核,保证数据准确性。

杜鸿儒告诉记者,他的工作主要分为两个阶段:“在手动收集的阶段主要负责数据收集整理以及美国数据的更新;进入自动更新阶段后,我主要负责编写自动更新的代码,同时负责维护Github数据库,通过对比WHO的数据,验证数据的准确性。”此外,为了不断完善可视化效果,研发团队还对数据地图进行了多次改版。

记者注意到,约翰斯·霍普金斯大学的疫情数据地图并不是“独此一家”。随着疫情在全球蔓延,哈佛大学与牛津大学合作、美国CDC官方以及《纽约时报》、CNN等媒体都构建了自己的数据发布体系。“对手”众多,约翰斯·霍普金斯大学的数据为何吸引到如此多的关注?采访中,多位专家告诉记者,美国是联邦制国家,各州可以根据自身情况制定不同的防疫措施,所以CDC地图的更新速度和精度都很有限。而约翰斯·霍普金斯大学疫情数据地图走红的背后,既有着“最早启动”等偶然性因素,也跟约翰斯·霍普金斯大学本身在医学和公共卫生领域的权威性相关。

“约翰斯·霍普金斯大学疫情数据图的‘走红’主要是两方面原因,一是他们及时搜集整理了来自中国网站丁香园、美国和欧洲疾控中心等的疫情数据,数据覆盖全球,更新及时,完整性和时效性甚至超过了WHO网站;二是约翰斯·霍普金斯大学在医学和公共卫生方面的研究历史悠久,实力雄厚,公众更加愿意相信它作为学术机构的权威性和独立性。这个数据系统的开发只是一项很具体的工作,社会效应是主要的,学术价值是次要的。霍普金斯大学的研究实力是他们在疫情危急时刻得到公众和媒体认可的主要原因。”清华大学医学院教授洪波告诉记者。

除此之外,清华大学医院管理研究院副院长薛镭认为,与其他数据发布平台相比,约翰斯·霍普金斯大学疫情可视化数据发布的界面易于导航和阅读,同时更新最频繁,在系统升级后可以自动抓取数据,即时性较高。“在这个过程中,值得点赞的是约翰斯·霍普金斯大学极强的学术敏感性,校方在发现这个疫情数据地图‘火’了之后,迅速给予了相关团队强有力的支持,保证了这项工作的可持续性和专业性。”薛镭说。

但在更新过程中,这一疫情数据地图也曾经出现过大的失误,比如北京时间4月14日上午8时曾误报“全球确诊病例200万”。

“因为我们做的是全球疫情地图,但每个国家的播报标准一直在变,比如西班牙会突然引入疑似病例,但我们因为语言障碍有时无法将这一变化及时反映出来。所以现在学校给我们配备了一个很大的团队在做这件事情,系统也更名为‘约翰斯·霍普金斯大学疫情可视化数据图’,图书馆、应用物理实验室的很多科研人员给我们提供了很大的帮助。目前,所有数据都已经实现了自动更新,只需要人工做一些异常情况的应对工作。”杜鸿儒介绍,他现在的工作重心已经转向了数学建模,即在数据展示的基础上进行

相关推荐: