从地图上「看」出肥胖─转移学习

2020-06-17|浏览量:399|点赞:840
從地圖上「看」出肥胖─轉移學習 美国的肥胖问题严重,近四成国民患有病态肥胖。如何由茫茫人海中缩小範围,筛选出尤其非遗传性肥胖的高风险族群,并对症下药,是许多公卫研究的重心。华盛顿大学的两位日籍研究人员提出了新的调查方法:透过地图分析城市的环境规划与土地利用,窥探当地居民的饮食与运动习惯,以预估当地的肥胖人口。看似多此一举,但在AI的协助下,反而能将有限的资料与资源,作最有效率的利用。

肥胖问题

肥胖是全球普遍面临的公共卫生问题。早在1997年联合国卫生组织便将肥胖视为全球流行病。2017年,美国疾管局的调查,更发现约四成成年国民罹患病态肥胖(obesity,身体质量指数BMI大于30),比例高居已开发国家之首。如何由茫茫人海中缩小範围,筛选出尤其非遗传性肥胖的高风险族群,并依此制定卫生政策,将经费与资源作最有效的利用,已是许多公卫研究与调查的重心。

华盛顿大学的两位日籍研究人员─Elaine Okanyene Nsoesie与Adyasha Maharana─有了新的发想:或可由地图上看出一城镇的环境规划与土地利用,并藉此窥知当地居民的饮食、运动等生活习惯,甚至预估当地的肥胖人口。

别小看地图上的资讯

这样的想法并不新颖,只是在网路与资讯普及的现在,这一类的资料已可说是俯首可得。另一方面,AI在图像辨识与电脑视觉的发展已然十分成熟,可大幅降低图籍判读与分类的人力与资源。例如Google地图上的卫星图像,可不经由人工先行分类与标记,直接透过卷积神经网络(convolutional neural networks,CNN)提取环境特徵,AI得以準确辨识当地的绿地、水岸、住宅等地貌,令当地的土地利用规划一览无遗。

除了上述的卫星图像,Google地图上商家资讯所能提供的资讯量亦不可小觑。例如公园、健身房或运动中心的密度,无形间透露出当地居民的运动习惯、是否有足够的运动场所与去处。即使某些乍看无关的商家,也可能有着意想不到的关联,例如:宠物店的密度,某种程度上反映出当地居民饲养宠物的比例。如若饲养中大型犬,便免不了养成散步遛狗或慢跑的生活习惯。只是,两种图籍资料,何者才是预测肥胖人口最关键也最有效的指标,正是研究的关键。

转移学习看出端倪

为此,研究选择四个美国城市为样本:加州洛杉矶(Los Angeles, California)、田纳西州孟菲斯(Memphis, Tennessee)、德州圣安东尼奥(San Antonio, Texas)与华盛顿州西雅图(Seattle, Washington)。共计15万幅的高解析度Google卫星图像,未经人工前处理,透过预先训练好的CNN提取图像特徵,辨识如绿地、水文、人工建筑、道路等地貌,此为资料A;另一方面,研究人员也由Google地图上下载了上述城市所有的商家资讯,包含健身房、医疗院所、警察局、邮局等在内,共96类「关注场所」(place of interest,POI),此为资料B。这些资料随后分别转移予另一AI,用以预测当地的肥胖盛行率(prevalence)。

从地图上「看」出肥胖─转移学习

图一、转移学习的架构 ( 来源:A. Maharana et al, 2018. )

这样的做法,被称作「转移学习」(transfer learning):前一个AI将所得出的结果传授给另一个AI,以完成另一项新的任务或目标。其中被转移的结果与资料,通常与第二项任务息息相关。在此例中,第一个AI的任务是图像辨识,并将所提取出的特徵向量转授予第二个AI,以弹性网路迴归分析(Elastic Net Regression)筛选出与肥胖最有关联的变因,并依此「预测」当地的肥胖率。

从地图上「看」出肥胖─转移学习

图二、由上至下顺时针,分别为西雅图、孟非斯,圣安东尼奥与洛杉矶。各城市左图为实际肥胖率,右图为由地景资料所得出的预测值。颜色越深表示肥胖盛行率高,灰色区块则无资料。( 来源:A. Maharana et al, 2018. )

最后,将由资料A与资料B所得出的预测结果,分别与政府机构在当地的实际统计数据相比较,发现:整体而言,其中资料A,即直接透过AI由卫星图像中所抽取出的地貌特徵,如住宅形式(「密集集合住宅」或「独门独院的房舍」)、取向(「一般住宅」或「靠港、水岸,或带有自家游泳池的豪宅别墅」)与交通环境(「铁轨、公路遍布」或「可供行人行走的街道纵横交错」),可以更精确地预测当地的肥胖盛行率。推测应与这些地景资料或多或少反映出当地居民的「社经地位」有关,而「社经地位」与「肥胖率」的关联性,已有多项研究背书。

有趣的是:不同的资料在不同城市的表现不一。例如:在土地规划上本身绿地较多的西雅图都会区,凭藉卫星图像所做出的预测常低估当地肥胖盛行率;而POI在本身肥胖盛行率较高的城市,如德州圣安东尼奥及田纳西州孟非斯,反而有较佳的预测力,即使仍然低于卫星图像所得出的预测。

经济实惠的调查

过往已有人尝试类似方法,利用CNN与卫星图像,以地景样貌来推估贫穷人口的分布多寡,例如由人口聚集程度与夜间照明密度,来估算当地居民的资产及消费能力,且获得不错的成果。如何利用有限资料来推估实情,在政府政策执行力低下、人口普查不易,且缺乏可靠统计数据的发展中国家尤为紧要,而CNN与转移学习的应用,也让整个过程更经济且快速,在在彰显了AI在诸多领域,甚至政府公卫政策制定、国土规划上的发展潜力。

参考资料

上一篇: 下一篇:

相关推荐