在计算机视觉领域,识别和理解人类的行为是一项非常重要且有挑战的任务,根据识别目标的不同,可以分为正常行为的识别与分类和异常行为的识别与检测,其中对异常行为的识别和检测,能够及早发现问题,从而防止发生更严重的事态。人体的异常行为有许多不同的类型,也有不同的定义。异常行为一般可以分为群体行为和个体行为。典型的群体异常行为包括拥挤、聚集和争斗等,而典型的个体异常行为包括跌倒、逆行、逃避等。
跌倒,是生活中常见却又致命的异常行为,随着人口老龄化的快速增长,跌倒已经成为了人类意外死亡的第二大原因。从世界卫生组织公布的数据来看,大于 65 岁的老年人中约 28%~35%的人每年至少发生 1 次跌倒,而国内研究表明,社区老年人发生跌倒的比例约占 1/3[1],大部分老人跌倒后因为身体状况不佳可能会受到不同程度的伤害,65 岁及以上老年人中跌倒导致的死亡占该年龄段人群全部伤害致死原因的 34.83%,是该年龄段的首位伤害死因。引起老年人跌倒的因素很多,下图 为老年人跌倒的部分高频影响因素及构成比
由上图可以看出跌倒主要原因有几点:首先是年老导致的生理机能退化,使得老年人平衡能力下降,进而发生跌倒;其次是老人因为一些慢性病,以及对药物引发的相关不良反应也会发生跌倒;曾经发生跌倒事件的老年人平衡能力更差,心理上也更害怕再次跌倒,进而形成“跌倒—丧失信心—不敢活动—衰弱—更易跌倒”的恶性循环。
对于老年人来说,哪怕是轻微的跌倒,如果没有得到及时的发现和救助,也会威胁到他们的健康和生命,后续的治疗也是麻烦重重。跌倒之后能否得到及时地发现和救治,非常影响跌倒人员的生存率,多数死者是由于跌倒后长时间未得到有效救助而死亡,其中,死者在跌倒后 30 分钟内未得到有效救援的比例占63.2%,因此,对于跌倒行为的检测对于老人的安全具有重要的意义,建立快速有效的跌倒检测系统以及时发现老人跌倒行为越来越成为发展的需要。
目前跌倒行为检测主要有三种方法,分别是使用可穿戴设备的方法、基于计算机视觉的方法和使用环境传感器的方法。其中可穿戴设备的方法是最初用来检测跌倒的最佳方案,通过佩戴在人体身上,可以用传感器检测出人体的运动信息,从而进行判断,但是昂贵的设备和不方便的设备佩戴使得其只能局限于实验室或者封闭场景,环境传感器也是如此。而随着计算机视觉和深度学习技术的发展和应用,使用基于计算机视觉的摄像头进行跌倒检测越来越成为了目前的主流,摄像头可以安装在各种不同的场景,也不需要佩戴设备,具有方便易用的特点,使用计算机视觉进行跌倒检测还可以使用目前流行的深度学习算法,精度和速度也得到了大幅提升。
然而,跌倒检测目前还有诸多难点。首先,日常生活中大部分都是正常的行为,跌倒出现的概率不高,所以对跌倒检测的研究,很多数据都是源自实验室数据,而实验室一般都是基于简单场景进行研究,在跌倒中的简单场景,主要特性为室内、背景不发生变化、只有单个实验人员并且按照要求依次做出各种动作。然而现实情况下发生的跌倒,往往是在复杂场景下,复杂场景较难定义,复杂场景为不满足简单场景定义的其他场景。简单来说,就是可能发生在室外、场景中有移动的或者变化的物体、场景中不止出现一个人等情况下的场景。这种场景下的跌倒往往更加难以检测。除此之外,跌倒的方向也会影响检测的结果,不同方向上的跌倒对于检测的结果也会有影响,当摄像头的视角和人体处于同一直线时,也被称为同向姿势,跌倒过程中的形态变化不明显。与此同时,只使用一种检测技术进行跌倒的检测往往也会带来过拟合以及依赖场景的风险,在不同的场景下,相同的方法可能并不会很奏效。如何使算法适用不同场景,提高在复杂环境下的跌倒检测的效果,成为了目前亟需解决的问题。