最新消息

NEWS & ARTICLE

【AI数据处理的策略思考】发展安防监控,从数据开始助攻

创新科技 2020-09-10

自从安防监控产业开始AI化,市场商机进一步扩大。根据研究机构《Marketsandmarkets》预估,2023年全球影像监控市场的产值,将以每年13.1%的速度增长,从2018年的368.9亿美元,成长至683.4亿美元。安防监控浪潮已至,企业如何早一步实现AI应用落地?

在台湾,智慧安防监控的发展相对成熟,食、衣、住、行、育、乐,任何你想得到的人类基本生活需求,只要加上「安全」,就有机会成为一门商机。小至行动装置上的指纹及人脸识别解锁,即时辨识大楼入侵者的保全示警系统,家中人物或动物的行为监测,甚至是高龄者长照,皆可透过即时反馈现况,守护使用者的安全。

日本政府在天皇即位大典时便曾利用人脸识别AI,判定各国来访政要的身分,协助维安;2020年东京奥运也预计利用AI人工智慧技术,目标达成横跨9大县市、40个竞技场,赛事期间预估来场者超过1,000万人的国家级维安任务。

而在百货、零售卖场、健身房等涉及消费行为的经济场域,智慧安防监控则被来监测人流与动线,以及消费者的年龄、性别、肢体行为等客情分析,以利精准行销。从食品安全一路往上推,源头种植时如何少用农药到智慧农业灾损确认,也都可以广纳在智慧安防的应用领域里。

安防方面的运用,一定要同时整合软硬体,才能奏效。所以,如何把「AI x 安防」整併到既有的硬体产品里,也成了台湾不少科技业、制造业瞄准的目标。

依场景而变化万千的AI安防监控

与其他产业相比,因为学习情境多发生在特定室内环境,智慧安防监控的大数据训练,在场域的变易性不大。目前市面上已有开放资料集(亦称:开放数据 Open Dataset)可供使用,但企业因为各家应用场景不同,会以此为基底再餵给AI特定应用场域,例如百货商场、大卖场的电脑影像数据,便可更快开发出符合自家商业模式的机器学习模型(Machine Learning Model)。

因为环境的光线、明暗等原因影响,使得实际场域的数据更为重要。而一样是看「人流」,在百货公司大门口、橱窗前、手扶梯所需的「数据型态」就会天差地别,后续AI发展重点和演算法也截然不同。所以对于问题的定义,也要格外清楚

在某些安防领域里,收集数据会是一大挑战。当使用情境会和个人隐私相关,如何持续收集且累积独特性,便成为发展安防数据策略的第一关。

Tomofun是个值得参考的例子。初期创业,Tomofun执行长张友诚他本来是卖硬体的摄影机,后来转向变成主打狗狗保全的「狗保姆」订阅服务。从硬体走向软硬整合,他学到,最重要的就是「全力了解、验证消费者的使用情境」。

像Tomofun的切入点在于守护狗狗的居家安全,这类数据就会涉及用户住家隐私。当机器要辨识狗狗吐了或呛到,这类影像也不可能在主流社群平台上捞得到。Tomofun 想到的方法,就是让用户们成为「数据的共创者」,不定期在社群平台邀请用户提供。因为用户知道,提供这些数据都是为了让狗儿们得到更好的照顾,而Tomofun也得以透过上万支珍贵的影片,训练模型(Model)。

出发:以始为终的数据思维

当训练机器学习模型(Machine Learning Model)的大数据来源稳定,进到机器学习的阶段,首要任务是让AI学会辨识人、动物和其随身物件。学会辨识物体之后,再往两大辨识方向延伸学习:

  1. Tracking: 目标对象的连续性,追踪移动路径
  2. Action: 目标对象的肢体行为

AI起步阶段,光是要让机器模型精准的辨识出什么是「人」,就让企业煞费苦心。接下来这个案例,或许可以提供一些灵感。

在我经手过的大数据处理专案中,有客户表示自家内部标註后训练的AI模型精准度不理想,因为常把人携带的随身物品,例如棉花糖、气球、帽子等圆形物体,误认成「人头」,请我们协助提供校正用的数据。经过讨论后发现,失败的关键因素可能是客户当初使用的「数据不够精确」。

因为人头是圆形的,当目标对象(人)的身旁出现圆形物体,或者路人的头部被一起框进去时,就会让机器误以为「圆形的物体=人头」,因此学歪。

于是,我们与客户讨论,在收集新一批图资时,可以改变旧有的蒐集策略,让图资情境尽量单纯化,也进一步协助客户釐清想让机器学习的关键特徵,改以「靶心策略」实践标註原则。

意思是,先区分出要被标註的关键人体范围(靶心)和可以取捨掉的部位,之后我们建议客户以不纳入周围杂讯为主,进行精准拉框(Bounding Box),确保关键范围的标註细緻度。事成后客户向我们回馈,这批数据进演算法训练后,成效确实提升许多,成功解决机器偏误的问题。

简季婕

省时省力,试试优化原则

例如,客户希望达到的学习目标是「辨识两者是否为同一个人」,若按照人类的思维逻辑,要辨识、追踪一个人的移动路径,除了性别和年龄之外,还需要透过观察他的髮型,身上的衣服款式、颜色、配件才能做到。

但如果拿这些繁杂的条件作为特徵让机器学习,开发团队势必要耗费很多时间精力。所以我开始思考:「还有什么方式,可以让客户学习得更快更省力?」

最后,我跟团队想出了一个创意解决方法,建议客户与其用人的思维惯性去训练机器,不如直接让机器用他最擅长的思维方式,也就是用「参数」来辨识人! 如此一来不仅省事、也提升了辨识的生产效率。

善用机制,为标註良率把关

在智慧零售的场景里,客情分析的专案愈来愈多,需要从大量的人像中,判断出哪几位属于A群客户,哪几位属于B群客户。

在进行这一类的专案,我们会预先进行内部模拟测试,让专案相关人员针对照片进行比对。几次下来,我们发现:碍于图片模煳、远近、角度以及配件遮挡等原因,即使是累积了上百个不同领域的AI数据处理专案经验的执行团队,平均答对率竟然不超过70%。但客户要求的良率很高,该如何解套?

除了事前的教育训练,我们选择同时从流程下手,「投票系统」(Voting system)来解决。当拉完框的图资进入到比对阶段时,便启动投票系统,让多位受过训练的专业标註师,同时判断同一张有争议的人像,以降低个体认知上的偏差。

而涉及到行为分析相关的专案,则是透过标註关节点(Key Point)来辨识人体或动物的行动,一般来说会分成17个关节点(多则会达到25点以上)来标註。

简季婕

只是点几个点,听起来好像很简单,但其实不然。比方,移动中的人体骨骼关节起始点在哪里?或者当手臂被物体遮挡时,该如何判断活动关节的下点位置?在标註狗或猫时,也会因为关节位置不同,以及肢体延展的范围差异(很少人会知道,猫的肢体比狗还柔软),导致很容易误判。这些都需要有绵密的原则制定以及教育训练,才能够妥善把关品质。

AI应用的数据类型百百种,标註平台工具及方法也需跟着优化,才能确保高效、稳定的产出。从专案的源头下手,釐清所需要标註的物体让精准数据助攻,早一步完成AI落地的梦想蓝图。

责任编辑:陈建钧

《数位时代》长期徵稿,针对时事科技议题,需要您的独特观点,欢迎各类专业人士来稿一起交流。投稿请寄edit@bnext.com.tw,文长至少800字,请附上个人100字内简介,文章若採用将经编辑润饰,如需改标会与您讨论。

(观点文章呈现多元意见,不代表《数位时代》的立场)


出处:https://www.bnext.com.tw/article/59180/ai-save-monitor

关注我们

NOTICE US