最新消息

自从安防监控产业开始AI化，市场商机进一步扩大。根据研究机构《Marketsandmarkets》预估，2023年全球影像监控市场的产值，将以每年13.1%的速度增长，从2018年的368.9亿美元，成长至683.4亿美元。安防监控浪潮已至，企业如何早一步实现AI应用落地？

在台湾，智慧安防监控的发展相对成熟，食、衣、住、行、育、乐，任何你想得到的人类基本生活需求，只要加上「安全」，就有机会成为一门商机。小至行动装置上的指纹及人脸识别解锁，即时辨识大楼入侵者的保全示警系统，家中人物或动物的行为监测，甚至是高龄者长照，皆可透过即时反馈现况，守护使用者的安全。

日本政府在天皇即位大典时便曾利用人脸识别AI，判定各国来访政要的身分，协助维安；2020年东京奥运也预计利用AI人工智慧技术，目标达成横跨9大县市、40个竞技场，赛事期间预估来场者超过1,000万人的国家级维安任务。

而在百货、零售卖场、健身房等涉及消费行为的经济场域，智慧安防监控则被来监测人流与动线，以及消费者的年龄、性别、肢体行为等客情分析，以利精准行销。从食品安全一路往上推，源头种植时如何少用农药到智慧农业灾损确认，也都可以广纳在智慧安防的应用领域里。

安防方面的运用，一定要同时整合软硬体，才能奏效。所以，如何把「AI x 安防」整併到既有的硬体产品里，也成了台湾不少科技业、制造业瞄准的目标。

依场景而变化万千的AI安防监控

与其他产业相比，因为学习情境多发生在特定室内环境，智慧安防监控的大数据训练，在场域的变易性不大。目前市面上已有开放资料集（亦称：开放数据 Open Dataset）可供使用，但企业因为各家应用场景不同，会以此为基底再餵给AI特定应用场域，例如百货商场、大卖场的电脑影像数据，便可更快开发出符合自家商业模式的机器学习模型（Machine Learning Model）。

因为环境的光线、明暗等原因影响，使得实际场域的数据更为重要。而一样是看「人流」，在百货公司大门口、橱窗前、手扶梯所需的「数据型态」就会天差地别，后续AI发展重点和演算法也截然不同。所以对于问题的定义，也要格外清楚。

在某些安防领域里，收集数据会是一大挑战。当使用情境会和个人隐私相关，如何持续收集且累积独特性，便成为发展安防数据策略的第一关。

Tomofun是个值得参考的例子。初期创业，Tomofun执行长张友诚他本来是卖硬体的摄影机，后来转向变成主打狗狗保全的「狗保姆」订阅服务。从硬体走向软硬整合，他学到，最重要的就是「全力了解、验证消费者的使用情境」。

像Tomofun的切入点在于守护狗狗的居家安全，这类数据就会涉及用户住家隐私。当机器要辨识狗狗吐了或呛到，这类影像也不可能在主流社群平台上捞得到。Tomofun 想到的方法，就是让用户们成为「数据的共创者」，不定期在社群平台邀请用户提供。因为用户知道，提供这些数据都是为了让狗儿们得到更好的照顾，而Tomofun也得以透过上万支珍贵的影片，训练模型（Model）。

出发：以始为终的数据思维

当训练机器学习模型（Machine Learning Model）的大数据来源稳定，进到机器学习的阶段，首要任务是让AI学会辨识人、动物和其随身物件。学会辨识物体之后，再往两大辨识方向延伸学习：

Tracking： 目标对象的连续性，追踪移动路径
Action： 目标对象的肢体行为

AI起步阶段，光是要让机器模型精准的辨识出什么是「人」，就让企业煞费苦心。接下来这个案例，或许可以提供一些灵感。

在我经手过的大数据处理专案中，有客户表示自家内部标註后训练的AI模型精准度不理想，因为常把人携带的随身物品，例如棉花糖、气球、帽子等圆形物体，误认成「人头」，请我们协助提供校正用的数据。经过讨论后发现，失败的关键因素可能是客户当初使用的「数据不够精确」。

因为人头是圆形的，当目标对象（人）的身旁出现圆形物体，或者路人的头部被一起框进去时，就会让机器误以为「圆形的物体＝人头」，因此学歪。

于是，我们与客户讨论，在收集新一批图资时，可以改变旧有的蒐集策略，让图资情境尽量单纯化，也进一步协助客户釐清想让机器学习的关键特徵，改以「靶心策略」实践标註原则。

意思是，先区分出要被标註的关键人体范围（靶心）和可以取捨掉的部位，之后我们建议客户以不纳入周围杂讯为主，进行精准拉框（Bounding Box），确保关键范围的标註细緻度。事成后客户向我们回馈，这批数据进演算法训练后，成效确实提升许多，成功解决机器偏误的问题。

安防监控实用文_靶心策略-1-1024x459_简季婕 FLOW AI BLOG.jpg

省时省力，试试优化原则

例如，客户希望达到的学习目标是「辨识两者是否为同一个人」，若按照人类的思维逻辑，要辨识、追踪一个人的移动路径，除了性别和年龄之外，还需要透过观察他的髮型，身上的衣服款式、颜色、配件才能做到。

但如果拿这些繁杂的条件作为特徵让机器学习，开发团队势必要耗费很多时间精力。所以我开始思考：「还有什么方式，可以让客户学习得更快更省力？」

最后，我跟团队想出了一个创意解决方法，建议客户与其用人的思维惯性去训练机器，不如直接让机器用他最擅长的思维方式，也就是用「参数」来辨识人！ 如此一来不仅省事、也提升了辨识的生产效率。

善用机制，为标註良率把关

在智慧零售的场景里，客情分析的专案愈来愈多，需要从大量的人像中，判断出哪几位属于A群客户，哪几位属于B群客户。

在进行这一类的专案，我们会预先进行内部模拟测试，让专案相关人员针对照片进行比对。几次下来，我们发现：碍于图片模煳、远近、角度以及配件遮挡等原因，即使是累积了上百个不同领域的AI数据处理专案经验的执行团队，平均答对率竟然不超过70%。但客户要求的良率很高，该如何解套？

除了事前的教育训练，我们选择同时从流程下手，「投票系统」（Voting system）来解决。当拉完框的图资进入到比对阶段时，便启动投票系统，让多位受过训练的专业标註师，同时判断同一张有争议的人像，以降低个体认知上的偏差。

而涉及到行为分析相关的专案，则是透过标註关节点（Key Point）来辨识人体或动物的行动，一般来说会分成17个关节点（多则会达到25点以上）来标註。

只是点几个点，听起来好像很简单，但其实不然。比方，移动中的人体骨骼关节起始点在哪里？或者当手臂被物体遮挡时，该如何判断活动关节的下点位置？在标註狗或猫时，也会因为关节位置不同，以及肢体延展的范围差异（很少人会知道，猫的肢体比狗还柔软），导致很容易误判。这些都需要有绵密的原则制定以及教育训练，才能够妥善把关品质。

AI应用的数据类型百百种，标註平台工具及方法也需跟着优化，才能确保高效、稳定的产出。从专案的源头下手，釐清所需要标註的物体让精准数据助攻，早一步完成AI落地的梦想蓝图。

责任编辑：陈建钧

《数位时代》长期徵稿，针对时事科技议题，需要您的独特观点，欢迎各类专业人士来稿一起交流。投稿请寄edit@bnext.com.tw，文长至少800字，请附上个人100字内简介，文章若採用将经编辑润饰，如需改标会与您讨论。

（观点文章呈现多元意见，不代表《数位时代》的立场）

出处:https://www.bnext.com.tw/article/59180/ai-save-monitor

NEWS & ARTICLE

【AI数据处理的策略思考】发展安防监控，从数据开始助攻

依场景而变化万千的AI安防监控

出发：以始为终的数据思维

省时省力，试试优化原则

善用机制，为标註良率把关

《数位时代》长期徵稿，针对时事科技议题，需要您的独特观点，欢迎各类专业人士来稿一起交流。投稿请寄edit@bnext.com.tw，文长至少800字，请附上个人100字内简介，文章若採用将经编辑润饰，如需改标会与您讨论。

关注我们

NOTICE US