人工智能还是“智障”?构建方案请提前了解AI的这些特点
| 导语 随着近两年AI行业的迅速爆发,和公司产业互联网新战略的提出,会有更多的客户提出对人工智能方案的需求。本文旨在分享笔者在人工智能项目中的一些经验和浅见,希望能对您相关方案的构建和销售起到一些帮助。本文将从当前弱人工智能时代,AI本身的统计学概率特点出发,与您分享和探讨AI方案适合在哪些场景落地,以及方案会有哪些局限性。AI是什么?发展到什么阶段了?人工智能的定义非常多,这里选用工信部《人工智能标准化白皮书2018》中的定义:人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。虽然这个定义是选自2018年的报告,但AI并不是一个新的课题。现在的ABCD,即AI, BlockChain, Cloud和Data中,AI是历史最悠久的:在1956年的达特茅斯会议上就已经被提出。
我们从图中可以看到,AI经历过两次的繁荣与低谷,这是之前对于符号和理论的过分自信,以及计算机硬件计算能力有限所造成的。在这一阶段的复苏和爆发期,开始于1997年IBM深蓝战胜国际象棋世界冠军。但因为有了前两次的繁荣和低谷,学术界在这次一直都很谨慎,提出的算法和模型都是在特定环境和场景下解决特定的问题,而不是有一个统一的模型来解决所有问题。这是当前AI发展的现状,也是客观事实,我们还处于要使用大量数据,来对特定场景的问题进行分析和调优的“大数据、低范式”的时代,没有一个可以用来解决所有问题的通用能力。但一旦找到了AI和行业的结合点,在数据和算法的支持下,我们可以利用AI,来数倍甚至数十倍于地提高行业效率。
图一:AI发展历程
一定会出错的“人工智障”:AI的概率属性
现在提到人工智能,大家可能第一时间都能想到这些词汇:CNN, RNN, 神经网络,深度学习,机器学习,但这些概念之间有什么关联么?其实CNN, RNN都是深度学习算法的分支之一,而从广义上说深度学习也是多层神经网络的一种,而神经网络也只是机器学习中有监督学习的一种回归算法。那机器学习又是什么呢?机器学习可以说是计算机科学与统计学的交叉学科,是二者深度结合后的产物。说到这里可能没接触过相关专业知识的读者已经有点懵了,难道我去跟客户讲方案、设计的时候还得了解这些概念?当然不用,这里是想请您记住AI本身的统计学属性,即所有的AI方案,其背后都是一场概率的游戏。因此只要有概率,哪怕是再小的概率,随着时间的累加,其都会变成必然。尤其是在当前数据大爆炸的时代,看似非常小的出错概率,在海量数据的冲击下,也会在很短的时间内变成必然。下面我们来看一个例子。
“百亿分之一”的必然
计算机视觉是人工智能的重要应用之一,当前已经用于公安机关对于目标人群的关注和抓取。现在很多厂商都宣传自己的算法能在十亿分之一、甚至百亿分之一的误报率下,保持较高的召回率。那我们现在来看看,即使是百亿分之一的误报率,在公安场景下,需要多长时间就会成为必然。
这里需要说明一下,百亿分之一指的是1:1(一张图比一张图,常见于核身业务,用于判断输入的两张图片是否为同一个人)的误报率,而在公安对于目标人群布控的场景,则用的是1:N人脸检索技术,及至少会进行N次(N表示布控库的大小)比对。以公安最常用的全国在逃库为例,其库规模在30万人左右,则每来一张抓拍照,系统都将进行30万次比对。因此若要达到百亿次的1:1比对,只需进行:
10,000,000,000/300,000=33,333 次检索
即百亿分之一误报率的情况下,进行3.3万次对于30万人库规模的检索,从概率上来说,就一定会遇到一个误报。但3.3万次检索在公安业务里是什么范围呢?以虹桥高铁站为例,其日客流量为15万,就算每人只进行一次检索,每天也会遇到至少4次误报,而实际情况是,高铁站里有无数个摄像头,任何人在任何抓拍摄像头下出现,都会进行检索,因此误报次数在实际情况下还会高出数倍。
AI的对手是“人”:如何体现AI方案的价值?
接着上面的例子,如果虹桥火车站有100个监控摄像头,平均每人在5个摄像头中出现,则每天会有20多次的误报,但实际能找到的目标人员有多少呢?假设每天都有10个目标人员出现(实际情况肯定没有这么多),那误报的次数是正确报警的两倍以上,这对于本已经捉襟见肘的警力是极大的浪费。但为什么这个方案已经在全国公安开始推广了呢?我们来看这样一个实际案例。
眼药水和硬盘的故事
在某年的1月6日的时候,南京市所有的硬盘都脱销了,在接下来的两天,整个南京市的所有眼药水也脱销了。这两个看似不相关的事件背后是同一个原因造成的,那是什么原因呢?因为在1月5日的时候,南京市发生了一起非常恶劣的枪杀案件——“周克华”案件,因为案件影响非常恶劣,南京市公安局要求把全市的所有监控录像都下载来审核,导致了硬盘的脱销。接下来眼药水的脱销就很好理解了,因为所有民警都夜以继日地在仔细看视频,眼睛都快“瞎”了。但最后消耗了全城的硬盘和眼药水之后,也只找到周克华的半张脸和一个背影这两个关键证据。那这样一件事情离我们有多远呢?各位是否还记得这是哪一年的事情?那是2012年,距今也只有6年多的时间。因此是AI技术的飞速发展和成熟,让当年“汗水警务”向现在的“智慧警务”的转变成为了可能,是从“零”到“壹”的转变。这是AI的价值之一:让人力无法完成的事情,变成可能。所以回到布控的事情,我们应该怎么设计这个方案呢?这里可以看到:
误报数 = 误报率 * 抓拍数 * 布控库规模
在算法误报率极限的情况下,只能通过降低布控库规模或者减少抓拍数来解决。结合实际情况,我们可以不用全国在逃库,而使用本地公安自建的,最关注的目标人员库,从而降低库的规模。或者只在关键的出入口部署人力抓拍摄像头,避免同一个人被多次反复抓拍,从而减少抓拍数。
如何释放12万人的生产力
众所周知,现在国内社交领域新的引爆点是短视频领域,而如何对这些视频进行过滤和筛选则成为了一大难点。我们从今年YouTube 公开的数据可知,在其平台上每分钟就有约500小时的新视频上传,要对这些数据全部进行人工筛查过滤几乎是一件不可能的事情。但网络空间并不是法外之地,从公安机关到各大视频平台,都希望对上传的视频进行鉴别和筛选过滤,对于淫秽色情内容、涉嫌暴力恐怖的犯罪内容等敏感信息要予以坚决的筛查和打击。
基于此类需求,优图研发了智能鉴黄算法、暴恐识别算法,并将OCR识别算法用于审核图片中的恶意文本,对于视频和图片的智能审核可以大幅提高检查效率。以鉴黄算法为例,该算法在单台服务器上,可以每秒钟自动检查判断数百张图片是否含有违规图片。这里我们可以做一个简单的计算:对于每分钟500小时的视频上传量,如果要人工审查的话,则每小时需要审核三万小时的视频数据,按照每人每小时满负荷查看,一天工作8小时,则需要9万人同时审查。再算上节假日的情况,需要至少12万人规模的审核团队,这其中的开销是巨大的。如果使用算法审核,我们如果按照每个视频按每秒抽帧一次做审核,对应也仅需要百台左右的服务器规模,再加上少量的核对人力即可。而这里还有算法性能是可以逐渐提升,从而使得成本稳步下降的,但纯人工的方式,人力成本每年还会增加。
正式因为有了AI的能力,让行业的工作效率极大的提供,这是从“壹”到“N”的突破。
因此,AI方案的价值不在于能毫无差错地完成某项任务,因为毕竟人也无法做到分毫不差,也是会有出错的概率。所以我们在想客户介绍和构建AI方案的时候,更应强调其能够完成人工无法做到的事情,或者是对于工作效率的极大提升。
小结
从AI的发展史我们可以看到,当前阶段的人工智能还是需要结合特定的场景,解决特定的问题,并不用一个方案通用解决所有问题。AI的概率属性,则决定了其在当前的大数据时代,一定会出现错误,因此我们在方案的设计阶段就需要考虑当前算法的能力,和客户的实际应用场景,判断这种错误会对应用场景带来哪些影响,并提前评估场景的容错度如何,尽可能地提前规划容错方案。在方案构建的过程中,则尽量突出AI可以如何为效率的提升带来帮助,能做到哪些单靠人力无法实现的工作,以体现整个方案的商业价值。
以上内容仅为个人经验的分享,一定会有不周全的地方,欢迎您的交流与讨论。
页:
[1]