人工智能还是“智障”？构建方案请提前了解AI的这些特点

微信邦 发表于 2018-12-11 20:48:30

| 导语随着近两年AI行业的迅速爆发，和公司产业互联网新战略的提出，会有更多的客户提出对人工智能方案的需求。本文旨在分享笔者在人工智能项目中的一些经验和浅见，希望能对您相关方案的构建和销售起到一些帮助。本文将从当前弱人工智能时代，AI本身的统计学概率特点出发，与您分享和探讨AI方案适合在哪些场景落地，以及方案会有哪些局限性。
AI是什么？发展到什么阶段了？人工智能的定义非常多，这里选用工信部《人工智能标准化白皮书2018》中的定义：人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。虽然这个定义是选自2018年的报告，但AI并不是一个新的课题。现在的ABCD，即AI, BlockChain, Cloud和Data中，AI是历史最悠久的：在1956年的达特茅斯会议上就已经被提出。
我们从图中可以看到，AI经历过两次的繁荣与低谷，这是之前对于符号和理论的过分自信，以及计算机硬件计算能力有限所造成的。在这一阶段的复苏和爆发期，开始于1997年IBM深蓝战胜国际象棋世界冠军。但因为有了前两次的繁荣和低谷，学术界在这次一直都很谨慎，提出的算法和模型都是在特定环境和场景下解决特定的问题，而不是有一个统一的模型来解决所有问题。这是当前AI发展的现状，也是客观事实，我们还处于要使用大量数据，来对特定场景的问题进行分析和调优的“大数据、低范式”的时代，没有一个可以用来解决所有问题的通用能力。但一旦找到了AI和行业的结合点，在数据和算法的支持下，我们可以利用AI，来数倍甚至数十倍于地提高行业效率。
图一：AI发展历程
一定会出错的“人工智障”：AI的概率属性
现在提到人工智能，大家可能第一时间都能想到这些词汇：CNN, RNN, 神经网络，深度学习，机器学习，但这些概念之间有什么关联么？其实CNN, RNN都是深度学习算法的分支之一，而从广义上说深度学习也是多层神经网络的一种，而神经网络也只是机器学习中有监督学习的一种回归算法。那机器学习又是什么呢？机器学习可以说是计算机科学与统计学的交叉学科，是二者深度结合后的产物。说到这里可能没接触过相关专业知识的读者已经有点懵了，难道我去跟客户讲方案、设计的时候还得了解这些概念？当然不用，这里是想请您记住AI本身的统计学属性，即所有的AI方案，其背后都是一场概率的游戏。因此只要有概率，哪怕是再小的概率，随着时间的累加，其都会变成必然。尤其是在当前数据大爆炸的时代，看似非常小的出错概率，在海量数据的冲击下，也会在很短的时间内变成必然。下面我们来看一个例子。
“百亿分之一”的必然
计算机视觉是人工智能的重要应用之一，当前已经用于公安机关对于目标人群的关注和抓取。现在很多厂商都宣传自己的算法能在十亿分之一、甚至百亿分之一的误报率下，保持较高的召回率。那我们现在来看看，即使是百亿分之一的误报率，在公安场景下，需要多长时间就会成为必然。
这里需要说明一下，百亿分之一指的是1:1（一张图比一张图，常见于核身业务，用于判断输入的两张图片是否为同一个人）的误报率，而在公安对于目标人群布控的场景，则用的是1:N人脸检索技术，及至少会进行N次（N表示布控库的大小）比对。以公安最常用的全国在逃库为例，其库规模在30万人左右，则每来一张抓拍照，系统都将进行30万次比对。因此若要达到百亿次的1:1比对，只需进行：
10,000,000,000/300,000=33,333 次检索
即百亿分之一误报率的情况下，进行3.3万次对于30万人库规模的检索，从概率上来说，就一定会遇到一个误报。但3.3万次检索在公安业务里是什么范围呢？以虹桥高铁站为例，其日客流量为15万，就算每人只进行一次检索，每天也会遇到至少4次误报，而实际情况是，高铁站里有无数个摄像头，任何人在任何抓拍摄像头下出现，都会进行检索，因此误报次数在实际情况下还会高出数倍。
AI的对手是“人”：如何体现AI方案的价值？
接着上面的例子，如果虹桥火车站有100个监控摄像头，平均每人在5个摄像头中出现，则每天会有20多次的误报，但实际能找到的目标人员有多少呢？假设每天都有10个目标人员出现（实际情况肯定没有这么多），那误报的次数是正确报警的两倍以上，这对于本已经捉襟见肘的警力是极大的浪费。但为什么这个方案已经在全国公安开始推广了呢？我们来看这样一个实际案例。
眼药水和硬盘的故事
在某年的1月6日的时候，南京市所有的硬盘都脱销了，在接下来的两天，整个南京市的所有眼药水也脱销了。这两个看似不相关的事件背后是同一个原因造成的，那是什么原因呢？因为在1月5日的时候，南京市发生了一起非常恶劣的枪杀案件——“周克华”案件，因为案件影响非常恶劣，南京市公安局要求把全市的所有监控录像都下载来审核，导致了硬盘的脱销。接下来眼药水的脱销就很好理解了，因为所有民警都夜以继日地在仔细看视频，眼睛都快“瞎”了。但最后消耗了全城的硬盘和眼药水之后，也只找到周克华的半张脸和一个背影这两个关键证据。那这样一件事情离我们有多远呢？各位是否还记得这是哪一年的事情？那是2012年，距今也只有6年多的时间。因此是AI技术的飞速发展和成熟，让当年“汗水警务”向现在的“智慧警务”的转变成为了可能，是从“零”到“壹”的转变。这是AI的价值之一：让人力无法完成的事情，变成可能。所以回到布控的事情，我们应该怎么设计这个方案呢？这里可以看到：
误报数 = 误报率 * 抓拍数 * 布控库规模
在算法误报率极限的情况下，只能通过降低布控库规模或者减少抓拍数来解决。结合实际情况，我们可以不用全国在逃库，而使用本地公安自建的，最关注的目标人员库，从而降低库的规模。或者只在关键的出入口部署人力抓拍摄像头，避免同一个人被多次反复抓拍，从而减少抓拍数。
如何释放12万人的生产力
众所周知，现在国内社交领域新的引爆点是短视频领域，而如何对这些视频进行过滤和筛选则成为了一大难点。我们从今年YouTube 公开的数据可知，在其平台上每分钟就有约500小时的新视频上传，要对这些数据全部进行人工筛查过滤几乎是一件不可能的事情。但网络空间并不是法外之地，从公安机关到各大视频平台，都希望对上传的视频进行鉴别和筛选过滤，对于淫秽色情内容、涉嫌暴力恐怖的犯罪内容等敏感信息要予以坚决的筛查和打击。
基于此类需求，优图研发了智能鉴黄算法、暴恐识别算法，并将OCR识别算法用于审核图片中的恶意文本，对于视频和图片的智能审核可以大幅提高检查效率。以鉴黄算法为例，该算法在单台服务器上，可以每秒钟自动检查判断数百张图片是否含有违规图片。这里我们可以做一个简单的计算：对于每分钟500小时的视频上传量，如果要人工审查的话，则每小时需要审核三万小时的视频数据，按照每人每小时满负荷查看，一天工作8小时，则需要9万人同时审查。再算上节假日的情况，需要至少12万人规模的审核团队，这其中的开销是巨大的。如果使用算法审核，我们如果按照每个视频按每秒抽帧一次做审核，对应也仅需要百台左右的服务器规模，再加上少量的核对人力即可。而这里还有算法性能是可以逐渐提升，从而使得成本稳步下降的，但纯人工的方式，人力成本每年还会增加。
正式因为有了AI的能力，让行业的工作效率极大的提供，这是从“壹”到“N”的突破。
因此，AI方案的价值不在于能毫无差错地完成某项任务，因为毕竟人也无法做到分毫不差，也是会有出错的概率。所以我们在想客户介绍和构建AI方案的时候，更应强调其能够完成人工无法做到的事情，或者是对于工作效率的极大提升。
小结
从AI的发展史我们可以看到，当前阶段的人工智能还是需要结合特定的场景，解决特定的问题，并不用一个方案通用解决所有问题。AI的概率属性，则决定了其在当前的大数据时代，一定会出现错误，因此我们在方案的设计阶段就需要考虑当前算法的能力，和客户的实际应用场景，判断这种错误会对应用场景带来哪些影响，并提前评估场景的容错度如何，尽可能地提前规划容错方案。在方案构建的过程中，则尽量突出AI可以如何为效率的提升带来帮助，能做到哪些单靠人力无法实现的工作，以体现整个方案的商业价值。
以上内容仅为个人经验的分享，一定会有不周全的地方，欢迎您的交流与讨论。

页: [1]

微信邦's Archiver

人工智能还是“智障”？构建方案请提前了解AI的这些特点