微信邦

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 16492|回复: 0

干货好文!腾讯云在多个场景中的AI落地实践

[复制链接]
发表于 2018-8-1 22:01:37 | 显示全部楼层 |阅读模式
腾小云导读:

7月28日,腾讯云在北京举办云+社区沙龙,邀请来自腾讯与四川云检科技的五位AI技术专家,分享他们在专业领域的AI开发经验,帮助开发者在具体行业场景中实践AI技术。现场有近400位开发者参与,答疑及茶歇环节气氛热烈,多位开发者与讲师就演讲内容展开讨论,表现出对AI浓厚的开发兴趣。

本文共:7785 字 14 图,预计阅读时间: 20 分钟

AI技术已经家喻户晓。不论是移动终端设备,还是企业系统平台,都开始集成AI能力,现阶段看,AI融合到各个行业的潜力非常巨大,能够在众多场景中发挥作用,比如云计算。在今天数字化转型的浪潮中,企业上云成为了新常态,云上大量的数据、丰富的应用通过AI技术,能够解决很多问题,因此云与AI的融合也是新常态。

因为腾讯强大的社交、游戏等基因,腾讯AI有着非常丰富的实践场景,在朋友圈爆款应用、OCR识别、医疗、游戏等场景中都运用了AI技术,开发出了大量的新功能和能力。即便如此,AI在这些领域的尝试有些还在初级阶段。如何在具体业务场景中提供匹配的能力,利用AI把问题简单化,释放生产力,依然非常具有挑战性。

因此,7月28日,腾讯云在北京举办云+社区沙龙,邀请来自腾讯与四川云检科技的五位AI技术专家,分享他们在专业领域的AI开发经验,帮助开发者在具体行业场景中实践AI技术。现场有近400位开发者参与,答疑及茶歇环节气氛热烈,多位开发者与讲师就演讲内容展开讨论,表现出对AI浓厚的开发兴趣。最后,所有开发者们与讲师们合影留念,结束了这次盛夏中的、充满前沿知识洗礼的趣味沙龙。

  朋友圈爆款背后的计算机视觉技术与应用  

在现阶段,强调AI在场景中落地,就是希望AI走进千家万户,融入整个社会,而不仅仅是曲高和寡的模型,这就是AI技术产业化的趋势。比如,朋友圈里像军装照、武士青年这种有趣的互动活动,就是目前探索出来的计算机视觉最快能够来到大家身边的落地应用。对于开发者来说,通过对具体案例流程的了解,就能够快速的掌握开发所需要的能力,从而实现自主创新开发。

腾讯大数据与人工智能中心AI技术专家叶聪在沙龙活动中就以朋友圈一些爆款活动作为切入点,帮助开发者们梳理了当前关于计算机视觉与技术的应用。叶聪表示,腾讯云现在非常讲究AI场景化,在很多的应用中都集成了AI能力。

五四青年节的活动《重温五四,你最像哪位青年?》就是腾讯首先开始做的。通过人脸检测与分析技术、人脸检索技术,将用户上传的照片与特定形象进行脸部层面的检索对比,通过匹配分析找出数据库中外貌特征与用户最为相似的一张照片,这个创意为后续AI娱乐产品设计提供了参考。

相比于学术角度对计算机视觉的定义——如何让计算机从图像和视频中获取高级、抽象的信息,从工程角度来看,「使机器模仿人类的视觉能力变得自动化」的定义则更明了。叶聪介绍,计算机视觉使机器可以部分代替人力理解图片中的信息。计算机视觉还包含一些分支,主要包括物体识别、对象检测、语义分割、运动和跟踪、三维重建、视觉问答、动作识别等等,同时新的分支还在不断出现。

现在比较热门的视觉应用包括人脸识别、无人驾驶、语义分割等。语义分割在AI领域比较常见,一般指词性的分割,或者词的分割。而图像分割里面的语义分割一般指的是把图像里面的不同类型的对象进行标注和区分。

在机器识别领域,现在已经有很多比较成熟的特征提取方法。比如边缘检测方法,图片对象的局部对称性,尺度不变特征,利用灰度的原理等等,这些算法都能够实现提取,但不存在最优方案。在图像分割和对象检测领域也有一些其他算法,例如分水岭算法,分水岭顾名思义就是利用图像的灰度特性把这个图像整个灰度的曲线显示出来。另外,对象检测的常用算法叫主观形状模型,比如以人脸为标准,人脸上有68个点,对这些点进行变换,再去实现匹配目标。

图像识别领域的发展经历了CNN,R-CNN,Faster R-CNN等几个阶段。现在图像识别的流行趋势会趋于大自然的发展逻辑,是一个大循环。那么,基于这些科学实验基础,腾讯云是如何支持AI应用的呢?以五四青年活动为例,它是解决图像匹配的一个活动。首先,从训练数据开始,一般是民国时候的老照片,对它进行提取和标注数据,因为每个照片都有标注,就会生成模型。当用户玩游戏时上传照片测试数据时,会进行特征提取和建模,模型会返回一个分类,这个分数不是执行度,不完全可以参考。最后将会把一个分数最大的值返回到前端,生成页面,这是整个流程。

再以人脸融合类的应用来看,比如军装照。它的流程首先会对图像的人脸部分进行关键点的定位,把人脸上的特征提取出来,然后会对图片进行一些旋转,把它跟模版图进行统一化。下一步会把上传图片的人脸部分根据特征值抠出来,它就会跟模版图进行融合。等融合后如果上传照片的各种光线角度不完全一样,再对图片进行优化,把光影、曲线调得比较平缓,这样就呈现了非常好的效果。

对于开发者来说,掌握了这些能力,在开发出一款有趣的应用之后,如何实现商业化落地?直接把它放在网上就可以让用户下载使用吗?实际上远没有这么简单。现在的普遍做法是,都会采用云服务,尽量不在物理集上部署。为什么需要在云上部署AI应用?因为这些应用一般都会有短时间达到特别高的峰值,持续一段时间会有很快的回落。如果通过自己的IT基础设施来响应这些需求,在成本上会非常巨大,难以承担,而利用公有云,可以把一些机器的成本释放掉,这是目前从开发应用到实现收益的一整套通用商业流程。

干货好文!腾讯云在多个场景中的AI落地实践

干货好文!腾讯云在多个场景中的AI落地实践
目前,腾讯云AI目前能够支持的领域比较多。包括各种人脸合成、身份证识别、智能监控、人脸轧机还有语音合成、关键词搜索等方面。同时,腾讯云的机器学习的平台可以帮助开发者们快速去实现模型。

干货好文!腾讯云在多个场景中的AI落地实践

干货好文!腾讯云在多个场景中的AI落地实践
最后,如何让AI落地到具体场景中,除了技术层面,开发者们如何打磨产品让用户可以简单的使用复杂的技术?通常来说,从有想法到落地是一个非常漫长的过程,它分非常多的环节。首先要有AI算法的专家,同时要有AI工程实践经验丰富的人,最后,还要有更多的产品开发人员把它打磨成产品。

   OCR的应用集锦及背后技术   
OCR是近年比较火热的领域。像身份证识别、车牌识别等都需要运用到OCR技术,而像身份证识别的场景又非常多。因此,OCR作为一项通用型的基础技术,有非常广泛的用途及商业价值。在很多需要人力资源来完成文字识别的工作,比如快递行业的运单识别,保险行业的资料识别,通过OCR技术的利用实现了较大程度的生产力解放。对于开发者来说,借助于OCR技术开放的API,即可完成在各种生活场景的应用开发。

腾讯AI资深技术专家冀永楠介绍说,OCR的历史最早可以追溯到上世纪六七十年代,当时邮寄信件的邮编即是OCR服务的最早雏形。目前的OCR应用可以分为两个维度,一是表格式的OCR和通用的OCR;二是印刷体和手写体OCR。现在的阶段,表格式相对容易、通用式相对困难;印刷体相对简单,手写体相对困难。

干货好文!腾讯云在多个场景中的AI落地实践

干货好文!腾讯云在多个场景中的AI落地实践
腾讯云现在能够提供多个场景中的印刷体OCR服务。在通用型的OCR场景中,除了证件,还能够识别驾照、车牌、银行卡、名片等等。另外,OCR服务要求准确,以及完备,即能够识别中英文和字符。腾讯云正在由常用语言和字符,例如中英文等往外扩散能力,将识别范围更加扩大。

目前,在银行业等对数字高敏度的行业,对OCR的应用广泛且要求极高。腾讯不仅是第一家将手写体应用在实际场景中的,而且数字的识别率也高达90%以上,单字的识别率在15毫秒以内,复杂汉字超过80%。腾讯云的OCR服务在权威测评中表现也非常出众。在国际模式识别协会(IAPR)举办的文档分析与识别、模式识别领域世界上最权威的国际学术会议ICDAR(International Conference on Document Analysis and Recognition,即国际文档分析与识别大会)上,腾讯OCR识别在ICDAR2015 「Focused Scene Text」场景文字识别任务、ICDAR 2015「Robust Reading Competition」的自然场景文本检测项目中均得到第一名。

干货好文!腾讯云在多个场景中的AI落地实践

干货好文!腾讯云在多个场景中的AI落地实践
腾讯云现在可提供基于各种场景下的OCR服务接口,开发者可以免费使用这些服务来搭建自己的应用。比如,开发者实际需要开发的一个具体场景的软件,需要用到手写体识别或者做一个通用的OCR识别时,可以直接在腾讯云上调用对应的服务来完成应用开发。

腾讯云OCR的应用场景很多,目前在快递运单识别以及保单识别上有明确的目标客户。类似于这种项目一般是定制化服务,都是针对性地解决一个具体的问题。腾讯云根据具体场景下的问题和具体的生产流程来开发一套系统,或者开发一套流程来配合实际的业务,来提高生产效率。

以快递运单识别为例,快递手写运单必须入库才能进行投递,人工识别录入的效率很低,在运用腾讯云的OCR系统之后,每日处理量可达到一千万单,相当于三千多个人三班倒的工作效率。另一个案例是泰康核保,在通常的购买健康保险流程中,都会对购买者病史进行审核,审核包括购买者之前的体检资料以及指定医院的体验资料,通过这些资料分析,来判定购买者身体状况。现在的解决方案是使用腾讯云的OCR,同时与泰康的医疗专家共同设计医学知识库加入到定制化系统。

除了以上两个场景,腾讯云在不同的OCR应用中还有江苏银行、小米等客户。包括工商管理总局的广告监督局也在使用腾讯云OCR的多款服务。

  智慧工地:履约考勤系统的应用实践  

在目前的智慧城市、智慧工地等领域的建设也充分应用了数字化技术。为响应交通运输部公路品质工程建设的号召,工程建设需要加强四新技术的应用,包括新材料、新设备、新技术以及新工具的应用。在工程项目相对灵活的突发的工作环境中,履约考勤系统往往承担着较大的负荷,现在利用AI技术,就可以实现履约考勤管理的智能化。而一般开发者也可以根据一般企业的需求利用AI技术来开发有特点的产品。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信邦网联系QQ|Archiver|手机版|小黑屋|鲁公网安备 37082802000167号|微信邦 ( 鲁ICP备19043418号-5 )

GMT+8, 2024-12-22 14:43 , Processed in 0.092453 second(s), 25 queries .

Powered by Discuz! X3.4

© 2001-2013 Wxuse Inc. | Style by ytl QQ:1400069288

快速回复 返回顶部 返回列表