易道博识是一家专注于人工智能机器视觉的小型公司,不过它并非资历尚浅的初创企业,而是已经成立了4年,并且盈利3年的创新型企业。之所以能在绝大多数人工智能企业还在靠融资烧钱的时候就已经开始自给自足,创始人朱军民对新智造给出的理由是,易道博识一直是通过分析行业客户需求来进行技术研发,为他们提供人工智能技术和智能行业解决方案来解决客户的需求痛点,而易道博识的方向是致力用人工智能帮助行业客户实现商业自动化,让更多的工作业务流程逐渐走向自动化、智能化、多样化、安全化。
一开始,易道博识选择用深度学习做OCR(Optical Character Recognition,光学字符识别)。一个原因是,朱军民毕业于中科院自动化所模式识别与智能系统专业,也曾在汉王从事研发工作十几年,在2009年底离开汉王时是汉王OCR核心部门的总监,在OCR领域经验颇丰;另一个原因是当时深度学习的发展,尤其是2012年Alex在Imagenet的图像分类比赛上提出的Alexnet网络结构模型让深度学习在图像领域有了突破性的进展,也让朱军民觉得用深度学习提高OCR的识别效率是可行的。
在易道博识之前,朱军民用的是传统方式做OCR,主要分为六个模块:版列分析、二值化、行切分、字切分、单字识别、后处理,这种情况下有可能切错,造成数据丢失,而用卷神经网络CNN和LSTM,现在降低到三个模块:行定位、行识别、后处理,直接识别出整行,而且没有二值化,信息丢失是最少的。另外,传统方式下用OCR识别卡证,拍一张照才能识别,而且识别一张需要六七秒上十秒时间,体验非常差,就是因为它的OCR核心特别慢,做图像处理、分析特别慢,易道博识用深度学习加速后,处理分析一帧图像的平均时间在100ms左右,这个时候可以实现直接在视频流里将身份证识别出来,因为用手机拍照由抖动导致重新拍照是很正常的事情,而用视频流识别不用按拍照按键,它自己在合适的时候就直接识别出来了,而且它还能判断图像是否完整,是否有遮挡,用户体验会大大提升。
在其基于深度学习的OCR技术逐渐成熟后,易道博识开始用深度学习技术进行2D人脸识别和3D人脸识别的开发。
落地于互联网金融
朱军民透露在还未发布的5.0产品版本中,易道博识则实现了不固定框识别,此前的版本在识别卡证时需要卡证摆正在摄像头固定的框中,而现在是自动找框,然后拟合一个框出来,只要摄像头对准,面积差不多,不管什么角度,都可以识别。朱军民向新智造透露该版本会在不久后推出,不过目前已经在公民身份核查中心使用。
易道博识很早就开始与公民身份核查中心合作,包括人脸核查,查该人是否是中国的合法公民以及身份识别验证。与核查中心的合作对易道博识进入互联网金融起到关键作用。易道博识的金融领域客户包括银行、证券、P2P、保险、消费金融等,这些行业对风控安全要求很高,所以业务流程中会涉及到大量的认证,比如开户,就需要对开户人员的身份进行识别认证,一般是查姓名、身份证号、住址、出身年月,也就是简要核查,即比对这些信息。另外就是比对人脸,要做到人证合一,保证是本人在进行业务办理,这个时候涉及到三张人脸,现场拍的人脸,身份证上的人脸,以及公安库中留存的高清人像照片,当现场拍的人脸照片与身份证上的照片比对成功后,需再和当事人留存在公安库中拍身份证时的照片进行比对,朱军民向新智造表示关键在于公安库中的高清人像照片,因为身份证上的照片是可以被修改的,比如贴一张照片上去,但是公安库的高清人像照片是没办法修改的。这样就能确保办理业务用户的真实身份,防范金融欺诈。
易道博识:我们是如何用人工智能做商业自动化并实现盈利的
有了公安库的数据支持,易道博识针对互联网金融的解决方案就比较完善,不仅有OCR识别,也有人脸识别认证。朱军民向新智造表示想要拿到公安部的人脸系统接口极其不易,目前国内到拿到的屈指可数。从2015年3月份第一个互联网金融方案正式推出,易道博识的客户已经涵盖华为、中国人寿、民生银行、微众银行、广发银行、江苏银行、中国平安、华泰证券、长江证券、渤海证券、天风证券、华信证券、汇添富、鹏华基金、丰田金融、牛股王、万达集团、飞贷、积木盒子等几百家大型银行、证券机构、互联网金融公司。
朱军民向新智造表示,易道博识之所以能盈利开始赚钱,除了不断的科研投入技术积累和对行业客户的痛点需求精准分析,也是因为易道博识一直专注于做一家技术提供商,而非集成商。集成商可以把体量做大,但利润率就会减少,人员的成本也会增加,在身份识别或人脸比对市场,一年也就一二十亿人民币的规模,对于集成商来说,这样的市场规模太小,他们不可能在这么小的市场投入大量资源做精,这也就给了易道博识这样的技术提供商以机会。朱军民向新智造表示业内比较受关注的两家人工智能企业在去年也推出了自己的互联网金融方案,不过效果并不好,这主要跟他们的定位有关,“他们一开始就定位于一家互联网公司,让开发者调用他们的API,但是没有多少含金量,因为开发者很多都是个人开发者,而企业的数据很重要,不可能调用你公网的API。在互联网金融里,数据安全非常重要,银行卡、身份证、人脸的数据都是私密性的,客户怎么可能放在你的公网API比对,至少要放在自己的服务器上比对,或者放在手机上,或者交到第三方权威性的公安部的端口上比对,而不是公网上,要保证客户信息不被泄露。所以说在互联网金融,做公有数据肯定做不起来,一定要走私有数据,至少是客户自己管理自己的数据,这样才有用户用他们的产品。“
商业自动化布局
朱军民计划让易道博识继续走技术提供商的路线。虽然互联网金融还在持续爆发中,但他深知这个池子迟早有溢满的一天,所以他很早就在其他领域进行布局,在他看来只要是人工智能能代替人类完成繁重又机械化的工作,都能成为易道博识的业务,也就是他强调的商业自动化,他希望提供更加完整、一体化的商业自动化系统,去用到更多商业领域,深入到人们生活的方方面面,给人们生活带来更多便捷。目前易道博识的产品已经包括:3D人脸识别、2D人脸识别、银行卡识别、身份证识别、行驶证/驾驶证识别、护照识别、发票识别、银行表单识别、支票识别、营业执照识别、条码识别、手写识别等,后续会拓展更多的产品业务,另外,易道博识还推出了针对生产线以及表格表单的识别方案。
为了降低研发成本,易道博识推出了工具生产工具的方案,通过模板订制,可以生成身份证识别模块、驾驶证识别模板,甚至是表单识别模板,“因为现在OCR的需求千奇百怪,你不可能在做完身份证识别模块后又去做驾驶证识别模块,把所有的东西做一遍,我们做一个工具,它能够识别所有证件,就是让工具产生工具,我要识别哪些东西,选出来后对应的工具自动生成。这样可以大大提升我们的研发效率,让我们有更多时间去研究新的技术产品。”朱军民对新智造说道。
朱军民向新智造表示,2017年证券业商业自动化的业务会爆发,而易道博识的目标是把大部分的证券公司都拿下。为了实现这一目标,他们在16年做了一些布局,比如为证券业量身定制了OCR+身份验证的智能解决方案,并在一些证券论坛会议上,把方案推给了证券公司。另外,易道博识在去年年底也首次尝试了融资,数额在数千万,一方面为了扩大业务,实现商业自动化更好的布局,另一方面也是为了上市之路铺路。