您现在的位置是: 首页 > 新闻动态 > 公司新闻 公司新闻   行业新闻   常见问题  
AI技术的融合从语音到全方位人工智能发展之路

日期:2017-03-07   浏览次数:77

融合能力、融合应用、融合服务是AI技术发展趋势

灵云平台(AIcloud.com)是捷通华声早在2011年就推出的全球首个全方位人工智能开放平台,在当时捷通就定立了这么样一个目标:要实现语音、手写、拍照、手势甚至将来可以使用脑波来进行智能化的一些手段来进行人机交互。

经过几年的建设,灵云平台已经构建了集合十项核心技术的全方位人工智能开放平台。其中包括智能语音方面的,语音合成、语音识别技术;图像交互方面,OCR、手写识别;生物特征识别方面的人脸识别、声纹识别和指纹识别;智能语义方面,包括语义理解、机器翻译、数据挖掘等共10项技术。方案,包括全智能客户服务、多维生物特征识别身份认证服务平台等深入行业的解决方案,构建了包括公有云服务、全智能能力平台和全智能解决方案组成的产品生态体系。


灵云构建的B2B2C商业模式,深入金融、电信、能源、交通、政务、公检法等各个行业,提供全方位的人工智能能力和解决方案。灵云支持云+端能力,也就是说既可以用云端的能力,也可以用我们本地的能力,让广大的开发者和企业合作伙伴能方便地调用各种应用能力。

在这些应用当中,我特意介绍一下捷通在维语和汉语的翻译,因为在语音方面,除了中文普通话,我们还做了少数民族语言,同时构建了十几种国外的包括英文、法文、德文的语音交互能力。维汉友谊桥这个翻译APP,目前在新疆少数民族地区,已经有数百万用户在使用,大大方便了汉族干部和少数民族间的交流,大家可以下载体验下。还有一个也是现在有几百万用户在使用的出国翻译官,这个APP也是用了灵云上边的各种能力,不管去哪个国家,有了这样一个应用就可以方便的和当地人进行交流,给大家的出行和旅游提供便利。

捷通一直强调,现在AI技术的应用实际上已经不是单一能力的应用。为什么讲AI的融合发展,实际上这是现在很多应用场景需要的。在智能终端交互方面,比如说现在我们做的机器人,它其中就用到了语音识别、语音合成、语义理解、人脸识别、甚至声纹识别;在终端应用的场景里边,包括在家电,现在捷通给家电厂商实际上也在提供一些除了语音交互之外的能力,大家提出来一些比如说像声纹识别、人脸识别等需求,包括在家庭的陪伴机器人、服务机器人方面,包括儿童陪伴机器人这块,也提出了一些比如说类似图像的识别、人脸的识别,包括视频监控等等这方面需求。这些需求,实际上就是人工智能的融合应用。在捷通的灵云平台上,如果用了我们这个平台的话,这些能力都可以很方便的实现调用,因为灵云平台是一个开放平台,我们的平台能力,都能够在开发者社区上方便地调用。

在智能解决方案方面,捷通推出了全智能客户服务和灵云身份认证平台。我们推出的灵云全智能客户服务是一种客服新模式,它包括了实体机器人、网络版在线智能客服、电话客服机器人、智能语音导航等智能客服产品,以及智能语音分析、电话外呼机器人等呼叫中心行业解决方案,为用户提供随时随地、随手可及的智能客户服务,同时也大幅降低了企业的客服成本,提升了客户服务效率和质量。

在身份认证方面,随着我们人脸、声纹、OCR技术的发展,我们推出了人证合一综合“人脸识别+声纹识别+指纹识别,OCR证照识别”的灵云身份认证服务平台,这个系统已在人行的征信系统里得到应用。现在单一生物特征识别技术,比如说人脸技术,包括所有的人工智能技术,大家很难说做到100%。

通过多项技术的融合,我们可以把识别的的出错概率集合到一个很小的数字集合上,比如说捷通通过人脸、声纹、指纹可能有1%、2%这样的错误率,三种技术融合,再加OCR,人证合一,可以把这个错误率降到万分之一,甚至更小。这就是我们推出多维生物特征识别安全身份认证平台,也是AI技术融合应用的意义。

捷通给一些政府部门包括公检法的会议系统做了一些智能解决方案。一方面通过语音识别实现会议转写,解放了笔录人员,降低速记员的一些劳动强度;在整个会议系统里边,实现电子签到,利用我们现在手写笔迹技术;通过人脸识别、身份证识别,确保参会者的身份;通过语音交互,我们可以轻松的来控制投影设备、灯光设备、包括大屏幕的一些切换;另外,通过语音识别和OCR的组合,可以把会议内容实时结构化转写,并且通过OCR把一些会议文件,自动扫描录入,全面、快速记录会议内容;还有,通过实时翻译并语音播报,把会议内容同步声音直播,这些场景在我们在一些政府办公厅已经实现了应用。此外,像我们遇到的一些比如说公检法的办公人员,他们可能每天要阅读大量的文件,很费眼睛,所以我们的语音合成就很受欢迎,他们可以边听边校,工作也变得更加有趣,更加轻松。

还有一个很有趣的是什么呢?比如说现在我们给银行做大厅服务机器人的时候,一方面通过语音交互来咨询服务,用智能客服系统来传递用户需要的服务内容。在机器人上边,还实现了人脸识别、声纹识别。对于一些VIP客户,刚刚到了银行大厅,他可以通过人脸识别确认身份,能够更好的对这些VIP客户提供服务,这样的话让VIP客户能够到银行以后感觉到一种新的感受。捷通做这些人工智能技术,其实就是希望能够让这些设备更加智能化,有更多的功能来服务好用户。

另外捷通在十几年的发展当中,也在不断总结,捷通的定位实际上就是做一个人工智能能力和解决方案的供应商。我们有数千家的合作伙伴,包括我们在灵云平台上服务了四亿多用户,我们也希望能够实现一个准确定位,构建一个产业的生态。这方面和我们的合作伙伴共同探索一些服务运营模式,捷通是绝对不会去做和合作伙伴争地盘的事情,这是我们的一个明确定位,我们捷通华声就是把人工智能的技术、产品、服务做好。灵云的愿景,就是让机器“能说会听、能写会看、能辨音会认人、能思考会判断”。我们希望能够汇聚大家的力量,共同分享人工智能产业机遇。

深圳网站建设公司-AG亚游网络,拥有专业设计团队为企业提供网站设计,网页制作,移动端整体解决方案,互联网品牌顾问机构。网址:www.szmiaowei.com

上一篇:深圳网站建设浅谈短视频创业
下一篇:谈谈语音技术发展与未来

AG亚游网络 :   专业网站建设 SEO优化 企业邮箱 整体网络营销

深圳市AG亚游网络有限公司 热线:4006-999-501 联系电话:0755-33132828 传真:0755-33132828
E-mail:miaowei@szmiaowei.com 广东省深圳市龙华新区工业东路尚游公馆5楼
Copyright © 2014 AG亚游网络 All Right Reserved 粤ICP备14082736号