“中国将成为人工智能领域的领头羊”,李开复2015年曾说过。
如今三年过去,在全球正在经历的新一轮科技和产业革命中,以科技创新寻求高质量发展的中国在人工智能领域逐渐实现了“领跑”。
10月29日,云从科技宣布在语音识别技术上取得重大突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率(Worderrorrate,WER)降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原先记录。
机器视觉、智能语音的跨界秀
中国人工智能领跑背后,部分应用技术快速成熟,已进入实用阶段。机器视觉、智能语音成为产业化水平最高的人工智能领域。
打破语音识别世界纪录的云从科技其实是以机器视觉起家。今年2月,云从科技国内首发3D结构光技术;4月,跨镜追踪技术(ReID)技术在Market-1501,DukeMTMC-reID,CUHK03三个数据集刷新了世界纪录,其中最高在Market-1501上的首位命中率(Rank-1 Accuracy)达到96.6%,让跨镜追踪技术(ReID)技术在准确率上首次达到商用水平,仅凭穿着、姿态等就可认知行人。
从「刷脸」到「识人」,从「机器视觉」到「智能语音」,云从上演了一场精彩的跨界秀。
人工智能核心技术闭环“三部曲”
频频跨界,看似意外,却是计划之中。云从创始人周曦曾提出人工智能要营造核心技术闭环,在“人脸识别”之后向基于图像、语音、文字识别的智能感知以及基于大数据的智能分析阶段迈进。
“云从科技初始来说就是人脸识别的公司,打造人工智能的眼睛;有了眼睛,下一步我们就要做五官,就是人机交互,我们叫感知。再往后做它的大脑,就是认知和决策,就是脑科学。”
语音识别突破属于智能感知中的重要一环。通过语音识别,机器就可以像人类一样听懂说话,进而能够理解、思考与反馈。近年来,在深度学习技术的帮助下,语音识别取得了极大的进展,从实验室开始走向市场,走向实用化。基于语音识别技术的输入法、搜索和翻译等人机交互场景都有了广泛的应用。
人工智能“五步走”战略
从人脸识别技术切入,到智能感知技术逐个突破,人工智能技术内部正在完成一项大的融合,这也是人工智能企业已经认识到的,人工智能要向智能生态迈进。
在10月12日的国家发改委“人工智能基础资源公共服务平台”项目发布会上,云从科技创始人周曦提出了人工智能发展的五个阶段。
基于核心技术闭环,并在金融、安防、机场等优势行业建设基于智能分析的“行业大脑”,稳步推进从核心技术到智能生态的五步走战略。
目前,云从科技是中国银行业第一大AI供应商。包括农行、建行、中行、招行总行等全国400多家银行已采用公司产品,为全国银行提供对比服务日均2.16亿次,同时为14.7万家社会网点提供服务。
在安防领域,公司产品已在29个省级行政区上线实战,每天比对超过10亿次,数据汇聚总量超过千亿,协助全国公安抓获超过1万名犯罪嫌疑人;
在民航领域,已有60余家机场选择云从产品,日服务旅客人数达到6千万。