HBO大火科幻剧《西部世界》第三季在已经落下帷幕。《西部世界》讲述了一个在AI机器人主题公园中,机器人接待员有了自主意识和思维进而觉醒、反抗人类的故事,同样《西部世界》也是一部浩大的人工智能“养成记”,机器人们一次又一次的按照人类设计好的故事陷入悲情的循环,最终摆脱“人工”衍生出了真正的“智能”。

 

人工智能需要被人为教导训练而成。在《西部世界》里如此,在现实世界同样如此。6月23日-6月24日,第四届世界智能大会在天津举办,主题是“智能新时代:创新、赋能、生态”,会议期间,各类人工智能企业竞相亮相。这些人工智能所需要的教导和“教材”,背后是由大量的训练数据训练而成。在人工智能不断升温的当下,需要更多优质的AI数据实现人工智能与时俱进的进化。所以我们看到,AI的发展催生了数据标注这样的新产业,并随着人工智能应用落地的实现不断向着高精尖、高质量发展。

人工智能不是“人工+智能”,是“数据+智能”

作为当今世界上最重要的科技之一,人工智能走过了60年“三起两落”的发展历程,已融入人们生产生活的各个方面。“智能+”时代,构建应用场景、找准突破口成为人工智能应用落地的重中之重。

这个突破口,就是AI数据。现在的人工智能,本质是机器学习,数据是AI界最根本的竞争。AI依据大量有效数据总结规律形成“智能”,进而在不同场景下落地应用。正如云测数据总经理贾宇航所说,“其实AI数据作为生产资料,是推动整个AI行业发展的必要一环,也是人工智能商业化的主要驱动力之一,说高质量的数据决定了AI的落地程度也不为过。”

 

小到智能手机人脸解锁,大到智慧城市的智能安防,从车辆自动驾驶到AI聊天机器人,从医学成像与诊断到农作物监测,AI数据正在发挥着愈加重要的作用。人工智能若要进行应用落地,就必须利用AI数据进行迭代优化。

目前,场景化AI数据是人工智能现阶段发展和商业化落地的关键点。但机器并不能理解人类所能识别的原始数据,这些原始数据需要人为的“标签化”以后,才可以被用于模型训练。这些“标签化”的数据越多越精准,其获得的结果就越准确。例如,自动驾驶的算法模型经过大量场景AI数据的训练,不断的学习和优化,进而让系统的智能化程度逐渐提高。

AI提速,数据标注行业应场景化、精细化发展

AI数据是人工智能的燃料,AI数据的精准与否直接决定了人工智能在新零售、智能驾驶、智能安防、智能家居等相关领域的落地应用。

前文有说到,对人工智能算法来说“标签化”的数据才有意义。如何“标签化”就涉及到“数据标注”这一环节,即针对语音、图像、文本等数据,通过贴标签、做记号、标颜色或划重点的方式,来标注出其中目标数据的不同点、相似点或类别。

数据标注,是将数据转化为AI商业价值的重要一环。数据标注的精准度越高,AI学习和产出的结果越精确,AI也就越智能。也由此,催生出了数据标注这一新兴产业。Testin云测旗下AI数据服务品牌“云测数据”正是在这一浪潮下发展起来的,是业内为数不多的对数据准确性、数据类别、数据安全性等都要求极高的AI数据服务商,这也是目前人工智能行业发展所迫切需要的。

在云测数据看来,AI最终是为了落地、为了被使用,所以对于AI所需的数据质量要求会更高更精准,甚至还会有更多的定制化场景下的AI数据需求。在提高数据安全与隐私保护之外,保证数据的唯一性、场景化,才能真正帮助企业打造数据核心壁垒,大幅度推动AI进一步落地,这也是云测数据对自己的角色定位。

场景化,意味数据标注行业要满足多样化应用场景标注需求。以计算机视觉领域为例,目前云测数据数据标注服务能力覆盖自动驾驶、无人机、智能教育、智慧金融、工业机器人、新零售、安全防护等场景。

不同领域的不同场景需求,都有自己的数据类型与具体标注要求,因此极为考验AI数据服务商的场景化服务能力和专业领域知识能力。

例如,在金融行业,早期对AI客服机器人的要求只停留在“用户提问后,对其中的关键词进行提取,并按照既定话术回答”,这时期人工客服才是回答用户提问的主力军,客服机器人只是配角。但是在互联网金融业务竞争异常激烈的今天,越来越多的用户习惯在网上办理业务,AI客服机器人正在大规模地取代人工客服,AI问答的准确性将直接决定业务的效率和成本,并影响用户体验,很大程度上决定了金融机构的竞争力。

此外,随着AI与各个产业结合的愈加紧密,AI商业化程度进入新的高度,企业对AI在商业化落地中的表现要求越来越高。为了保证AI算法的识别精度,AI数据的质量也就变得至关重要。

场景化+高质量+安全,云测数据助力AI商业化落地

巨大的用户规模产生的海量数据是我国发展人工智能的优势,随着人工智产业规模的进一步扩大,迫切需要更精准、场景化的高标准数据训练推动人工智能落地。云测数据自成立以来,就致力于为AI场景化落地提供高质量数据支撑,与众多业内领先企业建立了良好持久的合作关系。覆盖行业包括智慧城市、智能家居、智能驾驶、智慧金融、新零售等领域,包含互联网企业、科技企业和众多智能化转型的传统企业。

在保证生产效率这一点上,云测数据十分强调作业协同化。在AI数据生产中,云测数据设计了从创建任务、分配任务、标注流转、到质检/抽检环节和最后的验收等更完善的管理流程,每个环节有相应专业人员来把控数据标注的质量和时间节点,进行好上下游工作环节衔接,得以在保证质量的前提下可以真正提高效率。

在场景化数据交付方面,云测数据通过自建实验室和数据标注基地,为智能驾驶、智慧城市、智能家居、智慧金融、新零售等众多领域提供高质量的数据采集、数据标注服务,全方位支持文本、语音、图像、视频等各类型数据的处理。截止目前,云测数据在华东、华北、华南均设有数据交付中心和数据场景实验室,已成功为众多企业提供AI数据服务。

同时,云测数据一直将AI数据隐私安全放在业务开展的首要地位,在保障AI数据隐私性、安全性方面,云测数据三管齐下。在数据采集之前,云测数据会与所有数据采集的用户都签订数据授权协议,确保AI企业用于训练的数据合法合规;同时,在AI数据合格交付后从不留底,坚持数据绝不复用的核心原则。此外,云测数据从防火墙的设置、内部信息系统的管护到标准化的流程作业体系都建立了确切的数据保障机制,力图做到步步保护、层层把关。

随着“新基建“建设加速,AI行业将高速发展,AI运用落地,又加速AI数据这样新兴行业的兴起。作为数据标注行业领头羊,云测数据也迎来了空前的发展机遇,将顺势而为推动AI行业向更高质量发展。