在人工智能工程化实践中,一直以来面临的核心问题是如何将AI数据、算法、模型与实际场景相结合,从而高效地运用数据,这成为人工智能实现规模化应用的重要课题。 在今年举行的2022年中国国际服务贸易交易会(以下简称“服贸会”)上,云测数据发布了面向AI工程化的新一代数据解决方案。云测数据总经理贾宇航表示,此次服贸会发布的“面向AI工程化的新一代数据解决方案”将持续帮助企业完成算法优化。同时,云测数据将积极发挥AI数据服务领域排头兵的带动作用,助力AI训练数据服务领域加速发展。
随着我国数字经济的蓬勃发展,数据已经融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。与此同时,对数据的生产、加工和利用也成为一个规模巨大的产业。作为人工智能发展道路上的基石,数据标注产业备受关注。相关机构统计,2020年,我国AI数据标注行业市场规模达47.6亿元,预计2025年市场规模将突破120亿元。 数据作为一种新型生产要素,既能单独发挥效能,也是将其他生产要素联系交互的关键资源,从而促使数据从生产要素的紧密关联中提炼出更有用的信息。作为人工智能发展的重要一环,数据标注主要根据人工智能企业的需求,以不同的方式对图像、声音和文本进行注释,从而为机器训练和学习提供大量的高质量、高精准度数据。 有多少人工就有多少人工智能,这是人们对于数据标注最初的印象,但随着人工智能技术的不断发展,多元化的场景在增加,数据标注行业的丰富性在增加。数据标注产业从简单、重复的拉框标注开始向精细化、智能化方向发展。
云测数据用自己的成长历程见证了数据标注产业的快速发展。今年是云测数据参加服贸会的第三年。纵观参加服贸会三年来的成果发布,云测数据总经理贾宇航用了“一脉相承”来形容。 贾宇航表示,在2020年的服贸会上,云测数据首次对外展示了一项成果,其数据项目的最高交付精准度率先达到99.99%,致力于将数据质量作为推动数据发展的关键因素。2021年,云测数据将数据生产延伸到了数据管理,希望通过系统平台更加有效地帮助企业完成自身数据价值的可持续利用,“云测数据标注平台-AI数据集管理系统”的技术成果发布,展示了在数据资产已经成为企业核心资产背景下,进一步拓展深化AI训练数据价值的领先实践。今年更加重视AI与更多行业进行产业化落地的融合。 “如今,人工智能已经逐渐从学术走向产业化落地。”在贾宇航看来,过去的数据标注,是一个有些缺乏“差异化认知”的行业,A企业和B企业到底怎么区分,没有明确的标准。如今,AI数据处理伴随着企业研发的迭代日益走向成熟,这使得AI数据服务行业对数据需求类型以及对服务标准提出了更高的要求。 贾宇航说到,企业发展的每个阶段所需要的数据是不一样的。如何更好地帮助企业完成算法持续优化期的数据,是帮助企业完成工程化,面向产业落地至关重要的一步。 以自动驾驶领域为例,通过采用云测数据标注平台,可实现车企DataOps数据闭环中数据清洗、标注工作,与原流程相比提升2倍流转效率;在车载语义领域,可将实际生产环境相关数据进行持续收集、数据管理,并由专员进行标注,保证数据安全、数据质量和交付效率。 “检验一家标注企业的核心竞争力,有两个重要的维度,工具的丰富性和工具的易用性。目前,云测数据已完成基于AI训练数据策略流程的全覆盖,从数据采集、数据清洗、数据标注再到数据管理,构成了全流程、一站式的AI数据服务。”贾宇航表示,在AI数据服务全生命周期的各阶段,云测数据采取了专业的技术和管理措施,做到步步保护、层层把关,完善布局AI数据处理对实效性、准确率和安全性的进一步要求。 尽管数据要素对经济发展的重要性已经成为共识,但是单纯的海量数据并不会自动产生价值,数据需要和生产资料相结合,投入生产过程,最终形成价值产出,才能真正融入企业的价值创造,推动产业升级和转型。贾宇航表示,未来,云测数据将持续发挥高质量+场景化的独特优势,深耕AI训练数据服务,持续提升数据采集及标注能力,从质量、效率等方面持续挖掘数据核心价值,推进AI产业的场景化落地。
|