您的位置:首页 >热点 >

《人工智能基础设施发展态势报告》发布,高质量数据集是AI战略重点

2022-02-18 22:23:00    来源:财讯网

人工智能基础设施作为“新基建”的重要部分,是人工智能产业赋能经济社会的关键载体,为壮大数字经济产业发展、加速迈向智能社会提供强大牵引力,受到业界的重点关注,主要国家和地区纷纷加快人工智能基础设施布局。

日,中国信通院发布《人工智能基础设施发展态势报告(2021年)》。报告首先介绍了人工智能基础设施各地布局情况,然后从数据集、算力和开源开放台等三方面系统梳理了我国人工智能基础设施最新发展态势,在此基础上剖析了AI基础设施赋能各行业的若干典型案例,并对未来人工智能基础设施发展趋势作了相关展望。

报告认为人工智能基础设施是以算力要素能力、数据要素能力、算法要素能力构成的基础能力台为底座,以应用开放台等为主要载体,以赋能制造、医疗、交通等重点行业和领域智能化转型为目标,为实现壮大智能经济、构建智能社会的专有服务设施能力体系。当前,我国人工智能基础设施尚处于初期,发展迅猛,其发挥的效力及释放的价值还有很大的想象空间。

其中,数据资源是人工智能技术产业创新发展的三大驱动力之一。数据集作为数据资源的核心组成部分,是指经过专业化设计,采集、清洗、标注和管理,生产出来的专供人工智能算法模型训练的数据。全球主要国家均将构建高质量数据集作为人工智能战略重点之一。

专业AI数据服务厂商扮演更加重要的角色

目前,数据标注行业的企业机构主要分为三类:第一类是AI公司内部的标注部门,第二类是数据标注众包台,第三类是以场景化、高精度数据采集和标注见长的公司。

第一种形式顾名思义,科技企业自身有数据采集标注需求,大量数据标注任务由公司内部完成;

第二种是众包台,以亚马逊众包台Mechanical Turk为代表,基本按照“需求公司——众包台——多个互联网用户”的模式完成;

第三种是以云测数据为代表的,专注于高精度、场景化人工智能训练数据的第三方服务厂商。

与其他数据标注公司不同的是,云测数据具备完整的数据服务链条,率先形成AI训练数据的“采、标、管、存”的服务,实现了从“数据原料”到 “数据成品”链条打通。实际上,这所体现的正是对数据质量的把控能力和对场景深度的还原能力。

以云测数据为例,其已经建立了数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值。

同时,云测数据以技术创新加速行业发展为己任,通过推出“云测数据标注台”、“AI数据集管理系统”等技术成果,为AI相关企业提供处理大规模感知数据的能力,通过结构创新、智能化、工程化、标准化的标注台工具赋能AI训练数据行业,极大地加速了人工智能相关应用的落地迭代周期,节省大量研发时间和成本,进而推进AI产业的场景化落地。

当前,人工智能算法的演进升级需要高质量数据作为支撑,可以说,数据集的质量越高训练的模型就越精准,模型的使用效果也就越好,更高质量数据集将成为人工智能技术发展的重要推动力。相信随着人工智能与实体经济融合逐步深入,海量数据优势将进一步显现,专业化的训练数据服务提供商将扮演更加重要的角色。

来源:中国信息通信研究院和人工智能与经济社会研究中心”。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词:

相关阅读