云测数据可以做哪方面的AI数据标注业务?

  • 满足文本语料、图片、语音、视频形式的各类采集需求

    人脸图片、手势图片、手写体图片以及各种场景的图片采集

    如询问天气、叫外卖、查询高考分数、查询新闻等场景的文本语料采集,产品支持用户必须一次性提交指定条数的语料,确保语料句式的丰富

  • 对非结构化数据进行清洗,或对算法输出结果进行校验、评分

    可支持对文本或图片的情感色彩、表述目的、语言内容做分类打标, 主要应用场景包括评论内容中的垃圾广告监测、品牌的负面舆情监测

    可支持多张图片的相似度判定、给定query的搜索结果准确情况评估,适合电商平台、搜索引擎产品了解算法盲区、优化搜索相关算法

  • 对新零售门店的商品陈列、宣传物料铺设情况进行监测验收

    对门店商品陈列和上架情况、宣传物料铺设情况、广告位投放情况等进行检查验收

    基于使用场景的产品推广。在指定地点对软件、服务或实体产品进行促销推广

  • 支持各类图片标注方式,包括框图、人脸打点、涂色等

    适用于OCR领域的算法训练及优化,可支持在单张图片中抠取一个主体或多个主体, 并支持抠图+选择,抠图+填空的进阶功能

    支持不规则四边形抠图、不规则多边形抠图,并支持抠图+选择,抠图+填空的进阶功能

    基于图像算法支持对上传的图片自动进行切割,方便用户高效标注,精度可达像素级别

    人脸关键点标注(待开放)

    可支持多种分类的人脸标注,如5点标注、11点标注



《中智观察》第1664篇推送

  • 如今,互联网、大数据、云计算、人工智能、区块链等技术加速创新,日益融入经济社会发展中的各个领域,数智化正在成为催生新动能和创新优势的关键力量。

  • 在数智化的浪潮席卷各行业之下,大量企业开始积极拥抱数智化转型,进行技术基础设施的优化迭代,进一步探索和开拓“数智化”发展之路。

  • 在此背景下,企业的数智化怎样实现有效地落地?数智化转型中面临哪些机遇和挑战?又如何通过数智赋能生态伙伴……带着这些问题,中国软件网、海比研究院作为CIO产品选星官特别推出了“寻找2022数智化小巨人系列报道”,通过对这些数智化企业的深入访谈,揭秘这些“小巨人”企业的发展之路、创新之路、生态之路、赋能之路。

本期报道,中国软件网选择聚焦在企业智能化服务细分领域的数据流程服务。

AI行业应用在部分领域形成突破,如自动驾驶领域,但在更多行业出现瓶颈的形势下,DPS(数据流程服务)企业的机会和挑战有哪些?能否扮演起更重要的角色来推动AI和数字产业冲过瓶颈,创造新的增长点?在激烈的市场竞争下,如何打造DPS企业的差异化优势……带着这些问题,中国软件网特邀DPS领域头部厂商云测数据总经理贾宇航,以行业视角进行了“深度剖析式”访谈。

一、AI产业逆势生长,带火数据流程服务

2022年新冠奥密克戎疫情下,各行业普遍受到了冲击,GDP增长率、PMI、金融贷款等经济指标持续走低。

而抗疫相关产业则是成为不多的亮点之一,AI技术则是其中重要支撑力量。如在医药研发场景中辅助药物筛选、疫苗基因设计算法等,加速了新药和疫苗研发;智能管控场景中人脸识别、语音机器人、文本识别、智能流调数据分析成为防控的中坚力量;工作学习场景中智能会议、AI辅助学习等日益成为标配;乃至快速成熟中的自动驾驶出租车、配送机器人、机器人餐厅有望在不久的将来成为重要服务力量。

随着市场需求和政策的进一步推动以及技术的进步成熟,人工智能产业落地速度将明显提速,中国AI数据服务行业也将迎来巨大的发展浪潮。其中云测数据通过提供高质量、场景化的AI数据支撑,助力人工智能在追求极致创新和产业落地方面不断突破。其提供的服务就是围绕AI三要素(算法、算力和数据)之一的数据开展的,我们称之为数据流程服务(以下简称DPS, Data Process Service)。

DPS是围绕数据处理流程形成的一系列服务,它使用数字技术,从实体世界或信息系统中采集、获取数据,并按应用要求处理、输出数据。DPS支持的应用或者说服务对象主要就是AI、大数据、互联网内容服务等。目前DPS服务构成主要包括数据采集和预处理、数据标注、内容审核、工具平台和支持服务(如业务培训)等。


从某种程度说,DPS对于AI产业,有点类似淘金热中卖水者的地位。在AI应用逐步深入的过程中,DPS能优先逆势增长就不足为奇了。也因为这样的地位和增长潜力,近几年DPS的入局者不断增多,但背景却不尽相同。有AI相关技术背景创始人或企业延伸创建的,如云测数据;有AI企业、互联网企业中一个部门独立出来的;也有软件外包、服务流程外包企业延伸出来的。不同“出身”也造就了不同的服务模式和优势。其中云测数据作为AI数据服务引领者,其发展模式集中体现了行业特征。

二、云测数据 拥抱数据智能时代的践行者和引领者

云测数据是Testin云测旗下AI训练数据服务业务板块。Testin云测2011年开始进入软件测试服务领域,针对软件产品的功能、性能和安全等多方面进行技术和服务布局,帮助企业完成软件测试,降本增效的同时全方位提升软件质量。


2017年,Testin云测正式进入AI数据服务领域,专注于场景化、高质量服务的云测数据正式成立。云测数据总经理贾宇航谈起Testin云测进入这一服务领域的初衷时,将其归结为两方面的判断。其一,Testin云测观察到整个社会正在从信息化向智能化演进,预判AI将很快进千家万户和社会各个层面,AI应用中蕴含着巨大的市场机会;其二,Testin云测在软件测试领域积累了丰富且领先的管理流程、服务交付等经验,可顺利迁移到AI数据服务领域来确保AI数据的高质高效的交付。

云测数据在早期就已关注到AI数据服务的需求缺口和潜在的应用市场,立足高质量、场景化的AI训练数据服务,率先形成AI训练数据的“采、标、管、存”一站式服务,实现了从“数据原料”到最后的“数据成品”全链条打通并通过数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值,为人工智能场景化落地输送更多数据支撑。


最近一年,谷歌大脑和Coursera的创始人吴恩达一直在推动建立“以数据为中心的AI”,他将其视为一门系统地设计数据以促成人工智能系统构建的学科。他认为通过过去十年的努力,人工智能“代码—神经网络架构”基本上是一个已解决的问题,对于许多实际应用来说,将神经网络架构固定下来,转而寻找改善数据的方法,会更有成效。

而云测数据抱着助力产业智能化的初心在AI数据服务领域不断深耕与创新,可以说是提前拥抱了数据中心的智能时代。既是响应时代,也成就时代。

但正如以往任何一个新时代的开启,都充满了坎坷甚至反复,智能时代的发展目前既有突破的成绩,也存在显著的瓶颈,这对于行业领先者既是挑战,也蕴含了新的机会机遇。

三、DPS支撑AI应用,迎来规范发展机遇

AI行业应用已经在部分领域形成了突破,如安防、家居、客服、自动驾驶等,这背后都离不开云测数据为代表的AI数据服务企业的支撑。通过大规模标注数据的训练,计算机视觉、语音识别、自然语言处理、知识图谱等人工智能技术相应的产品能力才得以落地。

这些AI产品能力的建立过程实际已经走过了一段从学术到场景化的不短道路。企业应用人工智能算法要经历研发、训练和落地三个阶段,不同阶段对于AI基础数据服务也有差异化需求。研发需求是新算法研发拓展时产生的数据需求,一般量级较大,初期多采用标准数据集产品训练;中后期则需要专业化、场景化的数据采集标注服务,训练需求是通过标注数据对已有算法的准确率、鲁棒性等能力进行优化,对算法的准确性有较高要求。

“云测数据通过基础数据集、定制化数据采集和标注服务和包括数据采集标注/数据管理的全方位数据工具链相互结合,来为AI全生命周期提供数据服务”。贾宇航向中国软件网介绍,“这三大产品服务分别面向不同阶段的AI训练需求。以自动驾驶为例,我们的基础数据集可解决诸如车辆识别、车道线识别等场景识别的基础问题,这个阶段涉及多种传感器,需要的大量布局;第二阶段基于选定的场景,根据深度神经网络引入定制化的场景数据,云测数据场景实验室和标注基地有实力满足相应数据的精度和规模;第三阶段当AI应用面市,形成自动驾驶数据闭环(类似于Tesla),云测数据可提供一套成熟的平台工具,助力完成数据采集、标注、管理一系列流程,帮助企业完成自身迭代,从而完成全生命周期的AI数据服务”。

像云测数据这种场景化的服务对DPS业务流程、从业人员个人能力都有更高的要求。但AI行业应用还是在初级阶段,DPS对各行各业不同的需求中要智能化什么任务,识别什么东西,精度要多高,数据处理要对哪些内容进行约束都没有成熟的规范。

云测数据也在积极参与推动行业规范的建立,先后参编由中国汽车工程学会发布的《智能网联汽车场景数据图像标注要求与方法》(T/CSAE 212-2021)和《智能网联汽车激光雷达点云数据标注要求及方法》(T/CSAE 213-2021)两项团体标准,对智能网联汽车场景中的两类数据标注工作进行了规范,积极促进数据标注的场景标准化。


由中国信通院牵头的全球首个AI模型开发管理标准——《人工智能研发运营一体化(Model/MLOps)能力成熟度模型第一部分:开发管理》于近期发布,云测数据作为DPS企业代表积极参与编制,结合自身服务管理经验,为标准中数据处理部分内容的编制贡献了经验与智慧。该标准填补了国内外机器学习项目开发管理标准的空白。

5月17日,北京软协立项启动了《信息技术 数据流程服务技术规范》标准编制工作。该项标准着重用户视角来规范服务的成果,也正式开启DPS作为一个独立行业的规范化发展序幕。这些标准和规范的陆续发布将会对AI应用深入社会经济各方面起到前瞻性和基础性支撑作用。

四、AI遇行业化瓶颈,DPS助力产业突破

随着AI技术在更多行业、更多领域开展应用,AI数据的质量的价值愈发重要(注:具体问题的剖析详见DPS系列文章《从“低谷”走向“巅峰”,DPS如何成为工业智能制胜法宝?》、《商汤等人工智能企业的扭亏出路在何方?》),成为制约AI产业和智能化进一步发展的瓶颈。

解决AI数据质量的问题,关键就是需要DPS工作越来越去贴近行业,通过更深的领域知识来支撑服务水平的不断提升,满足AI产品在领域应用的精度要求。针对此问题,作为行业领先者云测数据的业务规划很有借鉴意义。

云测数据将自己的规划称为“一横三纵”。

一横:是指先深入目标行业领域,再横向往更多领域去拓展。

三纵:一是,持续优化、升级采标管理和工具平台能力,持续提升数据的交付效率、交付质量;二是,持续跟进最新技术进展和产品应用,如新型雷达、相机采集的数据特征,进而解决愈加复杂化、多模态的AI数据处理需求;三是,深挖行业趋势,结合垂直领域知识领域培育人员能力和经验。

出于市场竞争和产品质量提升的需要,各大DPS企业越来越倾向于聚焦服务对象,依据各自的优势选择深耕部分行业。因为越来越贴近行业和领域知识,与客户关系越来越紧密,服务模式也可以从项目制拓展出订阅制。

海比研究认为在AI应用深化过程中,DPS企业一方面配合AI厂商完善产品,另一方面还可以将服务前置到应用端,配合行业用户,反向推动AI产品的完善和落地。由此,DPS企业在整个AI和数字产业中的地位和角色就会慢慢发生变化,一种变化可能是走向智能化产品的“核心零部件企业”方向,正如英伟达,随着技术变迁、GPU重要性越来越高,逐渐站上了数字产业舞台的中心位。

当然,DPS行业未来究竟会走上哪条路,还需要时间去验证。但海比研究认为,DPS可以成为一个独立于AI和其它数字产品的一项服务和一个行业,是确定的。云测数据等DPS企业究竟会承担起什么产业角色,也存在很多种可能。但海比研究认为,DPS企业里会成长出数字服务巨人,也是确定的。

科技媒体·企业演化科学·战略托管综合体

寻求报道,以及对相关话题感兴趣,请评论区留言

CDEC 2022中国数智智能生态大会暨第十五届软件渠道大会 火热报名中

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

原标题:AI训练数据新突破,云测数据标注平台4.0为AI而来

人工智能作为经济发展的新引擎,是引领未来发展的战略性技术。随着人工智能深入自动驾驶、智慧医疗、智慧教育等诸多行业领域,AI算法对训练数据维度和样本复杂性的要求变得越来越高,对数据标注技术、标注平台能力、不同维度数据协同标注等都提出了挑战。

2021年5月20日,在第二届深圳(国际)人工智能展上,云测数据正式发布了其针对AI数据训练服务的平台产品——「云测数据标注平台4.0」。

作为实现AI模型训练与部署的关键一步,实现人工智能产业落地的重要环节,「云测数据标注平台4.0」具备全类型数据标注支持、多种工具组件灵活配置、AI智能辅助标注、多道数据质量控制流程完善的绩效数据统计等特性,能够一站式轻松解决企业AI数据训练需求,可助力AI数据训练综合效率提升200%、服务成本降低60% 、标注精准度最高达99.99%,让企业AI能力快人一步。

如今,人工智能的发展如火如荼,如何让机器像人类一样学会自学的背后,机器学等都需要大量数据的进行AI算法模型训练、迭代与支持,相关AI数据的采集、标注与价值挖掘是人工智能技术得以在实际应用场景中大展拳脚的重要基石。

而想要用“好的数据”来训练“好的AI”高效高质量的进行AI的应用落地, 针对数据采集标注软件工程能力和系统能力的提升必不可少。事实上,正所谓“工欲善其事必先利其器”,如何通过技术层、工具层的优化,在最大限度提升人效比的同时提升数据标注准确性,做好数据标注这件“人机协作”的事,已经成为AI应用落地的重要课题。

面对当前市场需求, AI训练数据服务商为助力AI产业发展积极献言建策,纷纷做出积极实践。此次「云测数据数据标注平台4.0」的面市,可以说是为AI产业的发展落地注入一剂强心剂。通过结构创新、智能化、工程化、标准化的标注平台产品赋能AI训练数据行业,可以从质量、效率等方面激发数据要素价值,加速AI技术的创新发展,推进AI产业的场景化落地。

此外,云测数据作为AI训练数据服务TOP1的服务品牌,凭借卓越的数据服务能力、领先的技术能力,荣获第二届深圳(国际)人工智能展组委会颁发的“GAIE优秀产品奖”,这也是业界对「云测数据数据标注平台4.0」产品实力的又一项认可。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

新浪科技为你带来最新鲜的科技资讯

苹果汇为你带来最新鲜的苹果产品新闻

新酷产品第一时间免费试玩

提供最新的科学家新闻,精彩的震撼图片

我要回帖

更多关于 数据标注 的文章

 

随机推荐