产业落地前夕,智能家居如何巧用场景化数据?

物联网智库
关注

从语音识别角度来看,比如最近某猫精灵宣布上线了四川话,用户可以在使用闹钟、天气、你想我猜等日常生活及娱乐功能时,使用四川方言与其进行对话。

但其实除了方言之外,性别、年龄、讲话人语速、说话背景、噪音、情绪、语言种类等等因素,都是构成一个丰富的、真实的交互样本的关键。这就需要通过将一些特定的数据交给人工智能去强行总结一个特定的规律,这个规律具有一定的适用性,让真正的用户在使用过程中,能够达到一个真实的应用体验。

又或者从语义识别的角度看,当我们需要打开空调时,通过说出一个命令,机器或许可以理解并打开空调。但涉及到富有逻辑的深层次含义时,机器是否能“听懂”?特别在对应的功能越来越丰富后,会拆分出越来越多的子类,比如空调打开之后的温度调整、风速调整等等不同的属性。

因而,智能家居要想真正实现落地,必须要依靠丰富的、高质量的AI数据,以此来反哺AI算法,以帮助智能家居行业企业在发掘AI潜力的道路上提升用户的体验,同时达到自身的降本增效。就像航海的船舶要到达目的地,必须要求一张数据完整且精准的航海图一样。

云测数据,助力行业航向成功的彼岸

在《人工智能2020:落地挑战与应对——中国人工智能行业报告》中,云测数据作为唯一一家AI数据领域服务商入选。相比国内外巨头,云测数据依靠对AI数据的独特见解和商业模式,成功杀出重围,成为行业的头部玩家。

目前,云测数据的数据标注业务已经形成超千人规模的团队,依托场景实验室和数据标注基地两大实力支撑,为除了智能家居领域之外的智能驾驶、智慧城市、智慧金融等领域提供高质量的场景化AI数据服务,全方位支持文本、语音、图像、视频等各类型数据的处理。

面向智能家居行业,云测数据的数据采集核心能力包括唤醒词采集、控制词采集、指定语料采集、人脸采集、情绪类型采集、中英文、国内各地方言、东南亚及欧洲、非洲小语种等采集类型,支持智能音箱、智能电视、智能扫地机器人等场景数据采集;数据标注核心能力包括人物语音转写、行为意图、声纹识别、领域识别、语句泛化、语义分割等标注类型,支持智能音箱、智能电视、智能扫地机器人等场景数据标注。

贾宇航认为AI数据在智能家居领域的发展趋势正向多模态、情感化、细分领域三大方向发展,对此云测数据也建立了自己的服务体系,以持续满足智能家居领域的企业对AI数据服务的需求。

首先是专业化、定制化和场景化。AI数据伴随着AI的发展已经经历了较为混乱的发展期,并衍生出了不同的业态。比如通过爬虫技术进行数据抓取的“史前阶段”,又或者在人工智能技术成长早期,通用数据集也“独有一片天下”。而现在,云测数据通过提供场景化的数据采集和数据标注服务,以此为当下AI产业中即将落地的企业提供服务。

场景实验室和数据标注基地便是云测数据的两大“法宝”:首先是数据场景实验室,为应对智能家居场景中可能出现的一切场景,比如像光线、噪音、背景等环境条件,以及针对不同的人种、语言、年龄、性别等因素,云测数据可以搭建和模拟针对不同需求的“真实场景”,进而对智能家居领域的客户提供还原场景的数据采集;其次是数据标注基地,通过对人工智能训练师进行专业的培训,并且配合自有的数据平台,进行持续迭代,确保整个数据精准的输出,能为安防、家居、驾驶、金融、互联网、零售、教育等领域客户提供专业的定制化服务。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存