电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

未来,智能家居、音箱等产品一定是家里的标配

时光放到30年前,人们对智能家居、智能音箱还没有一个成熟的概念,或者说不会奢望这些将会出现在日常生活中。但现在,情况显然发生了变化。

电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

对于家庭生活的智能化产品,陈建文一直持积极态度。他认为,在未来的场景下,智能家居、智能音箱等必然会成为家里的标配。

中国的智能家居太独立,背后没有完整产业链

“当我们还小的时候,当时都不敢想象家里会有汽车,而现在,我们的儿女一出生,往往家里就已经有了一辆或几辆车了!智能家居产品也是一样,虽然目前还未普及,但未来一定会是家里的标配。

“从算法、环境等因素来看,智能家居、智能音箱它都属于接口设备,它未来可能不一定会是我们目前所熟知的这个形态。”

关于这一点,业内其实有很大的想象空间。智能家居、智能音箱等,可能会是音箱的形态,也可能只是个贴在墙上的按钮,甚至可能是个机器人、虚拟人。

“想象一下,你在家里只要往那儿一站,旁边就会出现一个标准的全息美女。她就跟你问好、陪你聊天、听你指挥,那也是智能家居啊,对不?单单是她跟你说话,就意味着已经把音箱和家居给全部做到一起了。”

对现在市场上大行其道的智能音箱产品,如亚马逊的Echo、谷歌的Google Home、苹果的HomePod、还有小米的小爱同学、阿里的天猫精灵X1等,陈建文认为,它们是一场革命,一场针对传统音箱和家居市场和理念的革命。

有句话叫做:只要方向是对的,就不怕道路有多遥远。这其中的核心点就是商业化的技术和应用场景,陈建文认为,智能音箱的应用场景将会非常的广、非常的大。

但是它爆发的时间点,或者说它在什么时间里被需要,将是另外一大课题。

“在目前看来,中国的智能家居、智能音箱还都太独立,背后没有形成一个产业链。这样的话,到最后,整合市场就依然还是巨鳄的事,只有它们才有对应的体量和实力。

“今后,哪个公司能完全以智能音箱为接口,整合家居里面所有的东西,那么它就是未来。”

智能家居的核心是有什么用,而不是长什么样

陈建文认为AI,更多的是一个工具,比如怎么帮助盲人看到路,怎么帮助别人快速的找到一个东西。

AI,也包括AR/VR,它不应该是一种玩具,它应该多一些工具的属性。相应的,应用到家居领域的智能家居和智能音箱等,它的核心只能是工具性,而不在于外在的形态。

电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

“智能家居、智能音箱的行业背景和应用场景很大,商业化技术需要过程,需要时间去形成一个完整的产业链,形成完整的东西的,我觉得这是一个很好的点。

“现在的音箱还是有固定形态的,而理想中的,或者说在未来,它应该是没有固定形态的。它可能只是贴在墙上的一个danse,你在房间里面说一句话,比如说music,它就开始放音乐。

“这个东西它可能跟音箱这个形态完全没关系(它属于语音识别的一部分),它仅仅是一个传感器。但遗憾的是,我们现在这个阶段,中国的房子里还没有把这种传感器做进去。

“所以,国内老讲智能家居,某种程度上太概念化太虚了。我在美国的家里面,卫生间里面,买这个房子的时候,人家就已经提前安装湿度检测器、温度检测器,甚至语音识别设备等等。当你洗完澡之后,从来就不用管家里所有的湿度、温度等的调节,全部都是自动的。那你说,这个是不是智能家居呢?

“现在国内怎么干呢,就是买一个加湿器放在那,就算了事儿。而欧美国家早就已经把智能这块固化在墙壁里面的传感器中了。”

所以说,目前所谓的智能音箱等只是阶段性的产品。在人工智能大数据、云计算、智能算法的加持下,这种阶段性的产品也将很快会迎来更大的发展契机。

没有完美的大数据,现实世界都是小数据

研究AI的人都知道一个基本的原则:数据越大越全面,输出的结果就越精准。

但问题是,我们始终找不到理论上完整的大数据,所以业内有小数据和小样本学习,即推理和规则体序。而这二者的结合,似乎就是AI未来的重心所在。

电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

“务实一点说,我们很多人,甚至包括一些professer,对大数据的理解是错误的。我在很多会议上都说过,这个大数据的大是什么意思呢?不是说数据有多大,也不是说数据有多么海量。

“我曾经跟一个教授谈,他就说,我们是做三维全息的,我一秒钟几个G的数据,你看我数据大不大?还有人说,我一天采集了很多很多东西,我的这个sense很多很多......

“其实,按照学术界的说法,大数据我们更多讲的是数据的维度。”

一个人,如果说只有一个维度,不管你再大,你就是一个人。只有当你具备很多不同维度的时候,你才是一个丰富的人,精彩的人。

实际上,数据永远不可能是完整的。

“举个例子来说吧:你想要了解我,因此你去搜了一下,搜到了一些信息。但是,你搜到的一定是一个子集。然后另外一个人也去搜,他搜到的也是一个子集。你们搜的都是一个子集,都是不完整的。

“但是有一千个人搜的数据合在一起的时候,我根据这一千个人的数据,我基本上可以断定这个人的基本情况了。

“所以你看,越多个不完整的子集,就越接近事实真相。但是,核心的点是你永远不可能拿到完整的数据,这个世界上又有什么数据是完整的吗?怎么会有完整的数据呢?

“任何一件事情,你往深的挖,它都是不完整的。中国古语也有云,‘大道五十,天衍四九’,也有一点这么个意思。”

大数据的意义在于,数据的维度要很多。如果这个数据本身就没有什么维度,就是个一维、二维或者三维的东西,那大数据也就没有意义了。

当数据采集的维度很多、角度更多、采集的源泉更多的时候,日积月累,我们往往就能从统计意义上得到一个概念。

这是第一层,独立数据的结果。

电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

“还有另外一个情况,你从网上整理了很多信息,另外一个人也整理了很多信息,你们只是把信息汇总在了一起,最后得出一个结论,这是第一步;第二步呢,基于这个信息你要去做预测和分析。根据你喜欢吃辣椒、喜欢踢足球等特征,从而预测出这个人性格应该是什么样子的,你就又往前走了一步。”

就像人们常说的的小样本、小数据、大数据的学习,就我看到的所有的样本,光靠采样是永远不可能采全的。

千人千面,任何的样本,都是小样本,任何的数据,都是小数据。

我们现在看到的所有互联网上的数据,都是小数据集合成的大数据,小数据的内容聚合成一个大数据的整合。

对单独的样本来说,数据都是小数据,没有所谓的大数据,完整的数据只存在于理论当中。在研究采集中,我们所得到的永远只是一部分。从这个层面来讲,它是属于小数据和小样本。

小数据多了之后,它会形成一个大数据,再通过梳理、预测,算法,它会得出一定的结论。

这个能力是目前我们讲的大数据里最大的行业应用,就是规则推理。

“真实世界里没有大数据,你看到这个人,你描述他,十个词、二十个词,都是小数据。但是,你站在宏观上,不去测量这一个独立人,而是去描述这一类人的时候,它就是大数据了。

“所有的东西都是这样,你测量的时候,获取、真实的采集这个数据的时候,这个数据就已经被你固定成小数据、小样本了。”

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存