持续连接和普遍的设备形成了越来越多,可实现的永远更重要的部分。

家里可以管理他们,他们帮助我们量化我们的健康,我们的脉搏,我们的活动水平,我们的卡路里摄入量,他们让我们连接到新闻,社会评论,天气,火车时间表,我们的工作生活中,我们与我们的朋友和家人沟通,我们的部落、社会自我。

亚马逊Echo Dot由亚马逊提供

事情互联网

这个超接通的世界,在未来10年内的内容内运营的高达120亿台设备,从多个领域的对齐中出生。

语音识别的技术进步,沉浸式音频技术,人工智能和触觉导致新颖且越来越直观的设备交互性。

由于可用于改进和改进声学模型和语言模型的大量信息,大数据已启用语音识别。2016年,演讲识别市场预测的研究公司市场和市场将达到2022年的10亿美元。

基于对象的音频

沉浸式声音将传统的多声道环绕体验提升到一个全新的水平,通过使用高度或存在通道(扬声器安装在墙壁或天花板上)来创建一个声音圆顶。

由此产生的“3D”音频效果是衡衷镜像真实听觉体验的人工声音更接近的侦听器。虽然传统的基于频道的音频可用于创建沉浸声,但是一种名为“基于对象的音频”的新型音频编码被证明是非常有效的。

基于对象的音频允许好莱坞电影制作者对音频组合进行编程,将声音精确定位到房间内的特定区域。装备适当的AV接收器(avr)可以解码电影的基于对象的编码,并使用可用的扬声器来最佳地复制电影制作人想要的声音位置。这意味着当枪声响起时,当角色大笑时,你会觉得他们就在你身边。在商业领域,沉浸式声音可以解决开放式办公室的问题,使人们更容易与不在办公室的人沟通和协作。

未来的接口以更有意义的,相关方式提供内容。内容可以刺激我们所有的感官,并在上下文相关的时间交付。

音频不仅扩展不仅是互联网,还可以与内容本身的关系扩展。

通过普及和连接设备提供的服务的价值将是巨大的,并且有可能直接影响发达国家和发展中国家。在2016年报告中,“互联网互联网:绘制超出炒作的价值”咨询公司麦肯锡预测物联网服务的全球经济价值在4万亿美元至2025美元之间至11万亿美元。

最有可能直接受到普遍的个人设备的行业 - 人类,健康,车辆和办公室将在同一时期内提供5500亿美元的价格在5.5亿美元至3万亿美元之间。

麦肯锡的分析表明,总体而言,物联网服务的60%以上的价值将交付给发达国家。尽管发展中国家的潜在部署数量更多,但发达经济体将不成比例地获得消费者剩余、从效率节约或技术支出中获得的客户价值等经济利益。在普及和连接设备可能成为物联网服务交付媒介或接口的类别方面,这种差距更加明显。在涵盖疾病和健康监测和管理的人类类别中,几乎90%的价值将来自发达国家,部分原因是认识到发达经济体的保健支出是发展中经济体的两倍。

但是,我们明显与这些普遍的设备接触能力的吸引力和诱惑有更具挑战性的一面?

对普遍的听力设备和隐私问题有什么影响?我们应该在语音认可和AI平台提供商处划平的道德考虑因素是什么?如果家庭助理“听到”剧烈斗争 - 如果被召唤?如果它“听到”秋天或痛苦中某人的声音怎么办 - 应该提醒医疗提供者吗?我们是否“谈论”不同的听力设备 - 如果我们确实对他们说话的话会对其他通信领域转移到其他新模式是否有不同的方式?学会讲机器让我们也互相说话吗?

我们有信心,即使我们制定了伦理,程序和隐私控制,这意味着我们可以对与我们沟通的普遍听力设备感到舒适,所以等式的人体将被视为作为机器的规则遵守我们甚至可以继续理解我们正在制造的交流,或者机器正在互相制作?Microsoft, Google and Facebook have all been experimenting with AI-generated communication and voice interaction – with results ranging from the obscene, hate-crime-referencing abuse taught to Microsoft’s AI avatar TAY by exposure to the Twitter-sphere, to the more benign but ultimately endless-loop ramblings of Vladimir and Estragon, the Google Home chatbots (not the Beckett characters), and the development by Facebook’s negotiation AIs of their own language, evolved from written English but ultimately indecipherable to their programmers.

启用AI的处理平台的语音用户界面(VUI)表示未识别的编程命令的抽象程度。它甚至没有觉得这是你正在参与的电脑。这就是让Vui-ai非常难以访问的是,即使是那些可能纠纷争夺技术的人也是如此。这是一种抗拒数字鸿沟的肯定方式,但我们有可能最终使用高度先进的技术来实现一座大型缺乏经验的消费基础,并通过一直在降低的要求实际学习机器级规划语言。

互相交谈

我们在无限微妙的社会背景下使用语言,含义和细微差别的能力是“讲话机”出现如此过性有吸引力的原因之一,但很快就证明了如此不满意。

这就是为什么如此多的智能音箱设备,尽管它们具有显著的处理能力和不断发展的一系列“技能”扩展,被用作昂贵和相对平庸的音乐播放器的原因。计算机不懂语言。当我们学习“说话机器”时,我们采用指令选择的固定或预先设定的模式范围内的语言线索。我们已经变成了我们自己的口头命令行。

计算机非常能够处理大量数据并在特定参数内执行几乎不想到的复杂计算。人类非常能够在外国环境中的完全新颖的信息来源的自适应加工和合成。

我们都会在“说话机器”方面变得更好,他们也会在倾听我们方面变得更好。但是,我们不应该让科技具有欺骗性的反应能力限制我们彼此交谈的激情和热情,也不应该让沟通距离的明显缩短阻碍我们寻找和体验世界的多样性和多样性的本能。

Baidu