智能语音我们为什么还不能和手机交谈

2019-08-15 18:52:25 来源: 榆林信息港

  导读: 如今投入使用的语音系统,识别的效果一般都过于极端化要么一字不差,要么谬以千里。事实上,当我们查询一条去某大街的路线时,要是系统能精确无误地从数据库的上千个条目中识别出我们想要的那一条,还是挺令人称奇的。不幸的是,如果识别有误或者街名不准,我们的搜索就只能乖乖从头再来。

  四十多年前,专家们曾宣称,语音识别将在 五到十年内 发展为一项成熟的技术。可多年过后,他们依然重复着一模一样的说辞。

  语音识别的发展确实费了不少工夫好在,时隔多年以后,我们总算开发出了一套质量过硬的识别技术。不仅如此,我们还把这玩意应用到了移动设备上(尽管还得靠服务器提供一大堆技术支持)。

  然后问题就来了有了这样的技术,我们为什么还是得整天瞅着自己的屏幕鼓捣来鼓捣去,却无法直接开口跟自己的对话交谈?

  回答这个问题的关键,在于提供一个语音交互界面,远比理解一打单词来得复杂尤其是对而言。我们还必须得理解用户的 意图 。要知道,除了语音技术本身以外,人机语音交流中还有其他因素在作怪输出方式,互动形式还有语境。

  多元化的输出:既能秀,也能说

  如今投入使用的语音系统,识别的效果一般都过于极端化要么一字不差,要么谬以千里。事实上,当我们查询一条去某大街的路线时,要是系统能精确无误地从数据库的上千个条目中识别出我们想要的那一条,还是挺令人称奇的。不幸的是,如果识别有误或者街名不准,我们的搜索就只能乖乖从头再来。

  要想在现有的语音技术上有所突破,我们必须得认识到一点:我们现有的系统,不过就是原始的识别技术而已识别技术本身没啥问题;但除了这套技术以外,我们的系统只是一个空壳罢了。而我们需要的,其实是创造一个语音交互界面说白了,就是一整套基于语音的互动模式。

  理解用户的 意图 ,意味着系统要判断出用户真正需要的事物,而这通常得依靠交谈来实现。这就是说,系统要了解用户为什么问这个问题一般来说,这就要求系统去知晓对方在做什么;与此同时,这也要求系统根据用户所处的情形合理应答。这可决不是一项轻松的任务毕竟,用户只是把移动设备握在手中而已,他们可能有着大把的事情,要忙着分神去处理。

  互动是一种双向的沟通,意味着我们在提供输入的同时还得留意输出;而这些能发声的应用是怎么回答我们的呢?常见的方式,是直接向用户回复他们所想要的信息。那些提供实时驾驶指南的 杀手级应用 就是个典型的例子:用户双眼注视路况,双手把好方向盘,然后严格按照语音提示说的做就行这种情况下,这样的应答方式也确实管用。

中国旅游日
2007年呼和浩特金融Pre-A轮企业
粘贴复制!京东金融是下一个蚂蚁金服后面也还会有
本文标签: