加入收藏 | 设为首页 | 我要投稿 | RSS
 
您当前的位置:首页 > 新闻中心 > 热点新闻

澳门百家乐科技巨头为何难实现完全语音控制

时间:2014-07-02 14:48:25  来源:http://h5959.com  作者:
为什么谷歌Google Now、苹果Siri和微软Cortana不能支持完全语音控制功能呢? “无接触控制”(Touchless Controls)是Moto X智能手机上的一大“亮点”,不过,其单独的语音控制功能却有一定的局限性。Moto X提供的语音指令有很多种类,比如语音指令发送电子邮件、浏览网站、提问、导航、设置闹铃、设置提醒、播放音乐等。但问题在于,当用户完成第一条指令后,就无法继续执行其他语音控制任务了。 谷歌把传统语音识别技术应用在搜索领域,这无疑是近几年最有成就的创新之一。从技术角度而言,这就意味着谷歌能够“理解”代词,并把它们与之前的请求建立联系。因此,用户在一个语音指令中提到“科怀•伦纳德”(Kawhi Leonard)这个人时,如果下一个问题中提到了“him(他)”,谷歌就知道这个“他”指代的就是伦纳德,并向用户提供其所需信息。这是一个还未真正获得大多数肯定的技术,它建立了人与设备间的“互动”。但不幸地是,这种互动还未应用到更多有用场景中。 自然控制 能够执行后续指令,将是一件非常酷的事情,但目前技术层面还存在一定局限性。比如,当用户要求Moto X播放Me'Shell Ndegéocello一首歌曲时,执行第一条语音指令没有任何问题,但是当音乐开始播放起来,就没有其他语音指令可供用户选择了。事实上,我们可能还需要设备完成以下操作,比如 “暂停”、“下一首”、“调高或调低音量”或“重复播放”等。 从技术角度看,完全语音指令控制设备几乎不存在任何障碍。语音识别技术已经发展的相当成熟。所有语音指令系统都能“理解”简单的词语,比如,“播放”、“暂停”、“下一曲”、“上一曲”、“重播”等。最近,谷歌扩展了其热词搜索功能,用户可以在任何地方启动语音搜索功能,只需说 “OK, Google”就可以。 此前,有媒体传言称,苹果iPhone6中语音助手Siri也将具备类似功能。因此,Cortana就没有理由不为Windows Phone用户提供相似功能。“随时待命”语音指令功能正在成为一种“标配”,因此,它不应该成为一个障碍。 使用更多语音指令,也就意味着需要消耗更多的电量,这也是设备生产商所担忧的问题。不过,这似乎是一个很容易就解决的问题。让设备始终处于“待命”状态是存在可能性的,尤其是当设备拥有协同运算或者优化处理功能,来接收来自用户语音指令时。 电池耗能是一个问题,另一个问题就是简单的API。API也正是Ubuntu Touch目前正计划解决的问题。当用户打开应用后,用户所希望能够使用的语音指令是有限的。新闻和其他阅读类应用通常对语音指令使用不多,而它们也能提供一些简单的指令,比如“返回”、“向上或上下滚动”, “搜索”和”分享至”。当我们打开需要更多标准语音指令的应用软件时,比如媒体消费类应用,这种指令就分的很细了,比如“播放或暂停”、“下一首或上一首”、“快退或快进”、“调高或调低音量”,甚至“跳至某个时间点”。当然,即使是动态指令,也应该不是问题,因为应用内的指令大多是1个或2个单词。应用软件之间,很多指令也都是重合的,这样就能更方便开发者部署标准API。 谁会成为第一个尝试者? 全语音指令并非是什么新功能。事实上,Windows 7和8系统提供了更为宽泛的语音指令功能,它能够使用户仅通过语音指令来操作界面。许多人可能会说,这只适合桌面系统,移动系统因为有更多限制,因此就是另外一回事。但是,我们现在要转变思维了。移动平台现在正变得越来越先进,它正在通过各种方式来弥补与桌面系统间的“功能”差距。Ubuntu Touch计划目标之一就是在应用软件内支持更多语音指令。Canonical的演示视频显示,可以通过语音指令来控制下拉菜单和应用内搜索,并支持“打开”、“保存”“收取”等指令。 苹果和谷歌都分别在不断扩展Siri和Google Now的功能,微软Cortana的“横空出世”,也留给人们很多印象深刻的功能。但是,这三家公司似乎都没有提供完全语音控制功能的计划,这一点着实让人感到失望。我们最大希望就是,通过反复地“人机交流”,来确保你的语言指令得到恰当的处理。 到最后,我们肯定会迎来完全语音控制功能。现在的问题是,哪家公司会先下手呢?微软已在Windows上提供了完全语言控制功能,而Windows Phone平台还不支持。微软曾表示,它们计划为其WP平台提供“类Kinect”控制功能,但还未公布具体的时间表。外界猜测,明年发布的WP 9将支持这项功能。 Canonical目前正在为Ubuntu打造完全语音控制功能。对于苹果来说,目前还没有任何迹象表明,这家公司在开发这项功能。不过,或许他们正在研发类似技术。三星也没有显露出开发完全语音控制功能迹象。但是,三星已经提供了部分类似功能,比如S Voice,这款语音识别软件是由Nuance技术驱动。三星语音指令功能仅限于自家应用,且并非全球范围内三星设备。 在Android Wear演示视频中,谷歌释放出一种信号:这家公司将要扩大其语音指令使用范围。谷歌可能会向开发者开放语音指令,从而让语音指令更深入地整合到应用软件中,让开发者能创建定制化的语音指令。此外,谷歌似乎也有可能建立一套新的标准来规范语音指令。第一种方案可以带来更多功能,而第二种方案可能会使功能受到限制,但却能够带来“持续性”。不管选哪种方案,谷歌可能会成为第一个支持完全语音控制功能的公司。 结论 “什么”和“为什么”,这两个问题很容易回答:完全语音控制,因为我们向往科幻版生活。“如何实现”:随时待命语音指令和API。“谁做”:答案是所有公司,但谷歌可能是第一个。最后一个问题就是“时间”。
来顶一下
返回首页
返回首页
推荐资讯
相关文章
    无相关信息
栏目更新
栏目热门