2 个回答
-
| 2017-10-08 09:39:20 广告
先简单谈下,另外找时间再详细介绍语音识别上人工智能(人机交互)的鉴别基础和方法。总的来说此次发布会展示了科大讯飞在语音识别准确度进一步优化,而其推出的人工智能平台“讯飞超脑”需要辩证看待。科大讯飞发布了录音宝、录音笔、讯飞听见网、智学网、E 听说等产品,都是建立在其多年中文语音识别的功底上而做出的应用化尝试,在这一点上毋庸置疑,科大讯飞在中文语音识别技术处在行业龙头。但人机语音交互需要一个通俗的过程:听清(语音识别,声音到文字)——听懂(语义识别,文字到知识)——交流(人工智能)。讯飞所提的“人机语音交互”应该就是指该平台已经能达到第三步具备交流能力,这依托于发布的AIUI平台(双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义技术和内容服务)。其实不难看出这些核心技术(除内容服务)都只涉及到了人机交互的前两过程——听清和听懂,而真正的“交互”则需要更深的场景识别、机器学习、数据挖掘等技术的支撑,而从现场讯飞的演示(语音购机票)看,其交互还处在起步阶段。后文会继续介绍人机交互实现各阶段特点,讯飞此次的演示体现其处在比较靠前的一个阶段:场景识别。
怎样才算得上人工智能或做到人机交流呢?理解力和记忆力是关键。
(以下论述都建立在能准确做到语音识别的基础上,即语音转文字)
先用三个通俗问题测试机器人记忆力:
A. 孙俪是谁?
B. 孙俪的老公是谁?
C. 孙俪拍过什么电影?
看似简单的三个问题,经测试对于市面上大多数中文语音助手都能很好地分别作答,但把问话的方式稍做变化结果就会大相径庭。
将问题变为:
A. 孙俪是谁?
B. 他(她)的老公是谁?
C. 他(她)拍过什么电影?
一目了然,对于普通人来说,这个三个问题几乎没变(除了问题C出现歧义,此处故意设置,后文会详细说明)。但对于机器人来说,将出现分水岭,回答情况将出现以下组合:
结果1. 仅正确回答A:
最初级阶段,没有记忆能力(这是上下文、连贯交流的基础),截止发稿日测试国内外中文语音产品大多数都停留在这个阶段。
结果2. 正确回答A.B,而C直接答出邓超的电影:具备单层记忆能力,仅记得上一句中的信息,所以这里直接默认主人公已经变为了邓超。
结果3. 正确回答A.B,而C答出孙俪的电影:这里并不能看出具备多层记忆能力,因为很可能问题A让机器进入一个围绕孙俪为中心的场景,机器认为之后的所有问题都与之相关。所以还是属于单层记忆。
结果4. 正确回答A.B,C问题提示出现歧义,比如回答”你是想知道孙俪还是邓超的电影呢?“:具备多层记忆,歧义发现。我认为这才算的上初级智能,而试问现在有中文语音厂商能做到?
编辑中……本问答由凡心提供
-
| 2017-10-08 09:31:29 广告
尽管我骨子里不喜欢讯飞这样的公司,但不得不承认讯飞在人工智能技术方面没有落后,紧跟前沿,纵横捭阖,七上八下,鼓捣出这么一大堆乱七八糟的东西,至少说也算是个人工智能技术前沿型公司了,虽然他们的东西仍离强人工智能很远,但不是他们的问题,整个行业都这个德性,这个大神那个大神的,都没什么像样的突破,所以能把大神的东西折腾成这样,我想说:讯飞,你赢了!本问答由凡心提供
更多
- 乐刷POS机售后客服电话是什么?
- 0
- 3
- 嘉联支付立刷POS机客服电话是什么?
- 68
- 3
- 盛刷pos机24小时400客服电话是多少?
- 33
- 3
- 合利宝POS机客服电话是什么?
- 78
- 3
- 拉卡拉POS机客服电话是什么?
- 95
- 3
- 盛刷pos机刷卡不到账怎么办?
- 75
- 3
- 通联支付POS机客服电话是什么?
- 12
- 3
- U米pos机客户服务电话是多少?
- 83
- 3
- 速刷pos机400客户服务电话是什么?
- 45
- 3
- 闪电宝pos机官方客服电话24小时客服电话
- 14
- 3