百姓大小事,一呼百应!

百姓网 | 百姓知道

通讯通信

如何从技术角度来评价科大讯飞2015人工智能大会?

今天科大讯飞在北京发布了人工智能大会。相比较其他互联网公司的发布会,科大讯飞的发布会鲜有人提及,对于发布会的内容在网上也没有看到较多讨论。有没有大神能从技术角度来评价科大讯飞此次的发布会?比如会上发布的人机语音交互标准,还有一些其他的语音应用。链接地址http://mp.weixin.qq.com/s?__biz=MzA4NjM4ODQzNQ==&mid=401555247&idx=1&sn=cb08abc8df01011486a3776561c7ef15&scene=0#wechat_redirect

2 个回答

  • 凡心 | 2017-10-08 09:39:20

    先简单谈下,另外找时间再详细介绍语音识别上人工智能(人机交互)的鉴别基础和方法。总的来说此次发布会展示了科大讯飞在语音识别准确度进一步优化,而其推出的人工智能平台“讯飞超脑”需要辩证看待。科大讯飞发布了录音宝、录音笔、讯飞听见网、智学网、E 听说等产品,都是建立在其多年中文语音识别的功底上而做出的应用化尝试,在这一点上毋庸置疑,科大讯飞在中文语音识别技术处在行业龙头。但人机语音交互需要一个通俗的过程:听清(语音识别,声音到文字)——听懂(语义识别,文字到知识)——交流(人工智能)。讯飞所提的“人机语音交互”应该就是指该平台已经能达到第三步具备交流能力,这依托于发布的AIUI平台(双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义技术和内容服务)。其实不难看出这些核心技术(除内容服务)都只涉及到了人机交互的前两过程——听清和听懂,而真正的“交互”则需要更深的场景识别、机器学习、数据挖掘等技术的支撑,而从现场讯飞的演示(语音购机票)看,其交互还处在起步阶段。后文会继续介绍人机交互实现各阶段特点,讯飞此次的演示体现其处在比较靠前的一个阶段:场景识别。

    怎样才算得上人工智能或做到人机交流呢?理解力和记忆力是关键。
    (以下论述都建立在能准确做到语音识别的基础上,即语音转文字)

    先用三个通俗问题测试机器人记忆力:
    A. 孙俪是谁?
    B. 孙俪的老公是谁?
    C. 孙俪拍过什么电影?
    看似简单的三个问题,经测试对于市面上大多数中文语音助手都能很好地分别作答,但把问话的方式稍做变化结果就会大相径庭。

    将问题变为:
    A. 孙俪是谁?
    B. 他(她)的老公是谁?
    C. 他(她)拍过什么电影?

    一目了然,对于普通人来说,这个三个问题几乎没变(除了问题C出现歧义,此处故意设置,后文会详细说明)。但对于机器人来说,将出现分水岭,回答情况将出现以下组合:

    结果1. 仅正确回答A:
    最初级阶段,没有记忆能力(这是上下文、连贯交流的基础),截止发稿日测试国内外中文语音产品大多数都停留在这个阶段。

    结果2. 正确回答A.B,而C直接答出邓超的电影:具备单层记忆能力,仅记得上一句中的信息,所以这里直接默认主人公已经变为了邓超。

    结果3. 正确回答A.B,而C答出孙俪的电影:这里并不能看出具备多层记忆能力,因为很可能问题A让机器进入一个围绕孙俪为中心的场景,机器认为之后的所有问题都与之相关。所以还是属于单层记忆。

    结果4. 正确回答A.B,C问题提示出现歧义,比如回答”你是想知道孙俪还是邓超的电影呢?“:具备多层记忆,歧义发现。我认为这才算的上初级智能,而试问现在有中文语音厂商能做到?



    编辑中……

    本问答由凡心提供

  • 凡心 | 2017-10-08 09:31:29

    尽管我骨子里不喜欢讯飞这样的公司,但不得不承认讯飞在人工智能技术方面没有落后,紧跟前沿,纵横捭阖,七上八下,鼓捣出这么一大堆乱七八糟的东西,至少说也算是个人工智能技术前沿型公司了,虽然他们的东西仍离强人工智能很远,但不是他们的问题,整个行业都这个德性,这个大神那个大神的,都没什么像样的突破,所以能把大神的东西折腾成这样,我想说:讯飞,你赢了!

    本问答由凡心提供

* 本站部分内容来源自网络,仅作分享之用,侵删。