甘肃快三

打破智能语音技术壁垒,炬芯用芯助力新交互

        【每日科技网】

甘肃快三  谈到智能语音,早已不是什么新鲜的事情,国外有苹果Siri,微软小娜,Google Assistant,亚马逊的Alexa这样的智能语音大咖。国内有灵犀助手(科大讯飞),小度(百度),小爱同学(小米)这样的后来跟进者。

甘肃快三  接触智能语音的用户,会觉得很神奇,觉得这东西怎么可以如此智能。而对于经常使用的老用户来说,智能语音助手的鸡肋日益显现,因为现阶段的智能语音基本都是采用数据库匹配的原则,对于云端数据库中没有的知识,智能语音也只能“呵呵”了。不难看出的是,智能语音设备的拾音技术依然收外界许多因素干扰,进步和优化空间巨大。但,对于技术来说,我们应该永远怀着宽容和理解的态度去对待,因为任何一门技术都是一个不断积累和迭代的过程。

  对于大部分人来说,目前接触体验最多的智能语音硬件应该只有智能音箱和智能机器人。只有通过智能硬件与云端数据中心的默契配合,才有可能让智能语音交互形成完整通路。语音交互的大致流程可分为:声音采集—>降噪—>语音唤醒—>语音转文字—>语义理解—>回复文字和指令—>文字转声音—>播放声音。以下天猫精灵智能音箱为例,将语音交互完整步骤做逐步分解。

  1.用户说“天猫精灵,今天天气怎么样?”;2、“天猫精灵”被语音唤醒模块接收到,并判断为唤醒词,然后通过AI芯片和硬件拾取和记录“今天天气怎么样”这段语音,并发送给云端服务器;3、服务器把收集到的电脑信号,再次转化成文字“今天天气怎么样”,交给语义理解服务器;语义理解服务器把“今天天气怎么样”这段文字,拆解成“事件=查询天气,时间=今天”这段控制指令回传给设备。4、设备根据时间和本机地理位置,找天气服务器查询天气,并获得天气的的文本数据“今天要下雨”;5、设备把“今天要下雨”这几个字发给文字转声音的服务器,服务器返回“今天要下雨”这段声音,由设备喇叭播放出来。

  毋庸置疑的是,以上五个步骤都是由智能音箱的硬件和云端的数据中心配合完成的,硬件只要负责声音的拾取和传达,云端则用丰富的数据资源去匹配用户的需求,二者缺一不可。相对来说,声音前处理技术则是智能硬件最最重要的部分,主要体现降噪和拾音效果两方面,唤醒以及与机器对话的时候都需要拾音,而且拾音还有近距离和远距离之说,如果连最基本的声音都没有听清和听懂,谈何后面的数据传达和解析呢。

微信图片_20191029140503.png

  声音的前处理技术,是声音没有进入传输、没有存储之前的处理。声音前处理目的,就是让声音的存储、传输效率更高,识别率更好(例如回声消除、降噪、声音活动检测等等)。声音的后处理技术,是声音经过存储之后进行播放的同时处理。是对音源例如 MP3 等媒体解码播放的声音进音效增强处理(例如虚拟重低音、环绕立体声、高音增强、EQ 等等)。如何将人的声音有效传达至机器,让机器“听到”、“听清”且“听懂”? “听懂”之后又改如何与云端的数据进行精准匹配,最终反馈给用户真正想要的需求动作?这将是智能语音声音前处理技术和声音后处理技术应该思考和努力解决的问题。国内耕耘声音20余年,在声音前处理技术方面已经处于地位的国产芯片原厂炬芯

2017-09-18 11:09 广告

2017-09-18 11:09 广告

2G/3G退网在即, LTE Cat 1 来帮忙

2G/3G退网在即, LTE Cat 1 来帮忙

2019-11-20 17:42:45 更新 阅读

聪明脸!户外广告的革新者

聪明脸!户外广告的革新者

2019-11-20 15:56:44 更新 阅读

十年磨一剑,一朝试锋芒 ——中国自动化大会砥砺

十年磨一剑,一朝试锋芒 ——中国自动化大会砥砺

2019-11-18 18:14:21 更新 阅读

索尼录音笔AI转写平台,上线开用!

索尼录音笔AI转写平台,上线开用!

2019-11-18 13:37:11 更新 阅读

newline启动“0元试用”,传递高效率沟通协作

newline启动“0元试用”,传递高效率沟通协作

2019-11-15 15:34:46 更新 阅读

4G用户怎么体验5G速度?腾讯手机管家5G测速帮你

4G用户怎么体验5G速度?腾讯手机管家5G测速帮你

2019-11-12 16:04:13 更新 阅读