机器人的 语音的生成、音响特征及语音分析,语音识别-www.cqhaiergw.com
摩登7机器人
CHUANGZE ROBOT
当前位置:首页 > 新闻资讯 > 机器人知识 > 机器人的 语音的生成、音响特征及语音分析,语音识别

机器人的 语音的生成、音响特征及语音分析,语音识别

来源:机器人[李明]     编辑:摩登7   时间:2026/5/20   主题:其他 [加盟]

机器人的语音输入输出内容如图3-9所示。语音输入过程是一种模式识 别过程,先对空气振动引起的语音声波进行分析,然后抽取声波里的音响特征,模式识别以及限定语音之间的连接关系。正确无误地对连续的发音进行 一个一个语音识别是一件非常困难的事情,所以只能从不是那么准确的语音 序列或单词的识别去理解人的说话内容。因此,在机器人系统中所使用的语 音识别方法、韵律规则和语法规则等语言学方面的规则都是综合了各种知识 形成的,只有这样才能理解人说话表达的意思。可以把这种系统称为语音理 解系统。但是人的说话有时不那么明确,或者表达不那么清楚,这时机器人就 要通过语音合成装置在人说话内容不明确或不清楚的地方提出疑问并请求解 答,或对人的说话内容多次加以确认,采用这种方式构成的系统称为语音对话 系统。在语音对话系统中,虽然对人所发出的语音或单词的识别并不十分准 确,但通过对话和理解过程就能把人说话的内容传达给机器人。

一般来说,语音的生成过程分为三个阶段:声道内音源的发音;到声道出 口为止的声波的传递;从声道出口到语音接受点的声波辐射。发音的音源也 有三种:通过声带的振动引起声道内呼出的气流所产生具有近似周期性的断 续气流量的变化;当呼出的气流通过声道时,由于声道变窄而产生的声压变 化;把闭锁的声道突然开放而产生的阶跃型的音压变化。对元音而言,声道由 咽喉、口咽和口腔组成,并具有全极点的传递函数特性,每个极点的频率称为 共振峰频率,把这些共振峰频率依次编号为D一共振峰频率、第二共振峰频 率、第三共振峰频率等。

语音的特征有分节特征和韵律特征两种。在语音分节特征中,可以把元 音或辅音等每个单音作为语音的一个特征单位,因此可以根据声道的传递函 数和音源的种类对这些特征单位进行描述。在语音的韵律特征中可以把语音 的抑扬、强度、节奏和速度作为语音的一种特征单位。语音的抑扬可以用振动的基频来描述,语音的强度可以用音源的强弱来描述,而语音的节奏和速度则 可以用单音或停顿的持续时间来描述。

通过傅里叶变换对频率函数进行分析是一种基本的语音分析方法。这种 方法得出的结果是一种频谱特性,包括振幅频谱和相位频谱,但相位特性对语 音影响不大,所以一般仅用振幅频谱(简称频谱)来表示。因为语音特征是随 时间变化的,所以使用傅里叶变换对语音分析时,应截取有限长度的语音信号 进行分析。

孤立单呼语音识别系统的基本构成。该图所示系统只能 识别预先指定的有限个孤立单词,这种系统不是进行组成单词的音素的识 别,而是把单词整体作为一个单位来进行识别。输入系统的孤立单词语音用 随时间变化的函数来描述,通过某些数学运算把单词语音信号变换为语音特 征更为明确的参数序列,进行音响分析。经过变换后的单词语音通常用十几 维的向量序列来描述,即使同一说话者对同一单词进行发音,每次发音时的 向量序列长度也有可能不同。对单词整体而言,向量序列长度的伸缩不是线 性变化的,元音的稳定发音部分的长度容易引起伸缩,辅音部分和各个过渡 部分则保持相对的固有长度,因而描述单词的整个向量序列长度的伸缩呈非 线性的。

在单呼语音识别系统中,被识别对象的单词,都预先准备好其标准的特征 向量序列。这些特征向量序列叫做标准模式。所谓单呼语音识别,是把经过 变换后的输入单词的特征向量序列与各单词的标准模式之间的相似性(或距 离)逐一进行比较,Z后把相似性Z高的单词作为识别结果进行输出。把被识 别单词的特征向量序列与标准单词模式进行比较,计算两者的相似性的操作 过程称为“对照”或“匹配”。输入的单词和标准单词的模式的向量序列长度一 般有差异,两者进行匹配时不能单纯的线性伸缩把两者凑齐,需要根据在时间 轴上的非线性特点采用时间规整技术进行复杂的数学计算。

单呼语音识别系统有两种类型:以特定人为前提并随时进行语音调整的 系统和以非特定人为前提且不对语音进行特别调整的系统。前者叫做特定人 的单呼语音识别系统,后者叫做非特定人的单呼语音识别系统。在特定人的 单呼语音识别系统中,大多数情况下是把特定人所说的单词语音进行音响分 析再变换为特征向量序列,然后原封不动地将这个特征向量序列句作为标准 模式来使用。在特定人的单呼语音识别系统中,选择几个典型的单词特征向 量序列作为标准单词模式,或从多个标准单词模式中求出概率分布,Z后进行 统计判别。





机器人图像匹配的常用方法:极线约束,唯一性约束,视差连续性约束,顺序一致性约束

匹配点一定位于两幅图像中相应的极线上;两幅图像中的对应的匹配点应该有且仅有一个;除了遮挡区域和视差不连续区域外,视差的变化应 该都是平滑的

机器人的视觉技术:单目视觉、双目视觉和全景视觉

移动机器人的单目视觉能够从图像的二维特征推导出三维信息,不能直接得到三维环境信息的;双目视觉机器人由两部摄像机从不同角度同时获取周围景物的两幅数字图像

足式移动机器人独特的优势:适应能力,隔振能力,能耗较少

双足机器人对步行环境的要求很低,能适应各种地面且具有较高的逾越障碍的能力;占地面积小,活动范围很大,其上配置的机械手具有更大的活动空间

不同类型的机器人手臂的运动形式和特点:直线,伸缩、升降及横向,回转,上下摆动

圆柱坐标型机器人,其臂部具有回转、升降和伸缩自由度;极坐标型机器人的典型臂部结构,其臂部具有回转、俯仰和伸缩自由度;多关节型机器人的臂部结构有回转、俯仰和前后移动三个自由度

机器人的手臂机构的要求:刚度要大、导向性要好、偏重力矩要小

为防止臂部在运动过程中产生过大的变形,手臂截面形状的选择要合理;为防止手臂在直线运动中沿运动轴线发生相对转动,设置导向装置,或设计方形、花键等形式的臂杆

迎宾机器人的低层控制的三种关键控制策略:阻抗柔顺控制,力/位混合控制,高频伺服与 PID 控制

阻抗柔顺控制将末端模拟为一个虚拟的弹簧阻尼系统,机械臂会表现出物理上的顺应性,主动退让以缓冲能量;分别应用力反馈回路和位置伺服回路

迎宾机器人的动作的生成与运动学的三项核心技术:时序轨迹规划,逆运动学解算,动力学一致性

时序轨迹规划确保机器人生成的位置、速度及加速度曲线具备二阶连续性;逆运动学解算在完成抓取任务的同时优化机械臂构型,以避开奇异位形

智能服务机器人动作表征体系的三种形式:任务空间表征,关节空间表征,肌群协同表征

关节空间表征描述机器人本体所有活动关节的角度、角速度及力矩构成的向量空间;肌群协同表征将高维的关节运动分解为少数几种基础模式的线性组合

导引指路机器人的触觉感知技术:触觉阵列、加速度/振动传感器以及光学触觉传感器

力/力矩传感器对整体载荷变化敏感,常用于力控、阻抗控制与安全监测;触觉阵列提供压力或剪切力的空间分布,可推断接触斑块形状、接触位置与支撑关系

仿人机器人路径规划:滚动路径规划的方法

在动态环境下,可以采用基于传感信息融合的在线 滚动路径规划的方法。该方法是一种实时路径规划方法,使用滚动规划的策略来解决动态环境下仿人机器人路径规划问题

移动机器人路径规划:局部路径规划,全局路径规划

局部路径规划指的是机器人在全局信息位置的情况下,依靠传感器信息进行的局部路径规划;机器人的全局路径规划方法可以分为可视图法,结构空间法,栅格法,拓扑法,随机路径规划法等

仿人机器人复杂运动规划:上下楼梯、跨越台阶、跑步、翻滚、爬行、守门、起立、跳舞

仿人机器人在3D空间的上下楼梯、跨越台阶和使用手臂一起进行全身运动规划的跑步、翻滚、爬行、守门、起立、跳舞以 及跟目标物体接触的踢球、开门、搬运东西等一系列运动
资料获取
机器人知识
== 资讯 ==
机器人的 语音的生成、音响特征及语音分析
网络安全标准化技术研究报告-工业具身智能
具身智能机器人和移动通信技术研究报告-智
具身智能技术及产业实践的阶段性进展-模型
机器人图像匹配的常用方法:极线约束,唯一
机器人的视觉技术:单目视觉、双目视觉和全
足式移动机器人独特的优势:适应能力,隔振
不同类型的机器人手臂的运动形式和特点:直
机器人手臂机构的设计、分类和主要技术参数
机器人的手臂机构的要求:刚度要大、导向性
机器人在车间开展料箱取放:搬运重量约 8
迎宾机器人的低层控制的三种关键控制策略:
迎宾机器人的动作的生成与运动学的三项核心
智能服务机器人动作表征体系的三种形式:任
2026中国具身智能产业商业化前沿洞察-
== 机器人推荐 ==
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

智能消毒机器人

智能消毒机器人

机器人开发平台

机器人开发平台


机器人底盘 Disinfection Robot 消毒机器人  讲解机器人  迎宾机器人  移动机器人底盘  商用机器人  智能垃圾站  智能服务机器人  大屏机器人  雾化消毒机器人  展厅机器人  服务机器人底盘  具身智能教育机器人  智能配送机器人  导览机器人 
版权所有 摩登7智能机器人集团股份有限公司 运营中心:上海 科技园8号楼5层 生产中心:山东日照解放路71号
销售1:4006-935-088 销售2:4006-937-088 客服电话: 4008-128-728