拜读维拉科技关于机器人相关信息的综合整理,涵盖企业排名、产品类型及资本市场动态:一、中国十大机器人公司(综合类)‌优必选UBTECH)‌聚焦人工智能与人形机器人研发,产品覆盖教育、娱乐及服务领域,技术处于行业前沿‌。如何在MATLAB中构建智能语音助手机器人‌中科院旗下企业,工业机器人全品类覆盖,是国产智能工厂解决方案的核心供应商‌。埃斯顿自动化‌国产工业机器人龙头,实现控制器、伺服系统、本体一体化自研,加速替代外资品牌‌。遨博机器人(AUBO)协作机器人领域领先者,主打轻量化设计,适用于3C装配、教育等柔性场景‌。埃夫特智能‌国产工业机器人上市第一股,与意大利COMAU深度合作,产品稳定性突出‌。二、细分领域机器人产品‌智能陪伴机器人‌Gowild公子小白‌:情感社交机器人,主打家庭陪伴功能‌。CANBOT爱乐优‌:专注0-12岁儿童心智发育型亲子机器人‌。仿真人机器人目前市场以服务型机器人为主,如家庭保姆机器人(售价10万-16万区间)‌,但高仿真人形机器人仍处研发阶段。水下机器人‌工业级产品多用于深海探测、管道巡检,消费级产品尚未普及。如何在MATLAB中构建智能语音助手资本市场动态‌机器人概念股龙头‌双林股份‌:特斯拉Optimus关节模组核心供应商,订单排至2026年‌。中大力德‌:国产减速器龙头,谐波减速器市占率30%‌。金力永磁‌:稀土永磁材料供应商,受益于机器人电机需求增长‌。行业趋势‌2025年人形机器人赛道融资活跃,但面临商业化落地争议,头部企业加速并购整合‌。四、其他相关机器人视频资源‌:可通过专业科技平台或企业官网(如优必选、新松)获取技术演示与应用案例。价格区间‌:服务型机器人(如保姆机器人)普遍在10万-16万元,男性机器人13万售价属高端定制产品‌。

具身是一种将智能与物理实体深度融合的形态,强调智能行为既依赖智能体自身算力,更离不开其与环境的感知交互。在具身智能体与人类交互方面,自然语言是极为直观且高效的沟通方式。

大语言模型(LLM)凭借卓越的自然语言理解、生成与推理能力,与具身智能结合,人类可经语音智能体发出指令、提出问题或者表达需求,LLM 能处理理解语言信息并生成回复,还可以将用户指令解析为具体动作或任务目标,助力具身智能体精准把握人类意图并协同工作。

我们利用 开发了一个简易智能助手,实现了基于语音的人机交互。下面的将展示该语音助手如何被唤醒,以及它如何应答用户提问和接收指令以操控开关。

系统概况

下图展示了该智能助手简要的工作流程:它通过监听环境并检测触发词来被唤醒,之后调用语音转文本模型将用户语音转化为文本,通过文本判断是否为用户指令:若为指令,则将其转化为控制信息发送至硬件执行;若非指令,则调用LLM生成相应的回复;最后,通过文本转语音模型将回复文本转化为语音并播放。

如何在MATLAB中构建智能语音助手  第1张

本文将展示如何在 MATLAB 中构建这样一个语音助手,以及 MATLAB 在智能应用快速原型方面的如下能力:

用户界面设计与实现

语音采集与处理

模型集成

大语言模型支持

硬件控制与代码部署

用户界面设计与实现

MATLAB 提供一个用于设计和 App 的交互式开发环境 App Designer,可以用来设计智能助手的用户界面。App Designer 内置完整的 MATLAB 编辑器和丰富的交互式 UI 组件,支持通过网格布局管理界面,并可自动适应屏幕尺寸变化。用户可直接在工具栏将 App 打包为安装文件分发,或借助 MATLAB Comler 创建独立桌面或 Web App。

如何在MATLAB中构建智能语音助手  第2张

可参考如下网页快速入门 App Designer:

使用 App 设计工具开发 App:https://ww2..cn/help/matlab/app-designer.html

语音采集与处理

除了基本的 Signal Processing Toolbox,MATLAB 还专门为、语音和声学信号的处理与分析提供了Audio Toolbox,这也为我们智能助手的语音采集和处理提供了便利。Audio Toolbox 提供丰富的,可用于音频信号处理、声学指标估算、音频数据集标注与增强,以及音频特征提取。

可访问如下网页学习如何在 MATLAB 中通过 Audio Toolbox 采集、分析及处理语音信号:

Audio Toolbox:https://ww2.mathworks.cn/help/audio/index.html

结合上一步,如需在用户界面上实现音频文件的波形显示与播放,可参考如下示例:

创建音频播放与可视化应用:*https://ww2.mathworks.cn/help/audio/ug/create-an-app-to-play-and-visualize-audio-files.html *

在智能助手应用中,触发词检测、语音转文本和文本转语音这三个模块都是基于Audio Toolbox 网页上提供的 “ for Audio” 相关参考示例和函数来实现的。MATLAB 提供了Statistics and Machine Learning Toolbox 和 Deep Learning Toolbox 来支持 AI 方面的应用。其中,触发词检测主要是通过训练一个网络来完成。可在 MathWorks 官网上搜索以下示例,学习如何在 MATLAB 中对音频信号打,如何设计与训练一个用于触发词检测的深度学习网络,以及如何裁剪及量化 并把它部署到中。

如何在MATLAB中构建智能语音助手  第3张

对于语音与文本的相互转换,需在 MATLAB 工具栏的“d-Ons”下点击“Get Add-Ons”,搜索并安装“Audio Toolbox Interface for SpeechBrain and Torchaudio Libraries”。也可访问如下网页直接下载安装,并查看其使用文档及相关示例:

Audio Toolbox Interface for SpeechBrain and Torchaudio Libraries:https://ww2.mathworks.cn/matlabcentral/fileexchange/160371-audio-toolbox-interface-for-speechbrain-and-torchaudio-libraries

如何在MATLAB中构建智能语音助手  第4张

该插件可自动安装 Python 和 PyTorch,并下载 SpeechBrain 和 Torchaudio 库中的深度学习模型,从而为 Audio Toolbox 提供了基于 AI 的(ASR)和语音合成功能,使得MATLAB 用户无需深度学习经验即可直接使用前沿的 AI 语音模型。

用户可通过 speechClient 对象,调用speech2xt和text2speech函数,选用本地模型或者Google、IBM、Microsoft、Amazon 等云服务,分别实现语音转文本(STT)(或自动语音识别(ASR))和文本转语音(TTS)(或语音合成)功能。对于中文,可选择whisper 模型实现语音转文本,注意这时需单独下载模型权重。

Python 模型集成

在文本转语音模块中,text2speech 函数使用的是 HiFi-GAN/Totron2 预训练模型,无法合成超过约 10 秒的语音信号。因此,可在 MATLAB 中配置 Python 环境,安装和调用其他预训练好的 Python 模型。具体操作可参考:

从 MATLAB 中调用 Python:https://ww2.mathworks.cn/help/matlab/call-python-libraries.html

在智能助手的示例中,我们选用的是pyttsx3,一个可直接调用多种的 TTS,支持在离线状态下实现文本转语音并播放功能的Python 库。

在 MATLAB 命令行,可使用如下命令安装pyttsx3库:

如何在MATLAB中构建智能语音助手  第5张

然后,通过如下函数初始化一个基于pyttsx3的TTS引擎并设置其参数:

如何在MATLAB中构建智能语音助手  第6张

之后,就可利用* engine.say()* 函数传入需要合成并播放的文本,使用*engine.runAndWait() *函数等待朗读任务的完成。

大语言模型支持

在我们的智能助手项目中,大语言模型被用来回答用户的提问。为此,需要在附加功能资源浏览器中搜索并安装 “Large Language Models (LLM) with MATLAB” ,或访问如下网页直接下载并安装:

Large Language Models (LLMs) with MATLAB:https://ww2.mathworks.cn/matlabcentral/fileexchange/163796-large-language-models-llms-with-matlab

如何在MATLAB中构建智能语音助手  第7张

这个Add-on可以帮助用户通过 MATLAB 连接或者调用各种大语言模型。目前支持 OpenAI Chat Completions API 和 OpenAI Images API 等,还支持调用 Ollama 部署的本地大模型。可参考之前发布的微信文章《如何运行本地 DeepSeek 模型并在 MATLAB 中使用?》了解更多。

硬件控制和代码部署

与硬件设备进行交互是具身智能的一大特色,在这个智能助手项目中,用户可以通过指令控制电机启动和关闭。MATLAB 和 可以直接与一些硬件链接并进行实时数据流传输,还能支持将算法和模型自动生成 C/、HDL 或 代码等,部署到中,如、无人车的车载计算机等,实现具身智能系统的实际运行。

可在如下网页中找到更详细的信息:

MATLAB 的硬件支持:https://ww2.mathworks.cn/hardware-support/home.html

为了演示智能助手对电机的控制,我们基于如下 MATLAB 随软件附带的示例做了简单修改:

使用基于 的板子实现对三相交流电机的开环控制:https://ww2.mathworks.cn/help/ecoder/stmicroelectronicsstm32f4discovery/ug/Openn-Loop-Control-Example.html

原始示例是通过板卡上的按键打开或者关闭电机运行,我们将“Communication” 下的“Start and Stop Motor” 模块修改成通过 USART2 串口接收信号控制电机启动与停止(如下图所示)。所以,当智能助手检测到指令时,只需要在串口发送该指令所相对应的数字即可。

如何在MATLAB中构建智能语音助手  第8张

记得在 MATLAB 电机控制命令发送函数中使用与 STM32 USART2 配置中相同的波特率与字长。

如何在MATLAB中构建智能语音助手  第9张

总结

目前,我们仅使用 MATLAB 将具身智能与大语言模型(LLM)结合,在人机交互方面进行了初步探索,未来将继续探索能否直接使用多模态模型直接解析用户需求来实现具身智能的人机交互。

除了人机交互, MATLAB 在具身智能的建模与、感知与数据处理、决策与控制、学习与训练、测试与评估、部署及代码生成等众多领域,均是功能强大的工具。欢迎感兴趣的小伙伴们和我们一同进行探索与研究!