SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超高龄老年人的语音数据,总时长达到 55.53小时。数据采集覆盖16个省市,涵盖不同地域口音,基于两两自发对话的方式,话题涉及退休、健康、生活等,贴近真实交流场景。数据集包含多维度精细标注,如说话人信息、对话内容转写、时间戳(句子级和词级)、口音类别标签等。SeniorTalk为深入研究老年人语音信号、优化老年人语音交互系统提供宝贵支撑,推动如设备适老化、健康管理、辅助养老机器人等相关产业的发展。


全部评论
留言在赶来的路上...
发表评论