Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环长程灵巧操作任务。Psi R0能实现跨物品、跨场景级别的泛化,具备较强的泛化能力和较高的鲁棒性。
留言在赶来的路上...
Seed-X是字节跳动Seed团队推出的开源多语言翻译模型,拥有70亿参数,支持28种语言的双向翻译。Seed-X通过高质量的多语言数据预训练、指令微调和强化学习相结合的方式,显著提升翻译能力,在处理复杂语言模式和生硬翻译时...
Seed-VC 是一种零样本声音转换技术,基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练,只需提供1到30秒的参考语音样本,实现声音的克隆和转换。...
Seed-Thinking-v1.5 是字节跳动推出的推理智能模型,采用混合专家(MoE)架构,总参数量为 200B,每次激活 20B 参数。模型在多个基准测试中表现出色,如在 AIME 2024 测试中获得 86.7 分,...
Seed-TTS是由字节跳动开发的一系列高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的高质量语音,具备出色的上下文学习能力和自然度。...
Seed-OSS 是字节跳动 Seed 团队开源的系列大型语言模型,专注于长文本处理、推理和智能代理能力。模型包含多个版本,如 Seed-OSS-36B-Base 和 Seed-OSS-36B-Instruct,分别在通用能...
Seed-Music是字节跳动推出的AI音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言模型和扩散方法,根据用户的多模态输入(如风格描述、音频参考、乐谱和声音提示)生成高质量、风格可控的音乐。...
Seed-Coder是字节跳动开源的8B规模代码模型系列,提升代码生成与理解能力。包含Base、Instruct和Reasoning三个版本,分别适用于代码补全、指令遵循和复杂推理任务。...
Seed-ASR是字节跳动开发的一款基于大型语言模型(LLM)的语音识别(ASR)模型。在超过2000万小时的语音数据和近90万小时的配对ASR数据上训练,支持普通话和13种中国方言的转录,能识别英语和其他7种外语的语音。...
全部评论
留言在赶来的路上...
发表评论