首页 / AI工具 / TextHarmony – 字节联合华东师范推出的多模态生成模型

AI工具

TextHarmony – 字节联合华东师范推出的多模态生成模型

baidu09_com 2025-08-31 10 0

TextHarmony是华东师范大学和字节跳动共同推出的多模态生成模型，擅长理解和生成视觉文本。模型基于Slide-LoRA技术，动态聚合特定于模态和模态无关的LoRA专家，部分解耦多模态生成空间，在单一模型实例中协调视觉和语言的生成。TextHarmony在视觉和语言模态之间实现更统一的生成过程。研究团队推出高质量的图像字幕数据集DetailedTextCaps-100K，基于高级闭源MLLM合成，进一步提升模型的视觉文本生成能力。

TextHarmony – 字节联合华东师范推出的多模态生成模型第1张

（图片来源网络，侵删）

TextHarmony – 字节联合华东师范推出的多模态生成模型第2张

（图片来源网络，侵删）

字节联动字节联动网络科技联合体字节对齐字节或字字节tns 字节 tz 字节 mentor

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/14973.html

上一篇

亚洲汽车产业技术迅猛发展， Automechanika Shanghai 2017全面呈现汽车市场趋势

下一篇

4升机油够一次保养吗？汽车保养机油加多少

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部