CDial-GPT是清华大学研究团队推出的大型中文短文本对话数据集LCCC及基于数据集的预训练对话生成模型。LCCC数据集经过严格的清洗流程,包含基础版(LCCC-base)和扩展版(LCCC-large),旨在提升对话模型的质量。研究团队提供在LCCC数据集上预训练的GPT模型,模型先在中文小说数据集上预训练,然后在此基础上进一步训练,生成更自然、流畅的对话。CDial-GPT模型对于中文自然语言处理领域的研究具有重要意义,有助于推动中文对话系统的发展。


CDial-GPT是清华大学研究团队推出的大型中文短文本对话数据集LCCC及基于数据集的预训练对话生成模型。LCCC数据集经过严格的清洗流程,包含基础版(LCCC-base)和扩展版(LCCC-large),旨在提升对话模型的质量。研究团队提供在LCCC数据集上预训练的GPT模型,模型先在中文小说数据集上预训练,然后在此基础上进一步训练,生成更自然、流畅的对话。CDial-GPT模型对于中文自然语言处理领域的研究具有重要意义,有助于推动中文对话系统的发展。
全部评论
留言在赶来的路上...
发表评论