OASST1数据集开源对话数据集OpenAssistant对话模型训练多轮对话数据

OASST1数据集开源对话数据集OpenAssistant对话模型训练多轮对话数据

OASST1数据集是由OpenAssistant项目构建的大规模开源对话数据集,包含161K对话树和10M+对话消息。本开源对话数据集采用树状结构组织多轮对话数据,支持35+语言,由13000+志愿者众包创建。OASST1数据集适合对话模型训练,为智能客服系统、教育辅导助手、多语言AI助手等应用提供高质量训练数据。

11 2026-04-11