MINT-1T数据集多模态数据集图文交错数据集视觉语言模型大规模训练数据

MINT-1T数据集多模态数据集图文交错数据集视觉语言模型大规模训练数据

MINT-1T数据集是万亿级规模的多模态数据集,包含1T+文本Token和3.4B图像。本图文交错数据集采用独特的图文交错格式,保留HTML文档结构,为视觉语言模型训练提供海量高质量数据。MINT-1T数据集支持100+语言,适合大规模训练数据需求,广泛应用于多模态大模型训练、图文理解、视觉问答等场景。

8 2026-04-11