首个 visual prior unified discrete diffusion model,用一套离散扩散框架同时打通文生图、图生文和VQA AI大模型,可能正在悄悄换基座。 过去几年,整个行业最熟悉、也最成功的预训练范式,几乎都围绕同一个问题展开:预测下一个词。 从GPT到后来的各种视觉语言模型 ...