一个统一了图像理解、生成和编辑的多模态模型