一个兼具性能和成本效益的多模态推理大模型

将UI屏幕截图转换为HTML/CSS代码的工具

用于生成高质量图像和对齐多模态模型的工具

能像人一样操作电脑的开源智能体框架