基础模型

探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景,是您了解AI底层技术的第一站。

Janus Pro AI是由DeepSeek开发的多模态理解与生成模型,性能超越OpenAI。

支持超长上下文和思维预算控制的开源大语言模型

一个用于构建语言应用的开源基础模型

精准编辑图像与文字的开源模型

生成和编辑带有文字的图片并支持多种语言的图像生成模型

一个小于25MB的文本转语音模型

来自OpenAI的开源大语言模型,为推理和智能体任务而设计

生成人声和伴奏的高质量歌曲

一个兼具性能和成本效益的多模态推理大模型

一个统一了图像理解、生成和编辑的多模态模型

处理语音和文本的统一语言模型

用于实时交互式音乐生成的Python库

生成逼真图像的AI模型

可生成中英双语对话的语音模型

用于理解真实世界短视频的结构化视频理解模型

具备电影级效果的开源视频生成模型

从文本或单张图像生成可交互的3D世界

原生融合推理、编码与智能体能力的开源大模型

用于复杂推理的开源大语言模型

一个可训练的播客专用语音合成模型