基础模型-第 2 页-AIGC软件库

基础模型

探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景，是您了解AI底层技术的第一站。

FLUX.1 Krea

FLUX.1 Krea

生成逼真图像的AI模型

MOSS-TTSD

MOSS-TTSD

可生成中英双语对话的语音模型

ARC-Hunyuan-Video-7B

ARC-Hunyuan-Video-7B

用于理解真实世界短视频的结构化视频理解模型

Wan2.2

Wan2.2

具备电影级效果的开源视频生成模型

HunyuanWorld-1.0

HunyuanWorld-1.0

从文本或单张图像生成可交互的3D世界

GLM-4.5

GLM-4.5

原生融合推理、编码与智能体能力的开源大模型

Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507

用于复杂推理的开源大语言模型

Muyan-TTS

Muyan-TTS

一个可训练的播客专用语音合成模型

Kimi-Audio

Kimi-Audio

处理语音对话和生成任务的开源模型

Dia

Dia

一个生成超写实风格对话的文本转语音模型

Orpheus-TTS

Orpheus-TTS

一个基于Llama-3构建的开源语音生成模型

MegaTTS3

MegaTTS3

一个支持中英文的语音克隆工具

Higgs Audio

Higgs Audio

生成高质量语音和多角色对话的开源工具

Qwen3-MT

Qwen3-MT

支持92种语言的实时翻译工具

dots.llm1

dots.llm1

小红书开源的基于11.2万亿真实语料训练的高性能混合专家大模型

OpenMed

OpenMed

用于医疗保健和生命科学的开源AI模型

Seed-X-7B

Seed-X-7B

支持28种语言互译的70亿参数大模型

Qwen3-Coder

Qwen3-Coder

用于智能体编码的大语言模型

Voxtral

Voxtral

集成语音转文本和理解能力的开源大模型

EduChat

EduChat

为教育领域设计的开源对话大模型

上一页
1
2
3
4
下一页
共 4 页

返回顶部