基础模型

探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景,是您了解AI底层技术的第一站。

用于医疗文本和图像理解的AI模型

可在本地电脑运行的轻量级AI研究模型

微软出品的代码编辑和优化大语言模型

B站开源的动漫视频生成模型

一个支持声音克隆的文本转语音工具

在Apple Silicon上高效运行的语音处理工具

一个精通中英双语的语音生成模型

从稀疏视角视频生成可任意变换角度的4D人体视频

一个轻量级、高效率的文本转语音模型库

一个将文本转换为自然语音的开源模型

用于训练文本转语音模型的工具包

一个根据文本或图片生成长视频的开源模型

提升搜索结果精度的AI重排序工具

由 Hugging Face 推出的轻量级文本转语音(TTS)模型库。

企业级大模型生产平台,支持自研或开源模型的集中管理与训练。

Llama 4提供高性能、多模态、低成本的领先AI模型Scout和Maverick。

百度文心提供产业级知识增强大模型及开发工具,降低AI应用门槛。

提供用于转录和理解语音的AI模型。

MetaVoice提供自然如友的语音AI交互体验。

Imagen是一个基于文本到图像扩散模型的工具。