基础模型

探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景,是您了解AI底层技术的第一站。

处理语音对话和生成任务的开源模型

一个生成超写实风格对话的文本转语音模型

一个基于Llama-3构建的开源语音生成模型

一个支持中英文的语音克隆工具

生成高质量语音和多角色对话的开源工具

支持92种语言的实时翻译工具

小红书开源的基于11.2万亿真实语料训练的高性能混合专家大模型

用于医疗保健和生命科学的开源AI模型

支持28种语言互译的70亿参数大模型

用于智能体编码的大语言模型

集成语音转文本和理解能力的开源大模型

为教育领域设计的开源对话大模型

用于医疗文本和图像理解的AI模型

可在本地电脑运行的轻量级AI研究模型

微软出品的代码编辑和优化大语言模型

B站开源的动漫视频生成模型

一个支持声音克隆的文本转语音工具

在Apple Silicon上高效运行的语音处理工具

一个精通中英双语的语音生成模型

从稀疏视角视频生成可任意变换角度的4D人体视频