探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景,是您了解AI底层技术的第一站。
处理语音对话和生成任务的开源模型
一个生成超写实风格对话的文本转语音模型
一个基于Llama-3构建的开源语音生成模型
一个支持中英文的语音克隆工具
生成高质量语音和多角色对话的开源工具
支持92种语言的实时翻译工具
小红书开源的基于11.2万亿真实语料训练的高性能混合专家大模型
用于医疗保健和生命科学的开源AI模型
支持28种语言互译的70亿参数大模型
用于智能体编码的大语言模型
集成语音转文本和理解能力的开源大模型
为教育领域设计的开源对话大模型
用于医疗文本和图像理解的AI模型
可在本地电脑运行的轻量级AI研究模型
微软出品的代码编辑和优化大语言模型
B站开源的动漫视频生成模型
一个支持声音克隆的文本转语音工具
在Apple Silicon上高效运行的语音处理工具
一个精通中英双语的语音生成模型
从稀疏视角视频生成可任意变换角度的4D人体视频
返回顶部