探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景,是您了解AI底层技术的第一站。
微软出品的代码编辑和优化大语言模型
B站开源的动漫视频生成模型
一个支持声音克隆的文本转语音工具
在Apple Silicon上高效运行的语音处理工具
一个精通中英双语的语音生成模型
从稀疏视角视频生成可任意变换角度的4D人体视频
一个轻量级、高效率的文本转语音模型库
一个将文本转换为自然语音的开源模型
用于训练文本转语音模型的工具包
一个根据文本或图片生成长视频的开源模型
提升搜索结果精度的AI重排序工具
由 Hugging Face 推出的轻量级文本转语音(TTS)模型库。
企业级大模型生产平台,支持自研或开源模型的集中管理与训练。
Llama 4提供高性能、多模态、低成本的领先AI模型Scout和Maverick。
百度文心提供产业级知识增强大模型及开发工具,降低AI应用门槛。
提供用于转录和理解语音的AI模型。
MetaVoice提供自然如友的语音AI交互体验。
Imagen是一个基于文本到图像扩散模型的工具。
元象自研高性能通用大模型,支持多任务需求并降低开发成本。
澜舟科技提供基于NLP技术的新一代认知智能平台。
返回顶部