基础模型-第 3 页-AIGC软件库

基础模型

探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景，是您了解AI底层技术的第一站。

MedGemma

MedGemma

用于医疗文本和图像理解的AI模型

Jan-nano

Jan-nano

可在本地电脑运行的轻量级AI研究模型

NextCoder-32B

NextCoder-32B

微软出品的代码编辑和优化大语言模型

Index-AniSora

Index-AniSora

B站开源的动漫视频生成模型

Index-TTS

Index-TTS

一个支持声音克隆的文本转语音工具

mlx-audio

mlx-audio

在Apple Silicon上高效运行的语音处理工具

Llasa-3B

Llasa-3B

一个精通中英双语的语音生成模型

Diffuman4D

Diffuman4D

从稀疏视角视频生成可任意变换角度的4D人体视频

Kokoro

Kokoro

一个轻量级、高效率的文本转语音模型库

OuteTTS

OuteTTS

一个将文本转换为自然语音的开源模型

IMS-Toucan

IMS-Toucan

用于训练文本转语音模型的工具包

LTX-Video

LTX-Video

一个根据文本或图片生成长视频的开源模型

Zerank-1

Zerank-1

提升搜索结果精度的AI重排序工具

Parler-TTS

Parler-TTS

由 Hugging Face 推出的轻量级文本转语音（TTS）模型库。

曹植大模型

曹植大模型

企业级大模型生产平台，支持自研或开源模型的集中管理与训练。

Llama

Llama

Llama 4提供高性能、多模态、低成本的领先AI模型Scout和Maverick。

文心大模型

文心大模型

百度文心提供产业级知识增强大模型及开发工具，降低AI应用门槛。

AssemblyAI

AssemblyAI

提供用于转录和理解语音的AI模型。

MetaVoice

MetaVoice

MetaVoice提供自然如友的语音AI交互体验。

Imagen

Imagen

Imagen是一个基于文本到图像扩散模型的工具。

上一页
1
2
3
4
下一页
共 4 页

返回顶部