AI基础模型全解析 (Foundation Models) | AIGC软件库

基础模型

探索驱动当前AI革命的核心技术——基础模型。本频道详细介绍各类文本、图像、视频、多模态等AI基础模型的技术原理、发展历程和应用前景，是您了解AI底层技术的第一站。

Grok Imagine API

生成视频并支持音频和编辑的AI工具

Z-Image

Z-Image

Z-Image是一款高效的开源图像生成模型，采用单流扩散Transformer技术，具有快速推理和卓越的写实质量。

Omniscience

Omniscience

专注于机器智能前沿技术的研究与开发。

Scriptaa

Scriptaa是一个多模态生成式人工智能平台。

FutureBaby

FutureBaby

一款通过分析父母面部特征预测未来孩子外貌的AI工具。

DiffusionAIArt

DiffusionAIArt

专注于AI艺术生成与扩散模型技术的在线平台。

BAGEL

BAGEL

BAGEL 是一个开源的统一多模态模型。

Janus Pro AI

Janus Pro AI

Janus Pro AI是由DeepSeek开发的多模态理解与生成模型，性能超越OpenAI。

Seed-OSS

支持超长上下文和思维预算控制的开源大语言模型

Writei

Writei

基于先进AI模型的即时高质量内容生成平台，支持多语言和多样化模板。

DeepSeek-V3.1-Base

一个用于构建语言应用的开源基础模型

Qwen-Image-Edit

Qwen-Image-Edit

精准编辑图像与文字的开源模型

Qwen-Image

Qwen-Image

生成和编辑带有文字的图片并支持多种语言的图像生成模型

KittenTTS

KittenTTS

一个小于25MB的文本转语音模型

GPT-OSS

GPT-OSS

来自OpenAI的开源大语言模型，为推理和智能体任务而设计

SongGeneration

SongGeneration

生成人声和伴奏的高质量歌曲

Step3

Step3

一个兼具性能和成本效益的多模态推理大模型

SkyworkUniPic

SkyworkUniPic

一个统一了图像理解、生成和编辑的多模态模型

OpusLM_7B_Anneal

OpusLM_7B_Anneal

处理语音和文本的统一语言模型

Magenta Realtime

Magenta Realtime

用于实时交互式音乐生成的Python库

1
2
3
下一页
共 4 页

返回顶部