AI模型部署与推理优化工具 | AIGC软件库

部署模型

将训练好的AI模型高效部署到生产环境。本栏目介绍Ollama、vLLM等模型部署工具，以及模型量化、剪枝等推理优化技术。

Nexa SDK

Nexa SDK

Nexa SDK支持在移动设备、PC、汽车和物联网上快速部署LLM、多模态、ASR及TTS模型，具备高效、隐私保护和生产就绪的特性，适用于NPU、GPU和CPU。

Bolt Foundry

Bolt Foundry

为产品团队提供校准评估，验证LLM性能符合预期。

Synexa AI

Synexa AI 平台支持一行代码快速部署高性能AI模型，具备稳定高效和开发者友好的特性。

vLLM CLI

vLLM CLI

简便部署和管理大型语言模型的命令行工具

LMCache

LMCache

加速大语言模型推理的KV缓存层

FastDeploy

FastDeploy

百度推出的AI模型高性能部署套件

Web-macOS AI Browser

Web-macOS AI Browser

在本地运行AI模型的macOS浏览器

Synthetic

Synthetic

私有化运行开源大语言模型

Hyperspace

Hyperspace

一个由点对点AI网络驱动的生成式浏览器

Runpod

Runpod

提供按毫秒计费的GPU云计算服务，简化AI开发、训练与部署流程。

OpenBayes

OpenBayes

OpenBayes是一款开箱即用的人工智能及高性能计算（AI+HPC）服务平台。

Gemma

Gemma

Gemma是由Google DeepMind开发的轻量级前沿开源模型系列，基于Gemini模型技术构建。

返回顶部