部署模型

将训练好的AI模型高效部署到生产环境。本栏目介绍Ollama、vLLM等模型部署工具,以及模型量化、剪枝等推理优化技术。

简便部署和管理大型语言模型的命令行工具

加速大语言模型推理的KV缓存层

百度推出的AI模型高性能部署套件

在本地运行AI模型的macOS浏览器

私有化运行开源大语言模型

一个由点对点AI网络驱动的生成式浏览器

提供按毫秒计费的GPU云计算服务,简化AI开发、训练与部署流程。

OpenBayes是一款开箱即用的人工智能及高性能计算(AI+HPC)服务平台。

Gemma是由Google DeepMind开发的轻量级前沿开源模型系列,基于Gemini模型技术构建。