在Huggingface部署OpenWebUI和FastGPT

type

status

date

slug

summary

category

icon

password

🤖

AI总结本文介绍了如何在 Hugging Face 的免费 Spaces 上无服务器部署 OpenWebUI 和 FastGPT。Hugging Face 是一个专注于 AI 开源平台，提供 Transformers 库、Datasets 库和 Spaces 等核心功能。OpenWebUI 是一个开源的 LLM Web UI，支持多模型、隐私和离线运行，以及 RAG 功能。FastGPT 是一个基于 LLM 的开源知识库问答系统，支持多种文档导入、可视化工作流和多模型兼容。文章提供了部署 OpenWebUI 和 FastGPT 的具体文件和环境变量建议，并推荐使用 WebDAV 进行数据同步。

English Version

This article introduces how to deploy OpenWebUI and FastGPT serverlessly on Hugging Face's free Spaces. Hugging Face is an open-source AI platform focused on providing core functionalities such as the Transformers library, Datasets library, and Spaces. OpenWebUI is an open-source LLM Web UI that supports multiple models, privacy and offline operation, as well as RAG capabilities. FastGPT is an open-source knowledge base Q&A system based on LLMs, supporting various document imports, visual workflows, and compatibility with multiple models. The article provides specific file and environment variable recommendations for deploying OpenWebUI and FastGPT, and suggests using WebDAV for data synchronization.

一，Huggingface介绍

Hugging Face 是一个专注于人工智能（尤其是自然语言处理，NLP）的开源平台和社区，被广泛称为“AI 领域的 GitHub”。它由 Clément Delangue 等人在 2016 年创立，最初聚焦 NLP，后扩展至多模态和通用 AI 领域。

1，核心功能

Transformers 库：

功能：提供数千种预训练模型（如 BERT、GPT、T5、LLaMA、Qwen 等），支持文本分类、问答、翻译、文本生成、图像生成、语音识别等任务
特点：通过 pipeline API 实现一行代码调用模型，例如情感分析或文本生成，支持PyTorch、TensorFlow、JAX 等框架，并提供统一的的 AutoModel 和 AutoTokenizer 接口

Datasets 库

功能：提供 40 万+公开数据集（如 GLUE、COCO），支持高效加载、预处理和流式处理，适用于训练和评估模型

Spaces（演示空间）

功能：免费托管交互式 AI 应用（如聊天机器人、图像生成工具），通过 Gradio 或 Streamlit 快速构建演示界面
支持Docker部署

社区与企业服务

社区：活跃的开发者论坛和协作生态，支持知识分享和模型贡献
企业服务：提供私有模型托管、高性能推理 API 和定制化解决方案

2，主要作用

NLP 任务

文本生成：如使用 GPT 或 Qwen 生成文章、代码
翻译与问答：调用 Helsinki-NLP 等模型实现多语言翻译或文档问答
情感分析/文本分类：快速分析用户评论或新闻情感倾向

多模态应用

图像处理：通过 Stable Diffusion 生成图像，或使用视觉问答模型分析图片内容
语音处理：支持语音识别和音频分离（如提取人声和背景音乐）

无代码工具

AI Sheets：无需编程即可用预训练模型处理数据，如自动标注或格式转换

教育与研究

提供免费课程和文档，帮助初学者学习 AI 技术
支持模型微调和分布式训练，加速科研迭代

3，优势与特点

开源友好：所有核心库（如 Transformers、Datasets）完全开源，采用 Apache 2.0 许可

性能优化：支持量化（8-bit/4-bit）、ONNX/TensorRT 加速和硬件适配（CUDA、MPS）

民主化 AI：降低技术门槛，使个人开发者和小团队也能使用先进模型

二，部署OpenWebui

OpenWebUI（原名 Ollama WebUI）是一个开源的、可自托管的 Web 用户界面，专为与大型语言模型（LLMs）交互而设计。它支持完全离线运行，提供类似 ChatGPT 的直观体验，同时兼容多种模型后端（如 Ollama、OpenAI API 等），适用于个人、企业及开发者场景。以下是其核心特点：

多模型支持：无缝对接 Ollama、OpenAI 兼容 API（如 DeepSeek、Gemini 等），支持同时调用多个模型并对比输出结果

隐私与离线运行：所有数据（聊天记录、文档等）存储在本地，无需依赖云端服务，满足 GDPR 等隐私合规要求

检索增强生成（RAG）：支持上传本地文档（PDF、Word 等）或抓取网页内容（通过 #URL 命令），提升回答的准确性和上下文相关性

开发者友好：提供 OpenAI 兼容的 API，便于集成到现有系统，同时支持 Python 函数调用 和插件系统（Pipelines），可扩展自定义逻辑（如实时翻译、代码执行）

1，主要文件：

（1）.gitattributes文件

.gitattributes文件代码

（2）Dockerfile文件

（3）README.md文件

（4）sync_data.sh文件

2，主要环境变量

此处推荐使用webdav进行同步，推荐网盘为Infini CLOUD

部署教程参考：抱脸部署OpenWebUI

备份数据库参考：WebDav备份数据库

三，部署FastGPT

FastGPT 是一个基于大型语言模型（LLM）的开源知识库问答系统，专注于帮助企业及个人快速构建专属的智能问答应用。以下是其核心特点与功能的简要介绍：

知识库问答：支持导入多种格式文档（如PDF、Word、Excel等），通过自动预处理、向量化和问答分割（RAG技术），构建可交互的AI知识库，实现精准问答

可视化工作流编排：通过 Flow模块 拖拽设计复杂流程（如多轮对话、数据库查询、库存管理），无需编码即可实现自动化任务

多模型兼容：支持GPT、Claude、文心一言等主流LLM，并可本地或云端部署，保障数据隐私

API集成：接口与OpenAI对齐，可接入企业微信、飞书等平台，扩展性强

1，主要文件

（1）.gitattributes文件

.gitattributes文件代码

（2）Dockerfile文件

（3）README.md文件

（4）~~config.json~~文件：在新版本中此文件已经废弃

config.json代码

2，主要环境变量

其中MONGODB_URI可从Mongodb注册账户并获取，而PG_URL可从 Supabase注册账户并获取。

部署教程参考：抱脸部署FastGPT