FastGPT 提供 Docker 一键部署方式,适合大多数服务器环境。首先确保系统已安装 Docker 和 Docker Compose。从官方仓库克隆部署文件后,在项目根目录执行 docker-compose up -d 即可启动服务。首次运行会自动拉取镜像并初始化数据库。部署完成后,通过浏览器访问服务器 IP 加默认端口 3000 进入管理界面。如需自定义端口或域名,可在 docker-compose.yml 中修改环境变量中的 PORT 和 API_KEY 等参数。
登录后台后,点击左侧导航栏的“知识库”进入管理页面。点击“新建知识库”并输入名称和描述。FastGPT 支持多种文件格式上传,包括 PDF、Word、Markdown 和纯文本。上传后系统会自动进行文档分段、向量化处理。你可以调整分段大小(建议 200-500 字)和重叠字数,以平衡检索精度与上下文连贯性。处理完成后,知识库中的文档片段会以向量形式存储,供后续检索使用。每个知识库可单独设置模型(如嵌入模型和重排序模型),默认使用系统中的配置。
在“应用”页面点击“新建应用”,选择“知识库问答”类型。首先关联已创建的知识库,然后设置 Prompt 模板。FastGPT 内置了“通用客服”和“文档问答”等预设模板,你也可以自定义系统提示词和用户提示词。接下来选择大语言模型,建议选用 GPT-4 或国产模型如 Qwen2.5,根据预算和场景调整。在“高级设置”中可开启引用来源显示、限制对话轮次、设置温度参数等。保存后应用即可上线,生成一个唯一的访问链接或嵌入式代码。
用户可通过 Web 界面直接发起对话。在对话框输入问题,系统会先在知识库中检索最相关的文档片段,然后由大模型结合上下文生成答案。回答下方会显示引用来源,点击可跳转到原始文档位置,便于核实。FastGPT 支持多轮对话,每次提问都会基于历史记录和最新检索结果回答。如果你需要批量测试,可以在应用页面的“测试”面板输入多个问题,快速验证知识库的覆盖率和回答质量。对于已上线的应用,还可以通过 API 集成到自己的业务系统中,接口文档可在“应用”页面的“API 密钥”区域获取。
在“团队管理”中可添加成员并分配角色(管理员、编辑者、查看者)。管理员拥有全部操作权限,编辑者可以创建和修改知识库及应用,查看者只能浏览和测试。每个知识库和应用都可以独立设置可见范围,支持对特定团队开放或公开。建议将生产环境和测试环境分开,使用不同的应用实例,避免测试数据干扰线上用户。
若回答不准确,首先检查知识库文档是否包含关键信息,分段是否合理。可尝试调整检索的重排序阈值(默认 0.3),降低阈值以召回更多片段,或提高阈值以过滤低质量结果。另外,Prompt 模板中可要求模型“如果不确定则回答不知道”,减少幻觉。如果性能不足,可升级服务器配置或将模型切换到更快的选项。FastGPT 支持多模态输入(图片、表格),在文档处理时会自动识别并转为文本描述,务必确保上传的文件清晰可读。