xinli/rag-python/README-部署指南.md
2025-12-20 18:33:07 +08:00

1.6 KiB
Raw Blame History

RAG 知识库服务 - 部署指南

环境要求

  • Python 3.11(必须是 3.11,不能用 3.14
  • Ollama本地大模型服务

一、安装 Python 3.11

下载地址:https://www.python.org/downloads/release/python-3119/

安装时勾选 "Add Python to PATH"

二、安装 Ollama

下载地址:https://ollama.com/download

安装后运行以下命令下载模型:

ollama pull nomic-embed-text
ollama pull qwen2.5:7b

三、安装依赖

rag-python 目录下运行:

py -3.11 -m pip install -r requirements.txt

四、使用方法

1. 添加文档

把要索引的文档放到 knowledge_docs 文件夹中

支持的格式:.txt .md .pdf .docx

2. 建立索引

py -3.11 batch_index.py

注意:扫描版 PDF 需要 OCR 识别,速度较慢(每页约 5-10 秒)

3. 启动服务

py -3.11 app.py

服务默认运行在 http://localhost:5000

五、常见问题

Q: 提示缺少模块?

py -3.11 -m pip install 模块名

Q: OCR 识别很慢?

扫描版 PDF 需要逐页识别272 页大约需要 20-30 分钟。有 GPU 会快很多。

Q: 如何测试服务?

curl http://localhost:5000/api/knowledge/search?query=测试

六、目录结构

rag-python/
├── knowledge_docs/    # 放入要索引的文档
├── index_data/        # 生成的索引文件(自动创建)
├── batch_index.py     # 批量索引脚本
├── app.py             # Web 服务入口
└── requirements.txt   # 依赖列表