RagFlowDeepseek构建个人知识库

2025-03-13 约 1336 字预计阅读 3 分钟

RagFlow+Deepseek构建个人知识库

windows可以在WSL中操作，尽量跟着官方的步骤来，避免一些奇奇怪怪的错误
硬件先决条件
1. CPU >= 4 cores
2. RAM >= 16 GB
3. Disk >= 50 GB
4. Docker >= 24.0.0 & Docker Compose >= v2.26.1
使用下面的命令查看docker和docker-compose的版本是否满足
```
docker --version
docker-compose --version
```
确保 vm.max_map_count
= 262144：
检查 vm.max_map_count 的值：
```
sysctl vm.max_map_count
```
如果不是，则将 vm.max_map_count 重置为至少 262144 的值。
```
sudo sysctl -w vm.max_map_count=262144
```
此更改将在系统重启后重置。永久更改的话要添加或者更新**/etc/sysctl.conf**中的 vm.max_map_count 值如下：
```
vm.max_map_count=262144
```
克隆仓库
```
git clone https://github.com/infiniflow/ragflow.git
```
克隆完成后会出现一个 ragflow文件夹

使用docker-compose启动

注意，ragflow 镜像有多个不同的大小，默认的是v0.17.2-slim，区别如下，主要是包不包含embedding模型的区别，我选的默认的，因为占用小，并且我后续使用调用api的方式去配置embedding模型，所以就选，默认的。

RAGFLow机械标签	镜像大小 (GB)	是否有嵌入模型	稳定版本？
v0.17.2	≈9	✔️	Stable release
v0.17.2-slim	≈2	❌	Stable release
nightly	≈9	✔️	Unstable nightly build
nightly-slim	≈2	❌	Unstable nightly build

如果希望使用v0.17.2，可以修改docker-compose.yml文件中的版本为 v0.17.2 即可

vim ragflow/docker/.env

cd ragflow/docker
docker compose -f docker-compose.yml up -d

第一次会先拉取镜像,完成后如下

添加embedding模型
如果在上一步 使用docker-compose启动 中已经选择了带有embedding模型的镜像，这一步可以省略

这里直接调用硅基流动的api，下面的博客有注册的方法
然后在系统模型设置中将默认的嵌入模型选择为bgd-large-zh-v1.5
添加聊天模型
本地用ollama部署一个deepseekr1-1.5b的模型
查看模型填入的名称，如果是直接下载的软件包安装的，打开终端输入以下命令查看
```
ollama list
```
如果是docker部署的ollama先进入容器再查看,假设ollama容器名称就叫ollama
```
docker exec -it ollama /bin/bash
ollama_list
```
这个NAME下面的就是需要输入的名称
deepseek-r1:1.5b

如果ollama和ragflow都是docker部署的，那么这里的基础url填
否则填
http://127.0.0.1:11434
配置好系统聊天模型