https://docs.anaconda.com/free/miniconda/miniconda-other-installer-links/#linux-installers
wget https://repo.anaconda.com/miniconda/Miniconda3-py310_24.4.0-0-Linux-x86_64.sh
export PATH=$HOME/miniconda3/bin:$PATH
- 使用docker-compose启动Milvus服务
cd docker #切换至docker配置目录环境
docker-compose up -d #启动项目中的服务,并在后台以守护进程方式运行
如果对docker不了解,可以看下以下文章:
docker-compose快速入门
docker-conpose命令解读
术语说明:
守护进程: 是一类在后台运行的特殊进程,用于执行特定的系统任务,会一直存在。如果以非守护进程启动,服务容易被终止。
- Milvus 前端展示地址
http://{ip}:3100/#/
把ip替换为你所在服务器的ip地址即可
- 新建/data/WoLLM 目录
- 将以下两个模型下载到新建的目录中
- Embedding Model 下载:
git clone https://www.modelscope.cn/maidalun/bce-embedding-base_v1.git
- Rerank Model 下载:
git clone https://www.modelscope.cn/maidalun/bce-reranker-base_v1.git
说明:
Embedding Model: 主要是完成将自然语言文本转化为固定维度向量的工作,主要在知识库的建模,用户查询query表示时会应用。
Rerank Model:对结果进行重排操作。
这里采用的都是bce的模型,因为其在RAG上表现较好,可以参考资料,了解一下背景:
BCE Embedding技术报告
下载好两个模型后, 将模型放到指定的位置,并更新项目conf.config.py文件中EMBEDDING_MODEL和RERANK_MODEL对应参数的路径(和模型路径保持一致)。如图:
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
- 配置文件在conf/config.py
- 配置文件的各项信息修改为自己的信息, 每个变量已经加了详细注释.
- 可能需要改动的参数一般就是两个模型文件目录,如图:
- 如果你需要修改端口,或者服务器变更,你需要修改docker.docker-compose.yml中的配置参数,一般就是修改ip和端口。
- 将.env_user复制为.env
cp .env_user .env
[重要,重要,重要. 必须复制一下] - 修改.env的LLM以及OSS相关变量信息(目前只需要复制一下即可, 不需要修改里面的内容了)
python main.py
bin/start.sh
ToDo
- rag 优化
- 多级索引优化
- 多查询优化
- query优化
- 解析优化