Deepseek R1打造本地化RAG知识库

2025-03-21 栏目:技术知识

1.1 基本概念

  • RAG(Retrieval-Augmented Generation,增强信息检索和生成模型)能够从大规模知识库中检索相关信息并生成高质量的反馈。主要功能:

    • 索引:将文档库分割成较短的 Chunk,并通过编码器构建向量索引。

    • 检索:根据问题和 chunks 的相似度检索相关文档片段。

    • 生成:以检索到的上下文为条件,生成问题的回答。

  • 原理图

img

1.2 涉及工具和组件

  • Ollama

  • Deepseek R1 LLM模型

  • Nomic-Embed-Text向量模型,将使ollama具备将文档向量化的的能力

  • AnythingLLM

1.3 安装部署

1.3.1 安装ollama

下载地址

image-20250211111121902

image-20250211111544549

验证安装

image-20250211111749959

1.3.2 下载DeepSeek R1模型

通过Ollama官网下载DeepSeek R1模型

# 启动和下载模型是同一个命令,如果没有下载过的新模型会直接下载,以及下载过的则直接启动。
ollama run deepseek-r1

image-20250211112437886

image-20250212114627774

1.3.3 下载Nomic-Embed-Text模型

通过Ollama官网下载nomic-embed-text)

ollama run deepseek-r1

image-20250211112941535

image-20250212161625989

1.3.5 安装AnythingLLM

AnythingLLM 是一个功能强大且灵活的开源平台,旨在帮助用户轻松构建和部署基于大型语言模型 (LLM) 的私有化应用程序。

下载安装Desktop版本(https://anythingllm.com/desktop)

image-20250212165425006

1.4 配置AnythingLLM

image-20250212165836018

image-20250212165848777

image-20250212165901116

1.5 上传文档

image-20250212170114547

1.6 测试结果

image-20250212170139857