GitHub - zhuqingyun0510/Langchain-Chatchat: Langchain-Chatchat（原Langchain-ChatGLM）基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM) QA app with langchain

📃 LangChain-Chatchat (原 Langchain-ChatGLM)

基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，开源、可离线部署的检索增强生成(RAG)大模型知识库项目。

介绍

🤖️ 一种利用 langchain 思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

💡 受 GanymedeNil 的项目 document.ai 和 AlexZhangji 创建的 ChatGLM-6B Pull Request 启发，建立了全流程可使用开源模型实现的本地知识库问答应用。本项目的最新版本中通过使用 FastChat 接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型，依托于 langchain 框架支持通过基于 FastAPI 提供的 API 调用服务，或使用基于 Streamlit 的 WebUI 进行操作。

✅ 依托于本项目支持的开源 LLM 与 Embedding 模型，本项目可实现全部使用开源模型离线私有部署。与此同时，本项目也支持 OpenAI GPT API 的调用，并将在后续持续扩充对各类模型及模型 API 的接入。

⛓️ 本项目实现原理如下图所示，过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 top k个 -> 匹配出的文本作为上下文和问题一起添加到 prompt中 -> 提交给 LLM生成回答。

📺 原理介绍视频

从文档处理角度来看，实现流程如下：

🚩 本项目未涉及微调、训练过程，但可利用微调或训练对本项目效果进行优化。

🌐 AutoDL 镜像中 v13 版本所使用代码已更新至本项目 v0.2.9 版本。

🐳 Docker 镜像已经更新到 0.2.7 版本。

🌲 一行命令运行 Docker ：

docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7

🧩 本项目有一个非常完整的Wiki ， README只是一个简单的介绍，仅仅是入门教程，能够基础运行。如果你想要更深入的了解本项目，或者想对本项目做出贡献。请移步 Wiki 界面

解决的痛点

该项目是一个可以实现 __完全本地化__推理的知识库增强方案, 重点解决数据安全保护，私域化部署的企业痛点。本开源方案采用Apache License，可以免费商用，无需付费。

我们支持市面上主流的本地大语言模型和Embedding模型，支持开源的本地向量数据库。支持列表详见Wiki

快速上手

1. 环境配置

首先，确保你的机器安装了 Python 3.8 - 3.11

$ python --version
Python 3.11.7

接着，创建一个虚拟环境，并在虚拟环境内安装项目的依赖

# 拉取仓库
$ git clone https://github.com/chatchat-space/Langchain-Chatchat.git

# 进入目录
$ cd Langchain-Chatchat

# 安装全部依赖
$ pip install -r requirements.txt 
$ pip install -r requirements_api.txt
$ pip install -r requirements_webui.txt  

# 默认依赖包括基本运行环境（FAISS向量库）。如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。

请注意，LangChain-Chatchat 0.2.x 系列是针对 Langchain 0.0.x 系列版本的，如果你使用的是 Langchain 0.1.x 系列版本，需要降级。

2，模型下载

如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Embedding 模型可以从 HuggingFace 下载。

以本项目中默认使用的 LLM 模型 THUDM/ChatGLM3-6B 与 Embedding 模型 BAAI/bge-large-zh 为例：

下载模型需要先安装 Git LFS，然后运行

$ git lfs install
$ git clone https://huggingface.co/THUDM/chatglm3-6b
$ git clone https://huggingface.co/BAAI/bge-large-zh

3. 初始化知识库和配置文件

按照下列方式初始化自己的知识库和简单的复制配置文件

$ python copy_config_example.py
$ python init_database.py --recreate-vs

4. 一键启动

按照以下命令启动项目

$ python startup.py -a

5. 启动界面示例

如果正常启动，你将能看到以下界面

FastAPI Docs 界面

Web UI 启动界面示例：

Web UI 对话界面：

Web UI 知识库管理页面：

注意

以上方式只是为了快速上手，如果需要更多的功能和自定义启动方式，请参考Wiki

项目里程碑

联系我们

Telegram

项目交流群

🎉 Langchain-Chatchat 项目微信交流群，如果你也对本项目感兴趣，欢迎加入群聊参与讨论交流。

公众号

🎉 Langchain-Chatchat 项目官方公众号，欢迎扫码关注。

Name	Name	Last commit message	Last commit date
Latest commit hzg0601 Merge pull request chatchat-space#2640 from chatchat-space/hzg0601-pa… Jan 12, 2024 3e959e5 · Jan 12, 2024 History 1,685 Commits
.github	.github	Update close-issue.yml：提示改成中文，改到凌晨05:30运行 (chatchat-space#1456 )	Sep 13, 2023
chains	chains	支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (chatchat-space#2002 )	Nov 9, 2023
common	common	search_engine_chat bug	Aug 24, 2023
configs	configs	修复milvus_kwargs问题	Jan 3, 2024
docs	docs	增加ElasticSearch支持	Nov 10, 2023
document_loaders	document_loaders	ocr 支持 GPU 加速（需要手动安装 rapidocr_paddle[gpu])；知识库支持 MHTML 和 Evernote 文件。 (…	Dec 4, 2023
embeddings	embeddings	Dev (chatchat-space#1895 )	Oct 27, 2023
img	img	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
knowledge_base/samples/content	knowledge_base/samples/content	fix typos	Dec 31, 2023
nltk_data	nltk_data	add nltk_data	Apr 16, 2023
server	server	Update milvus_kb_service.py	Jan 12, 2024
tests	tests	删除重复的引入和纠正拼写错误 (chatchat-space#2599 )	Jan 11, 2024
text_splitter	text_splitter	update requirements.txt, requirements_api.txt, test_different_splitte…	Sep 14, 2023
webui_pages	webui_pages	fix: 过滤 sse_starlette 返回的 ping 包，避免 `JSON Decoder error : ping -...` (c…	Jan 9, 2024
.gitignore	.gitignore	增加ElasticSearch支持	Nov 10, 2023
.gitmodules	.gitmodules	支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (chatchat-space#2002 )	Nov 9, 2023
LICENSE	LICENSE	Create LICENSE	Apr 7, 2023
README.md	README.md	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
README_en.md	README_en.md	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
copy_config_example.py	copy_config_example.py	reformat copy_config_example.py	Nov 5, 2023
init_database.py	init_database.py	删除重复的引入和纠正拼写错误 (chatchat-space#2599 )	Jan 11, 2024
release.py	release.py	Add release.py	Apr 15, 2023
requirements.txt	requirements.txt	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
requirements_api.txt	requirements_api.txt	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
requirements_lite.txt	requirements_lite.txt	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
requirements_webui.txt	requirements_webui.txt	0.2.x稳定依赖更新 (chatchat-space#2627 )	Jan 11, 2024
shutdown_all.sh	shutdown_all.sh	update readme.md, shutdown_all.sh: 在Linux上使用ctrl+C退出可能会由于linux的多进程机制导…	Aug 25, 2023
startup.py	startup.py	解决faiss相似度阈值不在0-1之间的问题	Dec 6, 2023
webui.py	webui.py	支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (chatchat-space#1924 )	Oct 31, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

目录

介绍

解决的痛点

快速上手

1. 环境配置

2，模型下载

3. 初始化知识库和配置文件

4. 一键启动

5. 启动界面示例

注意

项目里程碑

联系我们

Telegram

项目交流群

公众号

About

Releases

Packages

Languages

License

zhuqingyun0510/Langchain-Chatchat

Folders and files

Latest commit

History

Repository files navigation

目录

介绍

解决的痛点

快速上手

1. 环境配置

2， 模型下载

3. 初始化知识库和配置文件

4. 一键启动

5. 启动界面示例

注意

项目里程碑

联系我们

Telegram

项目交流群

公众号

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

2，模型下载

Packages