Локальный RAG (Retrieval-Augmented Generation) и Агенты

В этих примерах использованы:

Ollama: Инструмент, который позволяет запускать большие языковые модели (LLM) с открытым исходным кодом локально.
llama3.2:3b-instruct-fp16: Модель Llama 3.2, настроенная только на текст, оптимизированы для использования в многоязычных диалогах, включая задачи агенского поиска и обобщения.
LangChain: Фреймворк, который предоставляет стандартный интерфейс для взаимодействия с LLM, источниками данных и другими компонентами.
LangGraph: Представляет собой фреймворк для оркестровки сложных агентных систем и является более низкоуровневым и управляемым, чем агенты LangChain.
Embeddings: Использована модель intfloat/multilingual-e5-large с HuggingFace.
Tavily: Поисковая систему для Web поиска, оптимизированная для LLM и RAG. Необходимо создать свой аккаунт на https://tavily.com/ Сформировать свое значение TAVILY_API_KEY и записать его в файл .env, см. пример в файле env_example.txt

Источники:

Статья "Local RAG agent with LLaMA3" https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_adaptive_rag_local/
Видео (English 31 минута) Reliable, fully local RAG agents with LLaMA3.2-3b https://www.youtube.com/watch?v=bq1Plo2RhYI

Приглашаю в Телеграм общаться по это теме: https://t.me/AiExp01

1. Установить Ollama

https://ollama.com/download/windows

см. подробнее в этой публикации: https://t.me/AiExp01/81

2. Установить модель Llama 3.2

Выполнить: ollama pull llama3.2:3b-instruct-fp16

Проверить наличие модели, выполнить: ollama list

3. Проверяем доступность локальной модели из кода

Запускать модуль Simple_Request_Local_Model.py

Ключевые моменты:

Модуль использует loguru для управления логированием, включая сохранение логов в файлы с ротацией и сжатием по мере роста файла.
Основная функция в модуле, get_model_response, получает тему запроса и возвращает ответ, сгенерированный языковой моделью.
Использует мини-промпт в формате, позволяющим задавать контекст и особенности ответа модели, что позволяет контролировать длину и форму ответа.
Программа импортирует и использует класс ChatOllama для работы с конкретной моделью LLM.

4. Простой RAG для pdf файлов

Поместить в папку Python\pdf один или несколько pdf фалов с текстовым слоем.

Запускать модуль Simple_RAG_PDF.py

Этот код импортирует необходимые модули, конфигурирует логирование, и инициализирует процесс обработки знаний через векторные поиски и языковую модель.

Основной функционал состоит из трех функций:

get_index_db() для работы с векторной Базой-Знаний,
get_message_content() для извлечения релевантных данных,
get_model_response() для формирования ответа от модели.

5. Локальный RAG с агентами на LLaMA3

Запускать модуль Local_RAG_Agent.py

Этот код содержит многие элементы связанные с обработкой естественного языка, от извлечения и обработки документов до оценки релевантности и генерирования ответов. Комментарии помогут понять предназначение каждого блока кода, а также увидеть, как взаимодействуют между собой различные компоненты модуля.

Используется объединение подходов в агентский RAG:

Маршрутизация: Адаптивный RAG. Направление вопросов к различным поисковым подходам
Возврат: Корректирующий RAG. Возврат к веб-поиску, если документы не соответствуют запросу
Самокоррекция: Самокоррекция: Самокоррекция RAG. Исправление ответов, содержащих галлюцинации или не отвечающих на вопрос

6. Как создать Базу Знаний без GPU

Используем GPU в colab-e, см. нотебук db_tool_01.ipynb:

7. Пользовательский интерфейс на streamlit

Этот пример для варианта Simple_RAG_PDF.py, см. модуль st.py

Запускать:

Активировать venv, выполнить: activate
Перейти в каталог Python: cd ../../Python
Выполнить: streamlit run st.py
Приложение открыть в Браузере: http://localhost:8501/

Видео см. здесь: https://youtu.be/ui_NvvMTKAc?si=T7XdoHrSKWcMsQwx

Обсуждение здесь: https://t.me/AiExp01/112

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
Colab		Colab
Python		Python
.gitignore		.gitignore
LICENSE		LICENSE
Local_RAG_Agent.png		Local_RAG_Agent.png
README.md		README.md
graph_image.png		graph_image.png
requirements.txt		requirements.txt
st.png		st.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Локальный RAG (Retrieval-Augmented Generation) и Агенты

Источники:

1. Установить Ollama

2. Установить модель Llama 3.2

3. Проверяем доступность локальной модели из кода

4. Простой RAG для pdf файлов

5. Локальный RAG с агентами на LLaMA3

6. Как создать Базу Знаний без GPU

7. Пользовательский интерфейс на streamlit

About

Releases

Packages

Languages

License

dxbat/Local_RAG_Agent_01

Folders and files

Latest commit

History

Repository files navigation

Локальный RAG (Retrieval-Augmented Generation) и Агенты

Источники:

1. Установить Ollama

2. Установить модель Llama 3.2

3. Проверяем доступность локальной модели из кода

4. Простой RAG для pdf файлов

5. Локальный RAG с агентами на LLaMA3

6. Как создать Базу Знаний без GPU

7. Пользовательский интерфейс на streamlit

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages