GitHub - preguntale-al-candidato/backend: Backend

Preguntale al Candidato - Backend

Usa inteligencia artificial basada en GPT-3.5-Turbo para hacerle pregunta a los candidatos presidenciales.

Herramientas utilizadas

Langchain / OpenAI
Milvus (vector store)
FastAPI

Se necesita python >=3.9. Para instalar las dependencias, crear un entorno virtual y ejecutar pip install -r requirements.txt

No olvidarse de crear un archivo .env en el directorio root y agregar el token de OpenAI en la variable de entorno OPENAI_API_KEY en la forma OPENAI_API_KEY=<token>

Embeddings

Se generaron embeddings de las transcripciones usando OpenAI y Milvus como base de datos de vectores.

Para correr Milvus localmente ver el repositorio db.

Semantic cache

Se ha implementado un semantic cache, vectorizando las preguntas y guardando los embeddings en una colleccion en Milvus. De esta forma, para preguntas con significado semantico similar, no se llamara al LLM y se usara la respuesta cacheada, mejorando los tiempos de respuesta y optimizando costos de llamadas a la API de OpenAI. Langchain actualmente no soporta semantic caching usando Milvus, por lo que en este proyecto hemos creado una nueva clase MilvusSemanticCache que implementa la interfas BaseCache de Langchain.

Langchain QA docs

Backend - FastAPI

How to run

Pasos para correr el servidor localmente:

Vea el repositorio preguntale-al-candidato/db para correr la base de datos Milvus.
Generar un entorno virtual

pip install virtualenv
virtualenv env

Activar el entorno virtual

source env/bin/activate  // En Unix (Linux y MacOS)
env/Scripts/activate.bat // En Windows (CMD)
env/Scripts/Activate.ps1 // En WIndows (Powershell)

Instalar las dependencias

pip install --upgrade pip
pip install --requirement requirements.txt

(Opcional) Ingesta de transcripciones.

Si la base de datos levantada en el paso 1 fue creada desde un backup en S3 OMITA este paso.

cd ingestion
mkdir -p processed_transcriptions
python save_embedings.py

Correr el servidor ejecutando:

uvicorn main:app --reload

Los endpoints de la api empiezan con /api/ y estarán disponibles en http://localhost:8000

Correr el frontend

Una vez que el backend esta listo, a partir del repositorio preguntale-al-candidato/frontend podrá correr el frontend y acceder a la interfaz gráfica.

Name		Name	Last commit message	Last commit date
Latest commit History 62 Commits
.github		.github
cache		cache
images		images
ingestion		ingestion
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
config.py		config.py
main.py		main.py
prompts.py		prompts.py
requirements.txt		requirements.txt
search.py		search.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Preguntale al Candidato - Backend

Embeddings

Semantic cache

Backend - FastAPI

How to run

About

Releases 24

Packages

Contributors 2

Languages

License

preguntale-al-candidato/backend

Folders and files

Latest commit

History

Repository files navigation

Preguntale al Candidato - Backend

Embeddings

Semantic cache

Backend - FastAPI

How to run

About

Resources

License

Stars

Watchers

Forks

Releases 24

Packages 0

Contributors 2

Languages

Packages