serving

Here are 114 public repositories matching this topic...

ray-project / ray

Ray is an AI compute engine. Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.

Updated Jan 27, 2025
Python

tensorflow / serving

Star

A flexible, high-performance serving system for machine learning models

python machine-learning deep-neural-networks deep-learning neural-network cpp tensorflow ml serving

Updated Jan 25, 2025
C++

vespa-engine / vespa

Star

AI + Data, online. https://vespa.ai

java search-engine machine-learning big-data ai server cpp tensorflow vespa serving serving-recommendation vector-search

Updated Jan 26, 2025
Java

SeldonIO / seldon-core

Star

An MLOps framework to package, deploy, monitor and manage thousands of production machine learning models

kubernetes machine-learning deployment serving aiops production-machine-learning mlops machine-learning-operations

Updated Jan 24, 2025
HTML

ahkarami / Deep-Learning-in-Production

Star

In this repository, I will share some useful notes and references about deploying deep learning-based models in production.

Updated Nov 9, 2024

pytorch / serve

Star

Serve, optimize and scale PyTorch models in production

docker kubernetes machine-learning cpu deep-learning metrics gpu optimization pytorch serving mlops

Updated Jan 1, 2025
Java

⚡️An Easy-to-use and Fast Deep Learning Model Deployment Toolkit for ☁️Cloud 📱Mobile and 📹Edge. Including Image, Video, Text and Audio 20+ main stream scenarios and 150+ SOTA models with end-to-end optimization, multi-platform and multi-framework support.

android intel rockchip object-detection jetson tensorrt serving onnx openvino onnxruntime graphcore yolov5 kunlun uie picodet stable-diffusion yolov8

Updated Jan 16, 2025
C++

Lightning-AI / LitServe

Star

Lightning-fast serving engine for any AI model of any size. Flexible. Easy. Enterprise-scale.

api web ai deep-learning rest-api artificial-intelligence developer-tools serving fastapi

Updated Jan 21, 2025
Python

georgia-tech-db / evadb

Star

Database system for AI-powered apps

agent database ai data-analysis eva object-detection labeling hacktoberfest video-analytics serving huggingface gpt-4 llm chatgpt langchain gpt4all auto-gpt

Updated May 17, 2024
Python

tobegit3hub / tensorflow_template_application

Star

TensorFlow template application for deep learning

machine-learning csv deep-learning tensorflow inference cnn lstm tensorboard mlp libsvm tfrecords wide-and-deep serving

Updated Jul 5, 2023
Python

ray-project / llm-applications

Star

A comprehensive guide to building RAG-based LLM applications for production.

machine-learning openai ray serving fine-tuning anyscale llms llama2

Updated Aug 2, 2024
Jupyter Notebook

Delta-ML / delta

Star

DELTA is a deep learning based natural language and speech processing platform. LF AI & DATA Projects: https://lfaidata.foundation/projects/delta/

Updated Apr 19, 2024
Python

dingodb / dingo

Star

A multi-modal vector database that supports upserts and vector queries using unified SQL (MySQL-Compatible) on structured and unstructured data, while meeting the requirements of high concurrency and ultra-low latency.