🧑‍🏫 60+ Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), ga…

Python 58,348 5,941 Updated Aug 24, 2024

pickxiguapi / Clean-Offline-RLHF

Offline RLHF codebase implementation for "Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement Learning with Diverse Human Feedback" (ICLR2024)

Python 33 2 Updated Mar 26, 2024

opendilab / awesome-RLHF

A curated list of reinforcement learning with human feedback resources (continually updated)

3,654 224 Updated Jan 27, 2025

STMicroelectronics / stm32ai-tao

Nvidia TAO (Train, Adapt, Optimize) with STM32Cube.AI Developer Cloud

Jupyter Notebook 37 8 Updated Dec 17, 2024

lweitkamp / GANs-JAX

Implementation of several Generative Adversarial Networks in JAX / Flax

Jupyter Notebook 33 5 Updated Apr 29, 2022

vwxyzjn / cleanrl

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

Python 6,172 692 Updated Jan 28, 2025

aangelopoulos / conformal-prediction

Lightweight, useful implementation of conformal prediction on real data.

Jupyter Notebook 827 91 Updated Mar 24, 2024

keaukraine / webgl-voxel-airplanes

Voxel Airplanes WebGL 3D demo

TypeScript 13 1 Updated Apr 11, 2023

nmfsc / python

Jupyter Notebook 2 Updated Aug 11, 2023

karpathy / nanoGPT

The simplest, fastest repository for training/finetuning medium-sized GPTs.

Python 38,980 6,338 Updated Dec 9, 2024

ckormanyos / real-time-cpp

Source code for the book Real-Time C++, by Christopher Kormanyos

C++ 633 166 Updated Jan 31, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Michael Anthony BluedragonXVI

Block or report BluedragonXVI

Stars

sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python

deepseek-ai / Janus

VisDrone / VisDrone-Dataset

Jiayi-Pan / TinyZero

monemati / multiuav-gazebo-simulation

mvernacc / gazebo_motor_model_docs

osrf / vehicle_gateway

julioasotodv / ie-c4-466671-diffusion-models

oobabooga / text-generation-webui

dmicz / minViT

karpathy / micrograd

tinygrad / tinygrad

kry0sc0pic / crazyflie-leader-follower

OPT4SMART / crazychoir

rl-tools / rl-tools

bitcraze / crazyflie-firmware

bitcraze / crazyflie-lib-python

arplaboratory / learning-to-fly

eric-mitchell / direct-preference-optimization

labmlai / annotated_deep_learning_paper_implementations