Skip to content
View tianyabanbu's full-sized avatar

Block or report tianyabanbu

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Showing results

RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding.

Python 28,507 2,715 Updated Jan 17, 2025

A collection of LLM papers, blogs, and projects, with a focus on OpenAI o1 🍓 and reasoning techniques.

6,248 344 Updated Jan 14, 2025

大模型基础: 一文了解大模型基础知识

3,506 316 Updated Dec 25, 2024

Distribute and run LLMs with a single file.

C++ 21,262 1,093 Updated Jan 5, 2025

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python 38,311 4,708 Updated Jan 17, 2025

An efficient, flexible and full-featured toolkit for fine-tuning LLM (InternLM2, Llama3, Phi3, Qwen, Mistral, ...)

Python 4,161 326 Updated Jan 14, 2025

ChatLaw:A Powerful LLM Tailored for Chinese Legal. 中文法律大模型

7,071 552 Updated Jan 4, 2025

搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。

Jupyter Notebook 64 16 Updated Jun 24, 2019

🎉 Repo for LaWGPT, Chinese-Llama tuned with Chinese Legal knowledge. 基于中文法律知识的大语言模型

Python 5,888 542 Updated Jun 11, 2024

中文法律LLaMA (LLaMA for Chinese legel domain)

Python 882 120 Updated Aug 28, 2024

整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

17,508 1,681 Updated Sep 19, 2024

✨✨Latest Advances on Multimodal Large Language Models

13,555 863 Updated Jan 13, 2025

中文大模型能力评测榜单:目前已囊括139个大模型,覆盖chatgpt、gpt-4o、谷歌gemini、Claude3.5、百度文心一言、千问、百川、讯飞星火、商汤senseChat、minimax等商用模型, 以及deepseek-v3、qwen2.5、llama3.1、glm4、书生internLM2.5等开源大模型。不仅提供能力评分排行榜,也提供所有模型的原始输出结果!

3,306 148 Updated Jan 17, 2025

主要是我是日常看过的不错的文章的资源汇总,方便自己也分享给大家。有些我看过的,就会做简单的解读,没看过的,就先罗列一下,然后之后看了把解读更新上;涉及到搜索/推荐/自然语言处理。

1,746 329 Updated Jun 3, 2021

该仓库主要记录 大模型(LLMs) 算法工程师相关的面试题

1,627 113 Updated Dec 26, 2024

主要记录大语言大模型(LLMs) 算法(应用)工程师相关的知识及面试题

HTML 4,755 551 Updated Oct 22, 2024

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程

Jupyter Notebook 11,485 1,305 Updated Jan 16, 2025

An open platform for training, serving, and evaluating large language models. Release repo for Vicuna and Chatbot Arena.

Python 37,503 4,590 Updated Jan 14, 2025

MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。

1 Updated Apr 26, 2023

A visual no-code/code-free web crawler/spider易采集:一个可视化爬虫软件,可以无代码图形化的设计和执行爬虫任务

JavaScript 1 Updated Jun 12, 2023

🏅 Collection of Kaggle Solutions and Ideas 🏅

HTML 1 Updated Jul 6, 2023

总结Prompt&LLM论文,开源数据&模型,AIGC应用

1 Updated Jul 9, 2023

🧑‍🏫 60 Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), gan…

Jupyter Notebook 1 Updated Jul 16, 2023

This repository collects some codes that encapsulates commonly used algorithms in the field of machine learning. Most of them are based on Numpy, Pandas or Torch. You can deepen your understanding …

Shell 443 112 Updated Aug 25, 2024

🧑‍🏫 60+ Implementations/tutorials of deep learning papers with side-by-side notes 📝; including transformers (original, xl, switch, feedback, vit, ...), optimizers (adam, adabelief, sophia, ...), ga…

Python 57,931 5,911 Updated Aug 24, 2024

总结Prompt&LLM论文,开源数据&模型,AIGC应用

2,799 283 Updated Jan 16, 2025

一本系统地教你将深度学习模型的性能最大化的战术手册。

2,698 244 Updated May 27, 2023

A visual no-code/code-free web crawler/spider易采集:一个可视化浏览器自动化测试/数据采集/爬虫软件,可以无代码图形化的设计和执行爬虫任务。别名:ServiceWrapper面向Web应用的智能化服务封装系统。

JavaScript 37,021 4,543 Updated Jan 8, 2025

MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。

3,643 253 Updated Jan 13, 2025

🏅 Collection of Kaggle Solutions and Ideas 🏅

HTML 5,054 1,893 Updated Jan 7, 2025
Next