Skip to content
View lemon-little's full-sized avatar

Block or report lemon-little

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Stars

THUResearch-ZJ

26 repositories

MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO、GRPO。

Python 3,621 533 Updated Feb 26, 2025

20+ high-performance LLMs with recipes to pretrain, finetune and deploy at scale.

Python 11,665 1,178 Updated Feb 25, 2025

Easy, fast, and cheap pretrain,finetune, serving for everyone

Python 283 42 Updated Feb 26, 2025

Deepspeed、LLM、Medical_Dialogue、医疗大模型、预训练、微调

Python 254 36 Updated Jun 7, 2024

从0到1构建一个MiniLLM (pretrain+sft+dpo实践中)

Python 378 47 Updated Aug 29, 2024

使用deepspeed从头开始训练一个LLM,经过pretrain和sft阶段,验证llm学习知识、理解语言、回答问题的能力

Python 143 16 Updated Jul 13, 2024

Awesome Pretrained Chinese NLP Models,高质量中文预训练模型&大模型&多模态模型&大语言模型集合

Python 5,119 489 Updated Feb 26, 2025

Code implementation of synthetic continued pretraining

Jupyter Notebook 90 6 Updated Jan 6, 2025

雅意大模型:为客户打造安全可靠的专属大模型,基于大规模中英文多领域指令数据训练的 LlaMA 2 & BLOOM 系列模型,由中科闻歌算法团队研发。(Repo for YaYi Chinese LLMs based on LlaMA2 & BLOOM)

Python 3,265 43 Updated Jan 17, 2024

明医 (MING):中文医疗问诊大模型

Python 934 115 Updated Oct 24, 2024

🌿孙思邈中文医疗大模型(Sunsimiao):提供安全、可靠、普惠的中文医疗大模型

Python 427 24 Updated Sep 13, 2024

🌞 CareGPT (关怀GPT)是一个医疗大语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型,包含LLM的训练、测评、部署等以促进医疗LLM快速发展。Medical LLM, Open Source Driven for a Healthy Future.

Python 843 114 Updated May 9, 2024

QiZhenGPT: An Open Source Chinese Medical Large Language Model|一个开源的中文医疗大语言模型

Python 689 78 Updated Aug 9, 2024

WiNGPT是一个基于GPT的医疗垂直领域大模型,旨在将专业的医学知识、医疗信息、数据融会贯通,为医疗行业提供智能化的医疗问答、诊断支持和医学知识等信息服务,提高诊疗效率和医疗服务质量。

Python 371 20 Updated Nov 28, 2024

llm-medical-data:用于大模型微调训练的医疗数据集

Python 92 13 Updated May 22, 2023

本项目设计了一个基于 RAG 与大模型技术的医疗问答系统,利用 DiseaseKG 数据集与 Neo4j 构 建知识图谱,结合 BERT 的命名实体识别和 34b 大模型的意图识别,通过精确的知识检索和问答生成, 提升系统在医疗咨询中的性能,解决大模型在医疗领域应用的可靠性问题。

Jupyter Notebook 453 65 Updated May 21, 2024

CCKS2019中文命名实体识别任务。从医疗文本中识别疾病和诊断、解剖部位、影像检查、实验室检验、手术和药物6种命名实体。现已实现基于jieba和AC自动机的baseline构建、基于BiLSTM和CRF的序列标住模型构建。bert的部分代码主要源于https://github.com/charles9n/bert-sklearn.git 感谢作者。 模型最终测试集得分0.81,还有较大改进…

Python 350 76 Updated Oct 9, 2022

基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】

Python 30 3 Updated Jul 10, 2024

Firefly中文LLaMA-2大模型,支持增量预训练Baichuan2、Llama2、Llama、Falcon、Qwen、Baichuan、InternLM、Bloom等大模型

Python 406 32 Updated Oct 21, 2023

Use PEFT or Full-parameter to finetune 450+ LLMs (Qwen2.5, InternLM3, GLM4, Llama3.3, Mistral, Yi1.5, Baichuan2, DeepSeek-R1, ...) and 150+ MLLMs (Qwen2.5-VL, Qwen2-Audio, Llama3.2-Vision, Llava, I…

Python 5,847 499 Updated Feb 26, 2025

基于ChatGLM-6B的中文问诊模型

Python 801 84 Updated Oct 19, 2023

收集和梳理垂直领域的开源模型、数据集及评测基准。

2,379 188 Updated Dec 26, 2023

Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

Jupyter Notebook 40,851 5,482 Updated Feb 26, 2025

整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

18,508 1,780 Updated Sep 19, 2024

Prompt越狱手册

1,295 131 Updated Dec 17, 2024