LLM
整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。
Course to get into Large Language Models (LLMs) with roadmaps and Colab notebooks.
Awesome Pretrained Chinese NLP Models,高质量中文预训练模型&大模型&多模态模型&大语言模型集合
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…
Pre-Training with Whole Word Masking for Chinese BERT(中文BERT-wwm系列模型)
[COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集
Open Source Pre-training Model Framework in PyTorch & Pre-trained Model Zoo
Collections of resources from Joint Laboratory of HIT and iFLYTEK Research (HFL)
TensorFlow code and pre-trained models for BERT
a collection of NLP projects&tools. 自然语言处理方向项目和工具集合。
A curated list of resources for Chinese NLP 中文自然语言处理相关资料
DISC-FinLLM,中文金融大语言模型(LLM),旨在为用户提供金融场景下专业、智能、全面的金融咨询服务。DISC-FinLLM, a Chinese financial large language model (LLM) designed to provide users with professional, intelligent, and comprehensive financ…