Skip to content

Latest commit

 

History

History
332 lines (298 loc) · 33.2 KB

README.md

File metadata and controls

332 lines (298 loc) · 33.2 KB

中国大模型列表 Awesome LLMs In China

中国大模型大全,全面收集有明确来源的大模型情况,包括机构、来源信息和分类等,随时更新。

旨在记录中国大模型发展情况,欢迎在Issues中提供提供线索素材

使用数据请注明来源:微信公众号:走向未来仓库:https://github.com/wgwang/awesome-LLMs-In-China

Awesome family related to LLMS includes:

大模型相关的Awesome系列包括:

微信扫码关注我的微信公众号:走向未来,分享有关大模型、AGI、知识图谱、深度学习、强化学习、计算机视觉、自然语言处理等等与人工智能有关的内容。

Star一下,举手之劳!

大模型列表

序号 公司 大模型 省市 类别 官网 说明
1 百度 文心一言 北京 通用 有APP
2 智谱华章 清言 北京 通用 有APP,开源模型ChatGLM3-6B, ChatGLM-6BChatGLM2-6B
3 百川智能 百川 北京 通用 开源小模型baichuan-7BBaichuan-13Bbaichuan-2
4 阿里云 通义千问 浙江杭州 通用 开源模型Qwen-1.8B,7B,14B,72BQwen-VLQwen-Audio
5 上海人工智能实验室 书生 上海 通用 开源模型书生·浦语-7B,20B
6 达观数据 曹植 上海 工业 试用需账号
7 深度求索 Deepseek Coder 浙江杭州 代码
8 科大讯飞 星火 安徽合肥 通用 有APP
9 春田知韵(抖音) 豆包 北京 通用 开源多模态7B模型BuboGPT,豆包是云雀的聊天机器人
10 中国科学院自动化研究所 紫东·太初 北京 通用 紫东太初2.0号称100B参数,全模态
11 商汤科技 商量 上海 通用
12 华为 盘古,盘古气象,盘古-Σ 广东深圳 工业 华为+鹏城,华为云盘古
13 复旦大学 MOSS 上海 科研 试用需账号
14 智源人工智能研究院 悟道·天鹰,悟道·EMU 北京 通用 悟道3.0,视界视觉,AQUILA天鹰座,Aquila-7B,AquilaChat-7B,AquilaCode-7B-NV,AquilaCode-7B-TS,HuggingFace,EMU基于LLaMA
15 浙江大学&OpenKG KnowLM 浙江杭州 通用 基于LLaMA和LLaMA2的知识增强的开源语言大模型
16 面壁智能 CPM,CPM-Bee 北京 通用 面壁智能,CPM-Bee-10B,OpenBMB
17 元象科技 XVERSE-7B, XVERSE-13B, XVERSE-65B 广东深圳 通用
18 腾讯 混元 广东深圳 通用
19 云知声 山海 北京 医学
20 东北大学 TechGPT-2.0, TechGPT 辽宁沈阳 科研 TechGPT->BELLE->LLaMA,图谱构建和阅读理解问答
21 IDEA研究院 封神榜MindBot,ziya-coding 广东深圳 通用 姜子牙系列模型 ,ziya-coding代码大模型
22 零一万物 Yi 北京 通用 6B和34B开源模型
23 360 智脑,一见 北京 通用
24 VIVO BlueLM 广东东莞 通用 开源7B模型
25 浪潮信息 源2.0 山东济南 通用 源1.0,源2.0包含2B,51B和102B的开源大模型
26 北京大学信息工程学院 ChatLaw 北京 法律 ChatLaw-13B基于Ziya-LLaMA-13B-v1->LLaMA,ChatLaw-33B基于Anima33B->Guanaco->LLaMA
27 中国科学院计算技术研究所 百聆 北京 科研 基于 LLaMA,权重Diff下载7B13B,demo
28 好未来 MathGPT 北京 教育 学而思
29 晓多科技+国家超算成都中心 晓模型XPT 四川成都 客服 试用申请
30 昆仑万维 天工Skywork 北京 通用 开源且可商用,无需单独申请,Skywork是由昆仑万维集团·天工团队开发的一系列大型模型,本次开源的模型有Skywork-13B-Base模型、Skywork-13B-Chat模型、Skywork-13B-Math模型和Skywork-13B-MM模型
31 中国科学院成都计算机应用研究所 聚宝盆 四川成都 金融 基于LLaMA的金融大模型
32 华南理工大学未来技术学院 灵心 广东广州 医学 心理健康大模型灵心SoulChat
33 虎博科技 TigerBot 上海 金融 基于BLOOM
34 度小满 轩辕 北京 金融 基于BLOOM
35 北京交通大学 致远 北京 交通运输 TransGPT・致远,基于LLaMA-7B
36 恒生电子 LightGPT 浙江杭州 金融 与浙大合作的NL2SQL
37 哈尔滨工业大学 本草 黑龙江哈尔滨 医疗 本草基于LLaMA;另有基于 ChatGLM 的Med-ChatGLM
38 左手医生 左医GPT 北京 医学 医疗,试用需Key
39 上海科技大学 DoctorGLM 上海 医学 医学大模型,论文
40 华东师范大学 EduChat 上海 教育 基于Baichuan-13B的教学教育大模型
41 艾写科技 Anima 浙江杭州 营销 基于Guanaco->基于LLaMA,使用QLoRA
42 澳门理工大学 XrayGLM,IvyGPT 澳门 医疗 IvyGPT基于ChatGLM2,XrayGLM基于VisualGLM-6B
43 北京语言大学 桃李 北京 教育 基于LLaMA,北语+清华+东北、北京交大
44 贝壳 BELLE 北京 垂直 基于BLOOMZ或LLaMA的多个模型
45 稀宇科技 ABAB 上海 通用 GLOW虚拟社交,MiniMax,备案名是应事
46 北京大学信息工程学院 Chat-UniVi 北京 科研 基于Vicuna(7B,13B)->Llama-2
47 港中文深圳 华佗凤凰 广东深圳 医学 香港中文大学(深圳)和深圳市大数据研究院,医学,Demo,华佗和凤凰都基于BLOOMZ
48 香港科技大学 罗宾Robin 香港 科研 基于LLaMA,港科大开源LMFlow
49 网易有道 子曰 北京 教育 推荐有道速读,读论文的利器
50 智媒开源研究院 智媒 广东深圳 媒体 基于LLaMA,面向自媒体
51 元语智能 ChatYuan 浙江杭州 通用
52 蚂蚁集团 贞仪 浙江杭州 金融
53 硅基智能 炎帝 江苏南京 文旅
54 西湖心辰 西湖 浙江杭州 科研
55 国家超级计算天津中心 天河天元 天津 通用
56 星环科技 无涯、求索 上海 金融 无涯——金融;求索——大数据分析
57 清博智能 先问 北京 农业 基于结构化数据
58 智子引擎 元乘象 江苏南京 客服
59 拓世科技 拓世 江西南昌 金融
60 中科闻歌 雅意2.0 北京 通用 雅意2.0:参数30B,240TB多源基础数据,2.65T词元, 雅意基于 LLaMA-2-7B
61 上海交通大学 白玉兰 上海 科学 Demo,GeoLLaMA,基于LLaMAHuggingFace
62 第四范式 式说 北京 客服
63 拓尔思 拓天 北京 媒体 TRSGPT
64 出门问问 序列猴子 北京 营销
65 数说故事 SocialGPT 广东广州 社交
66 云从科技 从容 广东广州 政务
67 创业黑马 天启 北京 创投 创业黑马与360合作,科创服务行业
68 哈尔滨工业大学 活字 黑龙江哈尔滨 通用 基于BLOOM-7B进行 SFT(1.0)和RLHF(2.0)的模型,RLHF数据集
69 北京大学知识计算实验室 CodeShell 北京 代码 CodeShell是北京大学知识计算实验室联合四川天府银行AI团队研发的多语言代码大模型基座
70 浙江大学 启真 浙江杭州 医学 QiZhen-CaMA-13B基于KnowLM,QiZhen-ChatGLM-6B,QiZhen-Chinese-LLaMA-7B,数据集1数据集2
71 浙江大学 TableGPT 浙江杭州 科研 无代码没公开模型权重
72 浙江大学 智海-录问 浙江杭州 司法 基于Baichuan-7B的智海-录问(wisdomInterrogatory)是由浙江大学、阿里巴巴达摩院以及华院计算三家单位共同设计研发的法律大模型
73 浙江大学 智海-三乐 浙江杭州 教育 基于Qwen-7B的智海-三乐是由浙江大学与高等教育出版社联合阿里云计算有限公司、华院计算等单位共同设计研发的教育大模型
74 文因互联 文因 安徽合肥 金融 金融大模型
75 深思考人工智能 Dongni 北京 媒体
76 医疗算网 Uni-talk 上海 医学 上海联通+华山医院+上海超算中心+华为
77 澜舟科技 孟子 北京 金融
78 中山大学 流萤系列 广东广州 通用 微调了多个模型,如firefly-mixtral-8x7b、firefly-baichuan2-13b、Firefly-LLaMA2-Chinese等
79 香港中文大学 PointLLM 香港 通用 港中文+上海AI实验室+浙大
80 清华大学 NowcastNet 北京 科研 气象,临近预报大模型
81 鹏城实验室 鹏城·脑海 广东深圳 科研 Peng Cheng Mind
82 清华大学 LexiLaw 北京 司法 基于ChatGLM-6B微调
83 智臻智能 华藏 上海 客服 小i机器人
84 南京农业大学 荀子 江苏南京 文旅 中国古代典籍跨语言知识库构建及应用研究,基于QWen-7B,开源
85 山东大学 夫子•明察 山东济南 司法 山东大学+浪潮云+中国政法大学,基于ChatGLM,无监督司法语料(各类判决文书、法律法规等)与有监督司法微调数据(包括法律问答、类案检索)训练而成
86 数慧时空 长城 北京 地球科学 自然资源,遥感
87 台智云 福尔摩斯FFM 台湾 工业 华硕子公司
88 知乎 知海图 北京 媒体 知乎和面壁科技合作
89 网易伏羲 玉言 广东广州 通用
90 清睿智能 ArynGPT 江苏苏州 教育
91 微盟 WAI 上海 商业
92 大连理工大学信息检索研究室 太令 辽宁大连 司法 基于Qwen-7B
93 奇点智源 天工智力 北京 通用 瑶光和天枢
94 京东 言犀 北京 商业
95 云起无垠 SecGPT 北京 信息安全 基于的Baichuan-13B网络安全大模型,数据集
96 思必驰 DFM-2 江苏苏州 工业
97 中国科学院计算机网络信息中心 MatChat 北京 材料 基于LLaMA,论文MatChat: A Large Language Model and Application Service Platform for Materials Science
98 北京交通大学计算机与信息技术学院 TCMLLM 北京 医疗 基于ChatGLM-6B微调的中医药大模型
99 蚂蚁集团 TestGPT-7B 浙江杭州 运维 基于CodeLlama-7B测试域大模型,多语言测试用例生成、测试用例Assert补全
100 华南理工大学未来技术学院 扁鹊 广东广州 医疗 扁鹊-1.0(BianQue-1.0)基于ChatYuan-large-v2,扁鹊-2.0(BianQue-2.0)基于ChatGLM-6B
101 麒麟合盛 天燕AiLMe 北京 运维
102 智象未来 智象 北京 科研 视觉多模态生成式大模型
103 乐言科技 乐言 上海 客服
104 沪渝人工智能研究院 兆言 重庆 科研 也称:上海交通大学重庆人工智能研究院
105 中央广播电视总台 央视听 北京 媒体 央视听媒体大模型CMG Media GPT
106 超对称技术公司 乾元 北京 金融
107 蜜度 文修 上海 媒体 智能校对
108 中国电子云 星智 湖北武汉 政务 政务大模型
109 浙江大学 PromptProtein 浙江杭州 科研
110 东北大学数据挖掘实验室 PICA 辽宁沈阳 医疗 基于ChatGLM2-6B的情感大模型
111 携程 问道 上海 文旅 旅游行业大模型
112 实在智能 塔斯 浙江杭州 客服 TARS
113 瑞泊 VIDYA 北京 工业
114 有连云 麒麟 上海 金融
115 维智科技 CityGPT 上海 公共服务 城市大模型
116 用友 YonGPT 北京 企业服务
117 天云数据 Elpis 北京 金融 证券法律法规
118 孩子王 KidsGPT 江苏南京 教育
119 佳都科技 佳都知行 广东广州 交通运输 交通领域
120 今立方 12333 福建厦门 政务 人社领域
121 阳光保险集团 正言 广东深圳 金融
122 中科创达 魔方Rubik 北京 工业
123 聆心智能 CharacterGLM 北京 游戏
124 大经中医 岐黄问道 江苏南京 医疗
125 蒙牛 MENGNIU.GPT 内蒙古呼和浩特 食品
126 快商通 汉朝 福建厦门 营销
127 众合科技 UniChat 浙江杭州 交通运输
128 金蝶 苍穹 广东深圳 企业服务
129 华东理工大学X-D Lab 漫谈 上海 医疗 MindChat(漫谈): 心理大模型,基于QWen-7B
130 华东理工大学X-D Lab 孙思邈 上海 医疗 基于baichuan-7B
131 小米 MiLM-6B 北京 商业
132 长虹 长虹超脑,云帆 四川绵阳 媒体
133 开普云 开悟 广东东莞 政务
134 赛灵力科技 达尔文 广东广州 医学 赛灵力,清华珠三角研究院,赛业生物,大湾区科技创新服务中心
135 航旅纵横 千穰大模型 北京 民航 航旅纵横APP上需要PLUS会员才能使用
136 奇安信 Q-GPT 北京 信息安全
137 车之谷 叆谷 山东青岛 汽车 汽车后服务加油站场景
138 索贝时代 明眸 四川成都 媒体
139 华东师范大学心理健康与危机干预重点实验室 EmoGPT 上海 医疗 EmoGPT是上海市心理健康与危机干预重点实验室与镜象科技公司合作完成
140 南方科技大学 SUS-Chat-34B 广东广州 通用 基于Yi-34B,使用1.4B token的高质量复杂指令数据微调
141 复旦DISC DISC-FinLLM 上海 金融 基于Baichuan-13B-Chat
142 蚂蚁集团 DevOps-Model 浙江杭州 运维 基于Qwen的中文开发运维大模型(7B,14B)
143 中国科学技术大学 ChiMed-GPT 安徽合肥 医疗 基于 Ziya-v2 的中文医疗大型语言模型
144 创业邦 BangChat 北京 创投 产业、企业和投资行业
145 新华三H3C 百业灵犀 浙江杭州 工业
146 作业帮 银河 广东广州 教育 极目未来
147 企查查 知彼阿尔法 江苏苏州 商业
148 绿盟 风云卫 北京 网络安全 NSFGPT
149 江苏欧软 WISE 江苏苏州 工业 WISE工业大模型
150 创新奇智 奇智孔明 山东青岛 工业 工业大模型AInno-15B,ChatRobot,ChatBI,ChatDoc
151 大汉软件 星汉 江苏南京 政务 “星汉”Galaxy大模型
152 零点有数 零点楷模 北京 政务
153 国农生猪大数据中心 PIGGPT 重庆 农业
154 微脉 CareGPT 浙江杭州 医疗
155 吉大正元 昆仑 吉林长春 信息安全
156 武汉大学 CheeseChat 湖北武汉 教育 内测招募,仅限武汉大学在校师生申请
157 方正电子 魔方 北京 媒体 聚焦媒体市场需求
158 似然实验室 TraderGPT 广东广州 金融 金融持仓分析大模型
159 网易智企 商河 广东广州 客服 客服领域行业大模型
160 深圳供电局 祝融2.0 广东深圳 电力 电力行业首个多模态预训练大模型
161 万兴科技 天幕 西藏拉萨 媒体 以视频创意应用为核心
162 惟远智能 千机百智 广东深圳 客服
163 兔展智能 兔灵 广东深圳 营销
164 中国科学技术大学 UniDoc 安徽合肥 通用 中科大&字节,统一的文字-图像理解大模型
165 钢谷网 谷蚁 陕西西安 电商 钢铁行业电商
166 浪潮海岳 inGPT 山东济南 企业服务 ​✘
167 木卫四科技 蝴蝶 北京 汽车
168 汇通达网络 汇通达 江苏南京 企业服务 下沉市场零售行业企业客户的交易和服务的互联网平台,农村电商服务
169 九章云极 元识 北京 企业服务 基于生成式AI能力打造各行业企业级应用
170 汉王 天地 北京 法律
171 南京审计大学 审元 江苏南京 审计
172 天翼云 慧泽 北京 政务 “慧泽”依托国云智算底座、在贵阳市人民政府政务场景和数据支持下推出的首个天翼云行业大模型
173 北京大学行为与空间智能实验室 PlanGPT 北京 城市规划
174 吉林大学 棱镜 吉林长春 通用
175 慧安股份 蜂巢知元 北京 工业
176 VIVO 蓝心 广东东莞 消费电子
177 元年科技 方舟GPT 北京 企业服务
178 电科数字 智弈 上海 水利
179 云天励飞 天书 广东深圳 政务
180 北京理工大学东南信息技术研究院 明德 福建莆田 通用 MindLLM
181 恩博科技 林海思绪 江苏南京 林业 南京恩博科技、中国林业科学研究院资源信息研究所、东北林业大学、南京林业大学联合发布了“多模态、行业级应用增强大模型——林海思绪大模型1.0
182 亿嘉和 YJH-LM 江苏南京 消费电子 YJH-LM技术已在商用清洁机器人上完成功能测试
183 大华股份 星汉 浙江杭州 城市治理 以视觉为核心,融合多模态能力,构建面向行业的大模型
184 福建医科大学孟超肝胆医院 孟超 福建福州 医疗 面向肝病和肝癌的医疗大模型
185 中文在线 中文逍遥 北京 文旅 小说创作
186 CCAI宁波中心 iChainGPT 浙江宁波 企业服务 产业链大模型iChainGPT
187 光启慧语 光语 上海 医疗 光启慧语正式发布了与复旦大学附属中山医院(以下简称 " 中山医院 ")联合开发的多模态医疗大模型
188 安恒信息 恒脑 浙江杭州 信息安全 恒脑安全大模型具备恶意代码检测、威胁情报分析、自动化安全编排响应和安全教育等能力
189 容联云 赤兔 北京 客服 客服,营销
190 华中科技大学 Monkey 湖北武汉 通用 多模态,开源
191 美亚柏科 天擎 福建厦门 安全 公共安全
192 瑞金医学 RJH 上海 医疗 RJH-Base基座大模型、RJH-Med应用大模型,以及多模态大模型
192 海通证券 泛海言道 上海 金融
193 马上消费 天镜 重庆 金融 零售金融
194 海尔 HomeGPT 山东青岛 智能家居
195 招商轮船 ShippingGPT 广东深圳 航运
196 厦门大学 南强·慧眼 福建厦门 航运
197 康亲控股 保生·妙算 福建厦门 医疗
198 九思软件 智联 北京 企业服务
199 丽阳神州 丽阳神州 山东济南 家政
200 香港科技大学 InvestLM 香港 金融 基于LLaMA-65B
201 华东师范大学化学与分子工程学院 ChemGPT 上海 科研
202 百度 灵医Bot 北京 医疗 基于文心一言
203 上海市人工智能实验室 浦医 上海 医疗
204 上海交通大学 K2 上海 地球科学 Demo,GeoLLaMA,基于LLaMAHuggingFace
205 金睛云华 CyberGPT 辽宁沈阳 企业服务
206 中国煤科西安研究院 GeoGPT 陕西西安 矿业
207 医渡科技 医渡 北京 医疗
208 云问科技 云中问道 江苏南京 营销 与西安未来AI计算中心联合发布
209 天壤智能 小白 上海 通用
210 理想科技 大道Dao 北京 运维 运维大模型
211 中国联通 鸿湖 北京 通信
212 中国移动 九天,九天•众擎 北京 通信 九天•众擎基座大模型
213 中国电信 TeleChat,启明 北京 通信 “启明”网络大模型
214 慧言科技+天津大学 海河·谛听 天津 科研
215 电科太极 小可 北京 政务 党政企行业应用
215 联汇科技 欧姆 浙江杭州 通用 OmModel欧姆多模态(视觉语言)大模型
216 电信智科 星河 北京 通信 通用视觉,中国电信
217 追一科技 博文Bowen 广东深圳 客服
218 二元工业 妆舟 江苏苏州 日化 回答化妆、护肤和服饰搭配等问题,日化行业从业人员提供从产品开发、行业服务到品牌建设等指导
219 白海科技 白聚易 北京 营销 营销传播专家多模态预训练模型IMC-GPT(白聚易)
220 中国农业银行 小数ChatABC 北京 金融
221 循环智能 盘古 北京 客服 循环智能,清华大学,华为
222 医联科技 medGPT 四川成都 医学
223 印象笔记 大象GPT 北京 媒体
224 理想汽车 MindGPT 北京 工业
225 上海交通大学人工智能研究院 BAI-Law-13B 上海 司法 白玉兰系列
226 上海交通大学人工智能研究院 BAI-Chem 2.0 上海 科研 白玉兰系列
227 腾讯 ChartLlama 广东深圳 科研 图表理解和生成任务的多模态大型语言模型
228 哈尔滨工业大学(深圳) 九天 广东深圳 科研 九天JiuTian-LION的多模态大语言模型
229 阅文集团 妙笔 上海 文旅 网文大模型
230 中工互联 智工 北京 工业 与复旦NLP实验室联合,工业领域
231 智慧眼 砭石 湖南长沙 医学 医疗领域
232 宇视科技 梧桐 浙江杭州 运维 AIoT行业
233 红棉小冰 红棉小冰 北京 通用 原微软小冰
234 北京信工博特智能 BotGPT 北京 政务
235 秘塔科技 MetaLLM 上海 司法 秘塔写作猫产品
236 月之暗面 Moonshot 北京 通用 Moonshot AI “长文本”大模型 支持20万字输入
237 中兴通讯 星云 广东深圳 代码
238 万翼科技 卓灵 广东深圳 建筑 万科子公司
239 西北工业大学 秦岭·翱翔 陕西西安 工业 流体力学大模型,湍流+流场
240 北京航空航天大学智能交通技术与系统实验室 TrafficGPT 北京 交通运输
241 格创东智 章鱼智脑 广东广州 工业制造 工业智能大模型引擎底座——章鱼智脑OctopusGPT
242 浙江大学 智海-金磐 浙江杭州 金融
243 中国农业大学 神农 北京 农业

国外大模型

公司 大模型 说明
OpenAI ChatGPT ChatGPT-4支持Plugins,Code Interpreter
微软 Bing Chat 搜索增强,有三种模式
Google PaLM2,Bard,Gemini多模态大模型 Gemini技术报告:英文版,中文版Part1Part2Part3
Anthropic Claude Claude 2,支持读入pdf、txt、csv等文件进行分析、总结和问答等
Meta LLaMA,LLaMA-2, CodeLLaMA 最强开源开放大模型,月活用户小于7亿的组织和个人可随意商用
Stability AI StableLM
Amazon Titan
Bloomberg BloombergGPT
MosaicML MPT
Intel Aurora genAI
UC Berkeley, Microsoft Research Gorilla
inflection.ai Inflection-1
xAI Grōk 从OpenAI 到xAI
cohere Cohere
Scale AI Scale
character ai Character
Colossal-AI ColossalChat
Nvidia ChipNeMo

微信公众号:走向未来

欢迎扫码关注微信公众:走向未来,公众号专注于分享AGI、大模型、知识图谱、深度学习、强化学习等技术、系统架构、应用场景和案例等内容。

珠峰书

珠峰书《知识图谱:认知智能理论与实战》一书全面介绍了知识图谱的构建技术、存储技术和应用技术、Transformer、图神经网络等内容,欢迎购买。具体来说,包括:

  • 知识图谱模式设计、知识抽取、图数据库、知识计算、知识推理、知识问答、知识推荐等全方面的内容
  • 详细介绍了Transformer模型细节和实现方法,是大模型的基础技术
  • 国内首本提到向量数据库的书籍
  • 简要介绍了多模态知识融合的内容,书中以“月亮”为例,提出应当把图片的月亮、各种不同语言的文本月亮和和月亮的读音等,都应当融合到同一个知识点中。这正是多模态大模型所做的。
  • 其他一些关于神经科学、脑科学和哲学中对智能的思考