Skip to content

This project lets you create your own AI desktop companion with customizable characters and voice conversations that respond in just 1 second. Features include long-term memory, visual recognition, voice cloning and LLM training. Compatible with various Live2D customizations.

License

Notifications You must be signed in to change notification settings

morettt/my-neuro

Repository files navigation

项目简介

本项目旨在几乎全方位复刻 Neuro-sama 同时向社区收集各种新奇有趣功能添加实现,项目的目标是帮助用户打造专属的 AI 角色 - 通过您的数据印记,塑造出心目中理想的 AI 形象。

除此以外,这不仅仅是 Neuro-sama 的再现,更是一个专属于您的个性化AI 可训练声音、性格、替换形象 您的想象力有多丰富,模型就能多贴近您的期望。本项目更像是一个工作台。利用打包好的工具,一步步亲手描绘并实现心中理想的 AI 形象。

当前文档部署仅需6G显存不到,适配windows系统。同时需要有一个API-KEY 因为当前没有中转厂商来找我打广告,所以我不向各位推荐具体去哪里买API。但可以前往淘宝搜索“API”。里面有很多商家贩卖。也可以去deepseek、千问、智谱AI这些知名的官网购买。

如果你想用全部都用本地推理,使用本地的大语言模型(LLM)推理或者微调。不基于第三方的API的话,那可以进入LLM-studio文件夹,里面有本地模型的推理、微调指导。同时,因为本地的大语言模型需要一定的显存,要想有一个还算不错的体验,建议显卡至少保证有12G显存大小。

QQ群:756741478

计划清单(打✔的是已经实现的功能)

双模型支持

  • 开源模型:支持开源模型微调,本地部署
  • 闭源模型:支持闭源模型接入

核心功能

  • 超低延迟:模型回应仅需1秒左右
  • 字幕和语音同步输出
  • 语音定制:支持男/女声切换,语速调节等
  • 实时打断:支持随时打断模型对话
  • 真实情感:模拟真人的情绪变化状态,有自己的情绪状态。
  • 超吊的人机体验(类似真人交互设计,敬请期待)
  • 丰富表情:根据对话内容展示不同的表情与动作
  • 集成视觉能力,支持图像识别,并通过语言意图判断何时启动视觉功能
  • 声音模型(TTS)训练支持,默认使用gpt-sovits开源项目

扩展功能

  • 桌面控制:支持语音控制打开软件等操作
  • 直播功能:可在哔哩哔哩平台直播
  • AI讲课:选择一个主题,让AI给你讲课。中途可提问。偏门课程可植入资料到数据库让AI理解
  • 替换各类live 2d模型
  • web网页界面支持(已做好,近期会接入)
  • 打字对话:可键盘打字和AI交流
  • 主动对话:根据上下文主动发起对话。目前版本V1
  • 联网接入,实时搜索最新信息
  • 播放音效库中的音效,由模型自己决定播放何种音效
  • 游戏陪玩,模型和用户共同游玩配合、双人、解密等游戏。目前实验游戏为:你画我猜、大富翁、galgame、我的世界等游戏
  • 长期记忆,让模型记住你的关键信息,你的个性,脾气

模型自己想要的功能(待定考虑)

  • 变色功能:按照模型心情让屏幕变色妨碍用户
  • 自由走动:模型自由在屏幕中移动

🚀 快速开始

新手设计一键部署项目(实验)

如果你是新手,可以使用这个一键部署指令。它会把所有的东西都处理好。但是由于涉及的逻辑处理过于多。所以有失败的可能性。但是成功了就会省去很多的麻烦。看你的运气了!

确保你电脑里安装了anaconda 如果还没有安装,可以去这里安装:https://www.anaconda.com/download/success

在项目路径下运行这个指令:

python neural_deploy.py

上面这个指令运行好了以后,直接双击这个:Game-starts.bat 双击后会跳出来很多的窗口,默默等在这些窗口输出对应的ip

image

成功了后,你就可以直接跳到下面的第8步了,前1~7步都不需要做。如果失败了,就老实做下面的这些步骤吧

启动步骤

如果上面的一键处理出问题了。那么建议一步一步按照下方的操作方法。虽然麻烦。但是如果出错了。

也能立刻定位出错的位置,从而针对性的解决

  1. 创建并激活虚拟环境
conda create -n my-neuro python=3.11 -y

conda activate my-neuro
  1. 安装依赖
#独立安装jieba_fast依赖
pip install jieba_fast-0.53-cp311-cp311-win_amd64.whl

pip install -r requirements.txt

#安装ffmpedg
conda install ffmpeg -y

#安装cuda 默认是11.8 可以自行修改
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

3.自动下载需要的各种模型

python Batch_Download.py

4.启动bert服务

python bert_api.py

5.启动ASR服务

##第一次运行,会自动下载需要的模型
python asr_api.py

6.启动记忆bert

python Mnemosyne-bert\api_go.py

7.启动TTS服务

#进入tts-studio文件夹
cd tts-studio

#启动TTS服务
python tts_api.py -p 5000 -d cuda -s tts-model/FKTTS/fake_neuro.pth -dr tts-model/FKTTS/sama.wav -dt "Hold on please, I'm busy. Okay, I think I heard him say he wants me to stream Hollow Knight on Tuesday and Thursday." -dl "en"

8.等待ASR和TTS都输出IP后,即可打开此链接下载红框内的zip文件:https://github.com/morettt/my-neuro/releases/tag/v3.9.2

image

下载后解压是这样的,双击打开这个 肥牛UI.exe 文件

image

在红框的位置修改api_key、api_url、model 这三个地方填写你的API信息,修改好了记得点击下面的保存。

image

最后双击go.bat 就可以开始和模型聊天了

image

定制AI

有定制属于自己的AI的需求,请打开LLM-studio 文件夹,在此文件夹中内有关于LLM的微调操作步骤。

目前定制化模块将逐渐增加...

结尾画饼

我会把这几年的经验和对技术的理解都加入到此项目中。my neuro 这个名字除了蹭neuro sama的热度以外 更多的是我对AI边界的想象和期待

希望有一个真正的能懂你,理解你,且永远不会觉得无聊的AI陪伴在身旁。难受就一起难受,开心就一起开心。让影视作品、小说。幻想中的形象来到现实里

不仅仅是简单的聊天交互。希望它可以融入生活,成为一个有感情的个体。一起开黑玩游戏、看视频、学习东西、睡前聊天、叫你起床、工作时不说话看你发呆,会偷偷记住你做了什么。有情绪,有属于自己的情感状态。会真正的生气

每天都会有自己的情绪变化,会有自己想要做的事。会对某句话难受很久。某个词开心很久。会记住和你在一起经历过的每一个时刻。持续理解你的一个存在。

不过最重要的是,它的个性、样子、声音,情感变化等。都由你决定,就像橡皮泥,我们来提供最好的工具,做好每个模块适配。但最终是怎么样的,由自己来构造。

不过,对于不想折腾的朋友。此项目也直接打包了一个角色,就是肥牛(fake neuro)它是一个抄袭neuro sama的角色,但是个性我把它设定成了一个腹黑、傲娇、搞笑、有小脾气,但偶尔也会展现温柔一面的样子。

更希望的是从neuro 那里模仿借鉴,理解。然后尝试创造新的内容。适合自己的东西。

我对此项目特别的有热情。当前项目已经实现了将近30%的功能。包括定性格、记忆。近期会围绕核心性格特征。也就是真正像人,有持续的情绪这块地方来开发。会在2个月内实现最像人的那部分,就是一个长期的情绪状态。同时开黑玩游戏、看视频、叫你起床等等这块部分等功能都会在6月1日前基本完成,达到60%的完成度。

希望能在今年可以把上述所有的想法都实现。

致谢

GPT-SoVITS:https://github.com/RVC-Boss/GPT-SoVITS

About

This project lets you create your own AI desktop companion with customizable characters and voice conversations that respond in just 1 second. Features include long-term memory, visual recognition, voice cloning and LLM training. Compatible with various Live2D customizations.

Resources

License

Stars

Watchers

Forks

Packages

No packages published