mortis

Mortis 就像是看了 10000 次 MyGO 的群友，后面忘了。

生成台词集合

参考 mygo-gen.py（需要安装 pysub2），对应的字幕组仓库是 https://github.com/Nekomoekissaten-SUB/Nekomoekissaten-Storage。需要注意的是，该字幕的 license 是 CC BY-NC-ND 4.0，这意味着脚本生成的文件（以及对应的 embedding）无法共享，需要自己动手操作。

也可以自己收集去重，每行一句即可。

回复生成方法

三种参考方法：

m1：把整个台词集全塞到 prompt 里面，让模型选择（4k 行台词大约 40k token，按每 1M token 2 元来算的话，100 块可以推理个大约 1250 次，有点小贵）
m2：分两步，第一步让模型提供适合回复的关键词，搜索后第二步让模型选择
- 不直接使用 function call 的原因是，至少目前测试下来 siliconflow 的 function calling 几乎不工作，模型大部分时候不会调用函数，会自己瞎编回复，即使调用很多时候调用方式也不对。
m3：分两阶段，第一阶段生成每一句台词的 embedding 保存到本地（参考 embeddinggen-m3.py，生成 embedding 的金钱成本极低），第二阶段让模型输出回复，回复也生成 embedding，选择最相似的 top20 回复，然后让模型选一个。

mortis.py

mortis.py 是一个异步的 Python 库，暴露的 Mortis 类可以直接使用：

import asyncio
from mortis import Mortis
import logging
import os

logging.basicConfig(
    level=logging.DEBUG if os.environ.get("DEBUG") else logging.INFO,
    format="%(name)s - %(levelname)s - %(message)s"
)

with open("lines.txt", "r") as f:
    lines = f.readlines()
    lines = [line.strip() for line in lines]
with open("key", "r") as f:
    key = f.read().strip()

mortis = Mortis(lines, key)

async def main():
    print(await mortis.respond("User: 你又睡不着吗"))

if __name__ == "__main__":
    asyncio.run(main())

示例

examples/telegrambot.py 是一个 Telegram Bot 的例子：

用户名脱敏（放入 prompt 的用户名均改为 User0、User1 等，包括消息内部形如 @xxx 的内容）
每个群保留 100 条聊天记录，每 10s 检查一次，如果有更新则做一次推理

ADMIN_USERNAMES=yourusername ALLOWED_GROUPS=-1234567890 EMBEDDING_PATH=./mygo_embeddings.npy python telegrambot.py

其他

仓库使用了软链接，因而不直接兼容 Windows。

Prompt（包含聊天记录）会被发送至第三方服务商，请注意隐私问题。

另外效果目前不太好，单纯图一乐了。

License: MIT.

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
.github/workflows		.github/workflows
examples		examples
playground		playground
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
docker-compose.yml		docker-compose.yml
mortis.py		mortis.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

mortis

生成台词集合

回复生成方法

mortis.py

示例

其他

About

Releases

Packages

Languages

taoky/mortis

Folders and files

Latest commit

History

Repository files navigation

mortis

生成台词集合

回复生成方法

mortis.py

示例

其他

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages