一个基于 OpenAI API 的Android 语音助手,模型为"gpt-3.5-turbo"。
因为当时没有带语音功能的AI助手,并且需要科技,所以就自己做了一个。
2023.8.21更新:
- 反向代理服务器经常失败,换回OpenAI直连,需要配合科技使用。
- 后面考虑使用中间件调用其他模型。
- 基于 ChatGPT 3.5 的聊天功能,温度设置为 0.5 ,其他默认设置,没有初始角色设定。
- 可以语音输入,使用讯飞语音。默认GPT语音播报回答。语音播报可以停止。
- 支持上下文理解,可以多轮对话,比如扮演面试官角色进行面试沟通。
- 不需要科技可以直接使用。(7月失效)
以下使用到的API均可免费申请:
- 申请 OpenAI API key:https://platform.openai.com/account/api-keys
- 申请讯飞语音 API key:https://console.xfyun.cn/app/myapp
- 项目代码中创建接口,把自己申请的Key写入即可。
package com.cstdr.chatgpt.model;
public interface API {
String OPEN_AI = "sk-xxxx"; // Open AI
String XF_SPEECH = "xxxx"; // 讯飞语音
}
- 科大讯飞(目前使用中)
- 免费的话,语音听写和在线语音合成一年5万次交互量。
- 百度云、阿里云、腾讯云等云平台提供的功能
- 谷歌原生的语音识别(项目代码还在,已经注释)
优点:代码集成简单,维护方便。
缺点:使用需要科学魔法,可能会影响ChatGPT的沟通效率。后续扩展或者加入个性化语音需求比较麻烦。
- PocketSphinx on Android (https://cmusphinx.github.io/wiki/tutorialandroid/)
优点:离线语音识别,网上教程多。
缺点:集成有点复杂,并且没有个性化语音功能,很多教程都比较久远,维护难度大。
- 免费版本:每月 5 小时免费音频,永久免费。
- 注册需要VISA卡。 最后卡在VISA注册上,卡激活没问题,持卡人签名那边尝试各种办法怎么都过不去。。。