【Unity虚拟人】开源实时聊天虚拟人项目,Unity+豆包(LLM)+ASR+TTS,响应速度毫秒级别的

【Unity虚拟人】开源实时聊天虚拟人项目,Unity+豆包(LLM)+ASR+TTS,响应速度毫秒级别的-盘古CG网
【Unity虚拟人】开源实时聊天虚拟人项目,Unity+豆包(LLM)+ASR+TTS,响应速度毫秒级别的
此内容为免费资源,请登录后查看
0
免费资源
图片[1]-【Unity虚拟人】开源实时聊天虚拟人项目,Unity+豆包(LLM)+ASR+TTS,响应速度毫秒级别的

介绍

数字人采用URP渲染管线开发,支持所有平台发布
采用Unity2022.3.31版本开发
开箱即用,任何人可以再此项目扩展开发
参考视频:https://www.bilibili.com/video/BV1YJ4m1T7Rj?t=2.7

软件架构

用户麦克风输入->语音识别->拿到语音识别结果->LLM大语言模型->拿到回答内容->提交TTS合成->拿到语音->音字同步
语音识别:采用流式语音识别
语音合成:采用一键式合成,LLM大语言模型内容分段提交
LLM:支持网上任何一款大模型API接口,如豆包、智谱、Kimi等等…
LipSync:采用uLipSync 嘴唇同步,支持多平台

安装教程

建议使用2022版本及以上进行开发,否则URP管线的包体需要自行处理报错问题

使用说明

Resources/LLMConfig

Url : 对接大语言模型的http地址
Model:对接大语言模型应用那个模型(如chatgpt3.5)
Key:大语言模型的授权密钥
RoleSetting:(非必填)进行LLM System预设,让它站在某一个人或者某一些信息上回答问题

与Fay结合使用

Fay数字人开源框架地址:https://github.com/xszyou/fay

LLM大模型需要开发者自行配置
参考https://qqk9ntwbcit.feishu.cn/wiki/V5qcwlikKiehoYkAPhYcmBPAnAc

fay设置界面 

第一步:参考图中设置:关闭唤醒、关闭麦克风、关闭扬声器

第二步:设定人物信息

第三步:保存当前设置

第四步:启动服务

img

url:http://127.0.0.1:5000/v1/chat/completions

model:fay-streaming

运行包:https://pan.baidu.com/s/1qHq5KdZ8QujO2TL9sWl-QA?pwd=kjit

加入知识交流群


加作者微信邀请入群

动力支持

动力支持
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容