![图片[1]-【Unity虚拟人】开源实时聊天虚拟人项目,Unity+豆包(LLM)+ASR+TTS,响应速度毫秒级别的](http://pangucg.com/wp-content/uploads/2025/05/微信截图_20250522184817.jpg)
介绍
数字人采用URP渲染管线开发,支持所有平台发布
采用Unity2022.3.31版本开发
开箱即用,任何人可以再此项目扩展开发
参考视频:https://www.bilibili.com/video/BV1YJ4m1T7Rj?t=2.7
软件架构
用户麦克风输入->语音识别->拿到语音识别结果->LLM大语言模型->拿到回答内容->提交TTS合成->拿到语音->音字同步
语音识别:采用流式语音识别
语音合成:采用一键式合成,LLM大语言模型内容分段提交
LLM:支持网上任何一款大模型API接口,如豆包、智谱、Kimi等等…
LipSync:采用uLipSync 嘴唇同步,支持多平台
安装教程
建议使用2022版本及以上进行开发,否则URP管线的包体需要自行处理报错问题
使用说明
Resources/LLMConfig
Url : 对接大语言模型的http地址
Model:对接大语言模型应用那个模型(如chatgpt3.5)
Key:大语言模型的授权密钥
RoleSetting:(非必填)进行LLM System预设,让它站在某一个人或者某一些信息上回答问题
与Fay结合使用
Fay数字人开源框架地址:https://github.com/xszyou/fay
LLM大模型需要开发者自行配置
参考https://qqk9ntwbcit.feishu.cn/wiki/V5qcwlikKiehoYkAPhYcmBPAnAc
第一步:参考图中设置:关闭唤醒、关闭麦克风、关闭扬声器
第二步:设定人物信息
第三步:保存当前设置
第四步:启动服务

url:http://127.0.0.1:5000/v1/chat/completions
model:fay-streaming
运行包:https://pan.baidu.com/s/1qHq5KdZ8QujO2TL9sWl-QA?pwd=kjit
加入知识交流群
动力支持

暂无评论内容