收费服务
商业增强功能、价格表与服务联系方式。
7. 收费服务
微信:wxwubug 备注需求
Email: lipku@foxmail.com
Telegram: https://t.me/livetalking
7.1 wav2lip高清版
对wav2lip网络结构做了升级优化;音频特征改为hubert;用lstm网络添加前后帧关联。 分为两个版本:
192
在显卡3060上能达到实时,价格¥2000.384
在显卡4070上能达到实时,价格¥3000. 该价格提供192和384两个版本模型,购买过192模型的用户可以加¥1000升级到384
btw:高清模型使嘴型准确、牙齿清晰,不是使视频高清。视频高清需要提高原始视频分辨率,修改aiortc中h264.py提高编码码率。
7.2 功能优化
- avatar视频不限时长
通过cache管理图片内存,只加载最近需要用到的图片,显著降低内存占用。支持不限时长的avatar视频,适用于特定场景使用如直播 - vue客户端 提供vue前端代码,支持数字人透明背景。客户端下载https://pan.quark.cn/s/d7192d8ac19b
- python客户端
独立视频窗口显示,提供python接口交互,更方便与python项目集成如直播场景。 - 语音交互
(1)数字人说话过程中用唤醒词打断提问
(2)数字人说话过程中不被其他杂音干扰
(3)可以检测到数字人回答完一个问题 - avatar实时切换
交互过程中可以实时切换avatar形象,适合根据不同场景做不同动作。与动作编排的区别:动作编排只能播放提前录制好的音视频;avatar切换在播放动作时可以让数字人说指定的话。 - 多数字人同时出镜
同一个画面支持多个数字人对话,通过api指定数字人说话和对应音色 - 摄像头驱动数字人动作和表情
主播在摄像头前不用说话,可以做表情和动作,通过api驱动主播唇形同步
7.3 价格表
- 打包版本
| 功能 | 价格 | 备注 |
|---|---|---|
| 基础包: wav2lip高清模型 ; 语音交互;同步字幕与说话开始结束事件通知; 透明背景+vue代码; 实时音频流输入; 实时切换avatar形象和动作 | ¥18000 | 效果演示,满足大部分大屏需求和数字人讲解功能 |
| 升级包: 多个数字人同时出镜 | ¥2000 | 效果演示 |
| 升级包: 摄像头驱动数字人动作和表情 | ¥5000 | |
| 升级包: 与livekit对接 | ¥8000 | 效果演示 |
- 可单独购买功能
| 功能 | 价格 | 备注 |
|---|---|---|
| wav2lip高清模型 | ¥3000 | 效果演示 |
| 不限时长avatar形象(目前只支持wav2lip) | ¥3000 | |
| 透明背景+vue代码 | ¥3000 | 效果演示 |
| 实时音频流输入 | ¥2000 | |
| python客户端 | ¥3000 | 效果演示 |