DaleZ SteveWorkshop 问题是对着手机讲话跟你说的情况有什么区别……问题的根源不出在这上面。 SteveWorkshop 还有数据从哪来,你一个人教它么 搜集小娜以前说的每一句话,让 LLM 学习她的说话风格
Baka632 SteveWorkshop 或许可以这样:语音识别本地程序来做,然后把识别结果发给 GPT,之后本地程序根据 GPT 返回的结果进行相应的操作 不过这东西说起来简单,实际做起来简直是天坑(
DaleZ SteveWorkshop 现在我需要你扮演微软的 Cortana 这个角色,请尽力模仿她的说话风格,我会在下面给出她的一些语录,以人机对话形式: 人:(...) Cortana:(...) …… 如果单纯考虑语言,倒挺简单的。 难点是模型能不能学会。 语录也不好找。Windows 10 上面的小娜还聪明着吗?
SteveWorkshop DaleZ 关于小娜有一件有意思的事情—— 请将操作系统的地区调成美国,语言调成英语,然后用英语和小娜交流,你会惊奇的发现小娜(部分地)回来了 当然这种情况下回答也是英语,想要中文恐怕永远不可能了
Baka632 SteveWorkshop 不一定,刚刚试了下WP上的小娜,我发现某些特定的操作小娜仍然是可以用中文相应的(比如打开/关闭手电筒),而且我是在离线情况下测试的,推测小娜的语音是在本地合成的
ThinkBou Baka632 推测小娜的语音是在本地合成的 确实,Windows Holographic的手势教程就是小娜的声音。这个语音模型没有供用户公开使用,但是应该是在OS内的,可能是因为版权问题。 虽然现在Azure有了更自然的语音合成模型可以供用户使用,但是还是觉得小娜的声音更加动听🥰🥰🥰
SteveWorkshop Baka632 WP不知道,win2004以后必须改区,之前的么。。。2020年7月我短暂地玩过一段时间1507(还是1511?忘了,那会啥也不懂只知道是win10随便下载的),我记得好像是确实有一些功能。WP应该同理,本地合成