先说个真事
朋友公司有人收到"老板"的语音消息,让转账50万。声音、语气都对,差点就转了。后来发现是AI克隆的——骗子从老板的抖音视频里扒了几十秒素材。
这就是现在声音克隆的水平:以假乱真。
60秒能干什么
用ElevenLabs举例:
| |
就这么简单。效果好到专业人士都分辨不出。
能用来干什么
正经用途:
- 有声书制作(成本从10万降到1千)
- 虚拟主播(24小时不下播)
- 游戏NPC配音(1000个NPC,1000种声音)
- 帮失声的人"说话"
不正经用途:
- 诈骗(前面说的那种)
- 伪造录音
- 未经授权用别人的声音
怎么防骗
- 涉及转账,打电话确认。语音消息不算数。
- 设暗号。家人之间约定一个只有你们知道的词。
- 听细节。AI声音太"完美"——没有呼吸声、没有口水音、没有犹豫。
怎么玩
免费方案: Coqui TTS(开源),需要自己部署
付费方案: ElevenLabs,$11/月起,效果最好
录音技巧:
- 安静环境
- 正常语速
- 至少60秒,内容越丰富越好
配音演员会失业吗
低端活会被抢:有声书旁白、广告配音、游戏NPC。
高端活抢不走:需要情感演绎的角色、艺术创作。
新机会: 授权自己的声音收版权费、做AI配音指导。
最后
技术没有善恶,看人怎么用。
玩声音克隆记得:用自己的声音玩,别克隆别人的。
有问题留言。
相关链接:ElevenLabs | Coqui TTS