先说个真事

朋友公司有人收到"老板"的语音消息,让转账50万。声音、语气都对,差点就转了。后来发现是AI克隆的——骗子从老板的抖音视频里扒了几十秒素材。

这就是现在声音克隆的水平:以假乱真


60秒能干什么

用ElevenLabs举例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
from elevenlabs import clone, generate

# 上传60秒录音
voice = clone(
    name="我的声音",
    files=["sample.mp3"]
)

# 让它说任何话
audio = generate(
    text="这话我从没说过",
    voice=voice
)

就这么简单。效果好到专业人士都分辨不出。


能用来干什么

正经用途:

  • 有声书制作(成本从10万降到1千)
  • 虚拟主播(24小时不下播)
  • 游戏NPC配音(1000个NPC,1000种声音)
  • 帮失声的人"说话"

不正经用途:

  • 诈骗(前面说的那种)
  • 伪造录音
  • 未经授权用别人的声音

怎么防骗

  1. 涉及转账,打电话确认。语音消息不算数。
  2. 设暗号。家人之间约定一个只有你们知道的词。
  3. 听细节。AI声音太"完美"——没有呼吸声、没有口水音、没有犹豫。

怎么玩

免费方案: Coqui TTS(开源),需要自己部署

付费方案: ElevenLabs,$11/月起,效果最好

录音技巧:

  • 安静环境
  • 正常语速
  • 至少60秒,内容越丰富越好

配音演员会失业吗

低端活会被抢:有声书旁白、广告配音、游戏NPC。

高端活抢不走:需要情感演绎的角色、艺术创作。

新机会: 授权自己的声音收版权费、做AI配音指导。


最后

技术没有善恶,看人怎么用。

玩声音克隆记得:用自己的声音玩,别克隆别人的

有问题留言。


相关链接:ElevenLabs | Coqui TTS