李宗瑞姐妹花雷军也成了AI语音的受害者？

撸撸色

本文来自微信公众号：王智远李宗瑞姐妹花李宗瑞姐妹花，作家：王智远，原文标题：《雷军，可能有点心烦...》，题图来自：AI生成

雷军最近可能有点心烦……

烦什么？你听到了吗？最近，有不少东谈主用雷军的声息进行二次创作，作念成各式段子。我听完之后，认为既搞笑又无奈。

比如：

“老子踏*一眨眼，国庆节就往日了，我又得拖着一大堆破行李去上阿谁X班；假期里，躺在抖音上刷视频的废料们，各人好，我是雷军，你们千万不要用小米手机看黄片。”

还有更雷东谈主的骨子，在哔哩哔哩上，他的AI语音被用来制作各式游戏阐明、话题封面语，比如打篮球、打麻将，主打一个“不爽”，吐槽和评述额外横暴。

至于让我感到无奈的部分，却不太好样式。在写这篇著作之前，我把其中一个短视频发给了我爸，并问他：“你认为这个短视频有什么额外之处吗？”

我爸回答说：“挺有兴致的。”但他并莫得提到语音的问题，换句话说，他压根没意志到这是AI生成的语音。可见，AI语音依然大要达到以伪乱真的地步了。

一

不外，此次假语音和之前“Are you ok？”有很大不同。

Are you ok，骨子属性不彊，本人没什么坏心，也不会激发误解，最多让本东谈主认为有点莫名；雷军以致还幽默地呈报过，还把版权买下来，从营销的角度来看，这反而成了一种正面的宣传。

但AI语音有点不一样。

咫尺收罗上，大部分雷军AI语音，都是网友们用他的声息说的一些很过分的话，什么“辛苦操控小米手机炸死你”或者“我开小米SU7撞死你全家”。

这些话相称极点。不了解的东谈主，会认为真的雷军说的，依然波及到指责的问题。

AI语音有好多种款式，常见的包括：语音合成、语音克隆、语音识别、深度伪造和天然讲话处理。前三种各人相比闇练，后两种是最近两年才慢慢流行起来的。

深度伪造（Deepfake）是由“深度学习”（deep learning）和“伪造”（fake）组合而来，兴致是用深度学习本领来师法东谈主的声息和图像。

而天然讲话处理（NLP）是让缠绵机阐明和处理东谈主类讲话的本领，应用额外广，比如：智能客服和语音助手。

好多创作家在给视频配音时，为了省时省力又不想出镜，频繁会先写好笔墨，再用AI来朗诵和合成。

拿我来说：一般会遴荐港版男平日话、广西表妹或东北话，这么让文本画面和其他地域口音荟萃，刚好酿成了显然的反差感。

这些本领的作用是停留在语音合成和搞笑方面，如实没什么额外的影响；然而，一朝波及到名东谈主 IP 效应再加上搞笑，同期还试图进行文化层面的输出，情况就大不疏通了。

因为这不再是单纯的逗趣，还可能激发各式社会响应。

之前对于“三只羊”卢某某的灌音想必不少网友刷到过，那段语音听起来额传奇神，引起了好多东谈主的商讨和担忧，我听完后都嗅觉像真的，以致还在群里吐槽事件本人太颠覆三瞻念了。

不外，9天后（2024年9月26日），合肥市公安局很快发布了官方呈报，说那是假的，并提醒各人不信谣、不传谣。

假语音威力不比短视频小，短视频有画面，更容易分辨真假，但语音却很难辞别，这就更容易误导东谈主们。

二

外洋也有肖似事件。我用Perplexity查了一下对于AI作秀的新闻，发现他们以致把办法瞄准了总统，问题高潮到了政事层面。

凭据《连线》杂志的报谈，本年齿首，一些新罕布什尔州的选民接到了冒充“拜登总统”的自动语音电话，试图误导他们在初选中投票。

白宫新闻书记证据，电话是伪造的，并非总统灌音。

好意思国联邦通讯委员会（FCC）主席杰西卡·罗森沃塞尔（Jessica Rosenworcel）暗示，比年来，机器东谈主电话中使用的AI生谚语音变得越来越先进，这些语音不错师法名东谈主、政事候选东谈主，以致亲密家东谈主的声息，从而制造诞妄信息，误导公众。

她强调，若是语音克隆公司在建筑应用时波及名东谈主、可能误导公众、传播风险高的骨子，应该在传播中加上较着的标记，提醒公众留神。“咱们提倡，将使用AI生谚语音的机器东谈主电话（robocall）视为违法。”

另外，还有着名歌手泰勒·斯威夫特的AI伪造“瞻念照”在网上疯传，这类AI作秀事件激发了东谈主们对东谈主工智能的平庸担忧。

几天后，作秀的东谈主被找到，他坦言我方用AI器用ElevenLabs，仅花了不到20分钟和1好意思元就完成了作秀，是不是很惊东谈主？

本年3月，一位记者发现，只消在上传文献着手加入一分钟的静音，就不错绕过规定，成功克隆特朗普和拜登的声息，尽管本领不错用来回击本领，但AI检测软件时时无法灵验识别AI生成的音频。

难谈，AI生谚语音真的能刚劲到这种地步吗？

其实我也有疑虑。自从“三只羊”卢某某AI灌音事件后，我一直关心着呈报此事的品牌（某声）的弘扬。

他们的网站上如实有雷军的AI合成声息，各人不错我方去试听，音色与真东谈主额外接近，而且发布的数目也不少，这给了许多蹭热度的契机，他们诓骗名东谈主的声息制造话题。

不仅是雷军，咫尺好多互联网平台，比如抖音、B站，都有多半与马保国、葛优、“麦克阿瑟（一位师法网红）”等名东谈主声息有关的视频。

这些视频诓骗的是AI配音本领，你只消遴荐相应的东谈主物声息，然后输入笔墨，就能生成该东谈主物声息的骨子；天然好多圭臬会用代称来藏匿版权问题，但提供的声息种类多达上百种，还不错颐养语速和语调。

图释：某声品牌社区广场，仍不错搜到一些名东谈主音频

适度写这篇著作，在（某声）社区变装商场，依然不错找到雷军、蔡徐坤、卢本伟、刘亦菲、成龙等名东谈主的仿声合成音，你很难分辨是否是真东谈主。

我并不是单单月旦某一个软件，而是总计这个词语音生态似乎都存在一些问题，这激发了咱们的念念考：

以前互联网平台只对图文和视频进行经管，咫尺进入了AI期间，AI成了一种新前言。

那么，AI当作前言载体作念出来的平台，是不是自身也要自我经管？是不是得条目用户，非本东谈主不可用别东谈主的声息伪造？至少咫尺看来，属于三无论的地带，莫得很细节的法律条规、也虚浮澄澈的社区规定。

三

既然提供本领的平台监管不到位，那么，发布平台就真的无法监测吗？比如，我将AI语音发布到抖音、快手等平台，难谈它们就无法检测到问题？

问了一圈懂行的一又友，他们说，这波及到两方面问题。

从本领角度，语音模子的自动语音识别（ASR）和文生文、文生图的旨趣相似，它们最初都要多半的语料来进行检会，唯有这么才能生成更多细巧化的模子。

这些模子越细分，语音识别成果就越好。这让我嗅觉，这像是一个层层递进的套娃游戏。

另外，咫尺国内主流的ASR本领多摄取端到端模子（End-to-End Models）。这种模子通过一个收罗，将输入的语音顺利调节为输出收尾，简化了传统ASR系统中多个复杂组件的历程。这使得识别过程愈加高效，但中间门径也减少了。

比如说：当你对入辖下手机说“今天天气何如样？”，端到端模子能顺利将语音转为笔墨，查询天气信息，并告诉你收尾，这种款式额外快捷，但它不具备中间的感知才略。

天然咫尺主流的AI语音模子运转摄取更深度的学习框架，如轮回神经收罗（RNN）、短万古哀痛收罗（LSTM）和Transformer来处理一些要津部分，但这些本领仍处于早期阶段。

面对一些更复杂的情况，如方言和多音轨的杂音，模子依然存在局限性，因为检会数据不够全面，模子才略有限。

从审核机制来看，问题就更较着了。一位本领一又友提到：

2018年，有一则新闻，本日头条的创举东谈认识一鸣发表了一封公开信，呈报“内涵段子”被关停的事件。在信中，他提到为了弥补算法和机器审核的不及，需要加强东谈主工运营和审核，将6000东谈主的审核团队扩大到10000东谈主。

通常，快手当年也遴选了肖似圭表，将2000东谈主的审核团队膨胀到5000东谈主。他们都厚实到，在“算法是否具备价值瞻念”的问题上，必须加大参加。

当年视频靠近的问题，咫尺AI语音也碰到了。

平台审核机制分为两部分：机器审核和东谈主工审核。机器审核能快速识别较着非法的骨子，但对于依稀、复杂的骨子，机器可能判断不准确，就要东谈主工审核。

AI语音的复杂性不亚于视频，不同语种、口音、语速等都会影响识别成果。要逐帧处理这些身分，何况应酬AI生成的以伪乱真的音频，是一项极大的挑战。

你想想看，用AI生成一个音频，再让它我方识别是AI生成的，这种轮回无疑是对本领的极大进修。

要想终了“魔法击败魔法”的成果，平台要参加更多资金和资源，这不仅贫瘠，还要时辰；因此，咱们正处在一个本领、伦理与监管并行发展的新阶段。

四

一个在大厂使命的一又友告诉我，咫尺传播骨子的平台针对这种“灰度空间”有三种处理办法：

第一，查验元数据是否有隐性标记。

所谓隐性标记，即音频里用来细目骨子的来源或生成的款式，咫尺，这项本领依然有所发展和应用。

肖似于字节擢升早年自研的荫藏水印算法，咫尺依然应用到各式居品上。本年3月14—15日，中国东谈主工智能产业发展定约（AIIA）发布了“信元令”数字隐写标记平台，也在自傲奉行。

浅易来说，他们都在治理归并个问题，即让AIGC生成的骨子自带标记，这种标记东谈主看不到，本领却看取得。

第二个办法，提醒用户自行添加说明。

若是平台未检测到隐性标记，会提醒用户主动表明骨子来源。你可能也见过在发布骨子时，不错遴荐标注“取自收罗”“AI生成”或“原创拍摄”。

用户不想我方声明，也莫得隐性标记，那平台会进行第三种办法：抽样检测。一朝发现语音中有AI的思路，就会顺利添加提醒标记。

了解了这些，你就能理解，为什么有些视频下方会出现“疑似使用AI生成本领，请留神甄别”的指示。为什么说是“疑似”呢？因为咫尺AI还无法皆备准确地识别另一个AI生成的骨子。

不外，有一个前提：除非某个骨子真的激发了平庸关心和宽广公论，平台才会主动干涉。不然，面对海量骨子，平台很难作念到逐个审核。

是以，珍惜AI语音，不仅仅个东谈主和企业的拖累，更要本领提供商和社会各界一谈辛勤。

在深度伪造泛滥的期间，雷军成为了国内第二个因AI语音作秀而受到影响的东谈主，咱们望望段子就好，千万不要成为传播的始作俑者。

讲究

AI正在师法真东谈主。

我想提醒各人，在网上浏览视频时，要多留一个心眼，最佳不要默许一切都是的确的。本领无罪，生怕别有精心，但愿咱们能理智地使用它，鼓励社会向积极的标的发展。

本文来自微信公众号：王智远，作家：王智远

上一篇：聚色阁男东说念主有这4个施展，意味着他驱动腻了，别后知后觉下一篇：聚色阁地舆天机秘传

中国成人网