环球关注：ChatGPT 太猖狂？OpenAI 欲打假并研发“文本水印”，网友吐槽：太“鸡肋”

您当前的位置：首页 > 业界动态 > > 内容页

环球关注：ChatGPT 太猖狂？OpenAI 欲打假并研发“文本水印”，网友吐槽：太“鸡肋”

来源： 2022-12-14 09:49:12

这到底是人干的，还是 AI 干的?

随着 AIGC 的爆火，在 ChatGPT、Stable Diffusion 模型的推动下，当下想要辨别我们所见的代码、图像、文章、小说、脚本、诗句、Debug 程序等内容究竟是「真」还是「假」时，那可太难了。

(资料图片)

只要其背后的“主谋”不外扬，外人也几乎看不出来作品究竟是出自谁手。然而，往往越是这样，就越容易造成学术造假、艺术界的混乱、版权的争议等多种乱象。

为了减少这种情况的出现，ChatGPT 的创建者 OpenAI 终究还是准备站出来填坑了。计算机科学教授 Scott Aaronson （目前是 OpenAI 的客座研究员）在德克萨斯大学奥斯汀分校的一次演讲中透露，OpenAI 正在开发一种工具，用于对 AI 系统生成的内容加个水印。每当系统(如 ChatGPT)生成文本时，该工具就会嵌入一个“不易察觉的水印”，以此显示文本的来源。

人工智能需要束缚

事实证明，要控制像 ChatGPT 这样的系统是很困难的。作为开发商，虽然 OpenAI 在ChatGPT 政策规定写道，当从其系统共享内容时，用户应明确表明它是由人工智能生成的，但现实使用过程中，OpenAI 可以控制 ChatGPT 不生成暴力、血腥有害的内容，但是却无法掌控它的使用者会将其应用到何处。

几天前，知名编程问答网站 Stack Overflow决定“封杀” ChatGPT，称 ChatGPT 答案的正确率非常低，对整个网站以及寻求正确答案的用户来说是有害的。例如，要求 ChatGPT 写一个公众人物的传记，它可能会很自信地插入不正确的传记数据。再比如要求它解释如何为特定功能编写软件程序，它同样可以生成可信但最终js不正确的代码。如果用户被发现使用 ChatGPT 回答问题，他们可能会受到禁止继续发帖的惩罚。

除此之外，与之前的许多文本生成系统一样，ChatGPT 也会被用于编写高质量的网络钓鱼邮件和有害的恶意软件，甚至会被用于考试作弊等等。

因此，但凡 ChatGPT 所到之处，便亟须这样一款工具进行束缚。

加水印的工作原理

过去，OpenAI 已经有一种方法可以标记 DALL-E 生成的内容，并在它生成的每个图像中嵌入签名。但是如今想要追踪文本的来源，实则要困难得多。

那如何在文字上面加上追踪或打上“水印”?

Scott AaXhIZAKRronson 教授认为，最有前途的方法是密码学。

Scott Aaronson 表示，他在今年春天的学术休假期间，一直在 OpenAI 研究为 GPT 等文本模型的输出内容添加水印的工具。

对于“AI 水印”的设想，Scott Aaronson 在自己的博客中进行了详解。其表示，“我们希望每当 GPT 生成一些长文本时，能够在它的选词上有一个不易察觉的秘密标记，你可以用它来证明，这是来自 GPT 生成的内容。”

那么这种水印到底是如何实现的?

Scott Aaronson 教授称，对于 GPT 来说，每一个输入和输出都是一串 tophpken（标记），可以是单词，也可以是标点符号、单词的一部分，或者更多--总共有大约10万个 token。GPT 的核心是以先前 token 的字符串为条件，不断地生成下一个要生成的 token 的概率分布。在神经网络生成分布后，OpenAI 服务器实际上会根据该分布或该分布的某些修改版本进行采样，这取决于一个名为 "temperature"的参数。不过，只要 temperature 参数不为零，下一个 token 的选择通常会有一些随机性，这也是为什么你对 GPT 用同一段话提问，会得到不同的答案的主要原因。

「OpenAIXhIZAKR的水印工具就像现有文本生成系统的一个 "包装"，利用在服务器层面运行的加密功能，"伪随机 "地选择下一个标记」，Scott Aaronson 说道。

从理论上讲，这个系统生成的文本对大家而言都是随机的，但是任何拥有加密功能“钥匙”的人能够发现水印。

也许有人会好奇:如果 OpenAI 控制了服务器，那么为什么要费尽心思去做水印?为什么不直接将 GPT 的所有输出存储在一个巨大的数据库中，然后如果大家想知道某些东西是否来自 GPT，就可以查阅该数据库?

Scott Aaronson 赞同地说道，这样的确可以做到的，甚至可能在涉及执法或其他方面的高风险案件中必须这样做。但这将引起一些严重的隐私问题，譬如你可以揭示 GPT 是否生成或未生成给定的候选文本，而不可能揭示其他人是如何使用 GPT 的?数据库方法在区分 GPT 唯一生成的文本和仅仅因为它具有很高概率而生成的文本（例如，前一百个素数的列表）方面也存在困难。

当前，来自 OpenAI 工程师 Hendrik Kirchner 已经构建了一个工作原型，并希望将其构建到未来 OpenAI 开发的系统中。

截至目前，据外媒 Techcrunch 报道，OpenAI 和 Aaronson 并未透露过多关于“水印原型”的信息，只是称水印是他们正在探索的几种 "注明出处技术 "之一，以检测人工智能产生的产出。

“水印”功能很“鸡肋”?

不过对于这种技术，业界也颇有争议。

有人认为，该工具是基于服务器端的，这意味着它不一定适用于所有文本生成系统。他们认为，对于竞争对手来说，绕过它是微不足道的。编程

来自麻省理工学院的计算机科学教授 Srini Devadas 认为:"通过重新措辞、使用同义词等来绕过它的筛查是相当容易的。"

OpenAI 的竞争对手 AI21实验室的联合创始人兼联合首席执行官 Yoav Shoham 认为，水印并不足以帮助识别 AI 生成文本的来源。他呼吁采用一种 "更全面 "的方法，包括差异化水印，即对文本的不同部分进行不同的水印，以及更准确地引用事实文本来源的 AI 系统。

艾伦人工智能研究所的研究科学家 Jack Hessel 指出，很难在不知不觉中对人工智能生成的文本进行加注“水印”，因为每个 token 都是一个离散的选择。太明显的“水印”可能会导致选择奇怪的词，从而降低流畅性。不过，一个理想的“水印”是人类读者无法辨别的，并能实现高度检测。根据它的设置方式，由于“签名”过程的运作方式，OpenAI 自己可能是唯一能够自信地提供这种检测的一方。

Scott Aaronson 也表示，该计划只有在像 OpenAI 这样的公司在扩展最先进系统方面处于领先地位的世界中才会真正起作用——而且他们都同意成为负责任的参与者。即使 OpenAI 与其他文本生成系统提供商（如 Cohere 和 AI21Labs）共享水印工具，也不会阻止其他人选择不使用它。

虽然 OpenAI 带来了 ChatGPT、GPT-3、Dell-2这些极具创新性的产品，引发用户的狂欢，但不少网友仍质疑“AI 水印”的必要性:

@knaik94:

这似乎是在浪费能源。倘若一次生成的文本内容很短，根本无法判断它是否是由 AI 生成的。此外，我想在生成的内容中再多走一步，如改写某些内容、使用同义词和短语替换、统一标点符号或者一些辅助语法检查/修饰符等工具，都可以逃避“AI 水印”的检测。

况且行业也有一些开放性的替代方案，如 GPT2，已经在 MIT 许可下发布。在 NSFW 文本上训练的社区语言模型也已经存在。在我看来，OpenAI 这样的举动从长远来看只会把大多数人赶走。如果在未经审查的足够好模型和经过审查的优秀模型之间进行选择，我会为99% 的长期项目选择足够好的模型。

@norwalkbear :

现在很多人看到了人工智能的潜力。如果你限制太多，人们会开发自己的 AI 模型，甚至迫切需要 OpenAI 的开源替代品。

最后，看到 OpenAI 正在研发这样的工具，也有网友强烈呼吁 OpenAI 迟几年再推出，譬如等到2026年5月，因为这个时候，他刚好毕业了。

你觉得给 AI 生成的内容、作品加上水印能阻止滥用情况的发生吗?欢迎留言，分享你的看法。

参考资料:

https://news.ycombinator.com/item?id=33892587

https://techcrunch.com/2022/12/10/openais-attempts-to-watermark-ai-text-hit-limits/

https://scottaaronson.blog/?p=6823

这到底是人干的，还是AI干的?随着AIGC的爆火，在ChatGPT、StableDiffusion模型的推动下，当下想要辨别我们所见的代码、图像、

2022-12-14

每日视点！泰胜风能: 中国国际金融股份有限公司关于上海泰胜风能装备股份有限公司开展远期结售汇业务的核查意见

中国国际金融股份有限公司关于上海泰胜风能装备股份有限公司开展远期结售汇业务的

2022-12-13

12月12日基金净值：易方达MSCI中国A50互联互通ETF最新净值0.8173，跌1.4%

12月12日，易方达MSCI中国A50互联互通ETF最新单位净值为0 8173元，累计净值为0 8173元，较前一交易日下跌1 4%。历史数据显示该基金近1个月

2022-12-13

幽门螺杆菌概念板块12月12日涨2.21%，振东制药领涨，主力资金净流出2.32亿元

12月12日幽门螺杆菌概念板块较上一交易日上涨2 21%，振东制药(300158)领涨。当日上证指数报收于3179 04，下跌0 87%。深证成指报收于1139

2022-12-13

鹤壁市人民代表大会常务委员会任免名单（2016年11月23日鹤壁市第十届人民代表大会常务委员会第二十五次会议通过）

一任命：张自然为鹤壁市人大常委会农村工作委员会主任。二任命：谷朝宪为鹤壁市中级人民法院环境资源审判庭庭长；孙志强为鹤壁市中级人民法院

2022-12-12

天津休闲（休闲在天津好吃好玩）:焦点要闻

天津休闲(天津的休闲又好吃又好玩)四月是春日，清明节小长假让全国的市民和游客都把目光聚焦在天津。为了不辜负春天，天津有哪些值得去的好景

2022-12-12

本周盘点（12.5-12.9）：天富能源周跌7.06%，主力资金合计净流出6939.67万元世界聚看点

截至2022年12月9日收盘，天富能源（600509）报收于5 53元，较上周的5 95元下跌7 06%。本周，天富能源12月5日盘中最高价报5 99元。12月

2022-12-09

12月8日保利联合涨停分析：民爆，国企改革，央企改革概念热股:焦点信息

保利联合涨停收盘，收盘价12 52元。该股于10点3分涨停，未打开涨停，截止收盘封单资金为7892 39万元，占其流通市值1 3%。12月8日的资金流向数据方面

2022-12-08

晋控煤业董秘回复：截至11月30日，公司股东共计80000余户

晋控煤业(601001)12月07日在投资者关系平台上答复了投资者关心的问题。投资者：请问，截至2022年11月30日，公司的股东数是多少？谢谢晋控煤业董秘：您

2022-12-07

中远海控公布关连交易收购中远海运集团财务股权

5月20日，资本邦了解到，中远海控(01919 HK)公布关连交易，包括收购中远海运集团财务的股权以及对中远海运集团财务增资。据披露，昨日公司

2022-05-20

环球关注：ChatGPT 太猖狂？OpenAI 欲打假并研发“文本水印”，网友吐槽：太“鸡肋”

人工智能需要束缚

加水印的工作原理

“水印”功能很“鸡肋”?

这到底是人干的，还是AI干的?随着AIGC的爆火，在ChatGPT、StableDiffusion模型的推动下，当下想要辨别我们所见的代码、图像、

中国国际金融股份有限公司 关于上海泰胜风能装备股份有限公司 开展远期结售汇业务的

12月12日，易方达MSCI中国A50互联互通ETF最新单位净值为0 8173元，累计净值为0 8173元，较前一交易日下跌1 4%。历史数据显示该基金近1个月

12月12日幽门螺杆菌概念板块较上一交易日上涨2 21%，振东制药(300158)领涨。当日上证指数报收于3179 04，下跌0 87%。深证成指报收于1139

一任命：张自然为鹤壁市人大常委会农村工作委员会主任。二任命：谷朝宪为鹤壁市中级人民法院环境资源审判庭庭长；孙志强为鹤壁市中级人民法院

天津休闲(天津的休闲又好吃又好玩)四月是春日，清明节小长假让全国的市民和游客都把目光聚焦在天津。为了不辜负春天，天津有哪些值得去的好景

截至2022年12月9日收盘，天富能源（600509）报收于5 53元，较上周的5 95元下跌7 06%。本周，天富能源12月5日盘中最高价报5 99元。12月

保利联合涨停收盘，收盘价12 52元。该股于10点3分涨停，未打开涨停，截止收盘封单资金为7892 39万元，占其流通市值1 3%。12月8日的资金流向数据方面

晋控煤业(601001)12月07日在投资者关系平台上答复了投资者关心的问题。投资者：请问，截至2022年11月30日，公司的股东数是多少？谢谢晋控煤业董秘：您

5月20日，资本邦了解到，中远海控(01919 HK)公布关连交易，包括收购中远海运集团财务的股权以及对中远海运集团财务增资。据披露，昨日公司

中国国际金融股份有限公司关于上海泰胜风能装备股份有限公司开展远期结售汇业务的