会议内容被拿去训练大模型!Zoom:我的AI功能可不“白给”


整理 | 褚杏娟、核子可乐

最近,流行的视频会议平台 Zoom 对其服务条款进行了重大更改,这在其庞大的用户群中引发了强烈担忧。

通过此次更改,Zoom 获得了使用用户数据来训练人工智能 (AI) 的许可。更新后的条款授予 Zoom 针对客户内容的“永久性、全球性、非排他性、免版税、可再许可和可转让的许可”,并延伸到“机器学习”和“人工智能”等目的。也就是说,Zoom 可以使用特定的用户数据来增强机器学习或人工智能,包括算法训练和调整。

这些变化最初是由以开发者为中心的网站 Stack Diary 发现的,不久之后,该消息就在网上引发了激烈的争论。许多用户对 Zoom 将客户数据用于人工智能的决定表示愤怒,而 Zoom 将数据用于人工智能和机器学习细节的不透明进一步加剧了人们的恐慌。

“Zoom 还能相信吗?”

该公司的法律文件将用户的视频、音频和聊天记录统称为“客户内容”。该公司对“服务生成数据”也保留类似的权利,其中包括遥测数据、产品使用数据、诊断数据以及通过分析用户内容 / 行为获取的其他信息。

“许多与医院 / 治疗师 / 等进行的远程医疗操作都使用 Zoom——我怀疑是因为他们的客户可以通过浏览器在没有应用程序或账户的情况下进行连接。当您通过浏览器加入到 Zoom 会话时,您无需签署 TOS(Terms of Service,服务条款)。我认为,获得许可的医疗机构都有自己的 TOS 条款,这些条款与 HIPPA 要求兼容。语音到文本转录等方面的培训……将是相当严重的隐私侵犯,特别是在医疗等服务范围内。一方面,存在对人工智能的明显攻击,以从中获取训练数据;另一方面,这些数据可能提供给正在验证其是否适合训练的员工 / 承包商访问。”网友“danShumway ”提出了自己的担忧。

注:TOS(Terms of Service,服务条款);HIPAA(Health Insurance Portability and Accountability Act《健康保险可携性和责任法案》)由美国第 104 届国会制定,并由比尔·克林顿总统于 1996 年 8 月 21 日签署通过。

虽然有网友指出,Zoom 有针对 HIPPA 法规的特定版本。但仍有网友指出,医疗保健专业人员仍然使用传真。“模拟线路传真符合 HIPAA 标准,因为它不会‘存储’。”

“我认为问题不在于 Zoom 的安全措施是否经过审计,”网友 haldujai 说道,“而在于他们是否可以在法律不明确的情况下使用存储的 PHI 进行产品开发。”

Zoom 的服务条款更改也引发了大家对其他会议软件的担忧。“Google Meet 的 TOS 没有具体提到人工智能,但确实提到了使用客户数据来更广泛地“开发新技术和服务”。”有网友指出。

当有网友表示“值得庆幸的是,Jitsi Meet 的 TOS 中没有类似的内容”时,有人在帖子下指出,Jitsi Meet ToS 第 4 节授予了他们类似的权利,只是用了更模糊的语言。

“您授予 8×8 Inc(以及我们的合作伙伴)全球范围内的许可,允许其使用、托管、存储、复制、修改、创建衍生作品……传播、发布、公开表演、公开展示和分发此类内容,但仅限于以下目的:运营和使服务能够按您的预期运行的有限目的,不用于其他目的。”

该网友指出,每个运营视频会议服务的人都会在其服务条款中包含类似这样的条款。Zoom 变得更加明确,这通常是一件好事。如果 Jitsi 想要同样明确,他们可以添加一些内容来澄清这不包括训练人工智能模型。

引发大家强烈担忧的另外一个原因是,Zoom 在遵守消费者隐私承诺方面一直表现不佳。2020 年,Zoom 表示将只向付费用户提供端到端加密,但这种将隐私保护作为付费功能的行为受到强烈抗议而被迫作罢。一项诉讼称,该公司口头上表示向所有人提供端到端加密,但实际使用的却是另一种安全性更弱的加密形式(Zoom 随后解决了此问题)。

该公司还在客户不知情的情况下,向谷歌和 Facebook 共享用户数据。2021 年,Zoom 同意以 8500 万美元就这些问题及其他争议达成和解。上周,Zoom 又撕毁了居家办公政策,要求住在公司附近的员工每周至少要有两天到单位工作,作为一个生产在线办公产品的企业,此举让广大网友直呼“在线办公的时代已经结束”。

Zoom 回应了个寂寞

Zoom 的 AI 政策之前并不受关注,直到上周末相关帖子在高影响力的黑客新闻论坛上爆火,用户群体才普遍惊觉并表示愤怒。周一上午,Zoom 公司首席产品官 Smita Hashim 发表博文,称原则上该公司并没做过服务条款中描述的行为。

Hasim 澄清道,虽然该公司确实将数据用于某些机器学习目的,但“在 AI 方面,若未经客户同意,我们不会使用音频、视频或聊天内容来训练我们的模型。”然而值得注意的是,Zoom 也表示,如果用户选择使用 Zoom 的人工智能功能(例如会议摘要工具),他们将被要求允许共享该内容以进行人工智能培训。

也就是说,作为通话对象,我们如果想要使用 Zoom 的人工智能功能,那么就别无选择,只能同意 Zoom 的政策,允许 Zoom 利用我们的数据构建和训练模型。

当前,各行各业都在寻找 AI 的合适落地,Zoom 也不例外。Zoom 今年 3 月推出了“Zoom IQ”,一组能总结聊天线索并帮助用户根据书面聊天内容自动生成回复的功能。

Zoom IQ 包含多项功能,重点的是会议主持人能使用其生成会议纪要,并通过 Zoom 内置聊天功能 Zoom Team Chat 或电邮发送给与会者,不用对会议进行录影以便回顾。此外,用户还能使用 AI 协助其在聊天室里撰写讯息。该功能由 Open AI 驱动,会根据聊天内容创建讯息,并允许用户修改讯息语气或长度。

Zoom IQ 属于可选功能,在启用之后,Zoom 会默认开启一个小的复选框。而如果懒得点击取消,用户就相当于允许该公司收集数据并利用自己的数据构建 / 改进其 AI 模型。在启用 Zoom IQ 开始通话后,通话对话也会收到标题为“会议纪要已启用”的通知。弹出窗口显示“帐户所有者可能允许 Zoom 访问和使用您的输入与 AI 生成内容,以支持功能交付和 Zoom IQ 产品改进,包括用于模型训练。”

据悉,Zoom 利用了自己专有的大型语言 AI 模型,以及来自领先 AI 公司(如 OpenAI 和 Anthropic)和特定客户自己的模型。此前 Zoom 称,该公司“从用户与 Zoom IQ 功能的交互中收集数据,包括输入、消息和人工智能生成的内容”,并可以使用这些信息来训练 Zoom IQ 人工智能模型(但不能是第三方模型),除非用户选择不与 Zoom 共享数据。

近期,Zoom 针对大中型董事会、高层面试等场景,发布了新的智能导演功能。Zoom 的软件将聚焦于每个参与者的面部,并将他们的面部显示在屏幕上的一个框中,然后跟踪他们的移动。对此,Zoom 首席产品官 Smita Hashim 声称,其系统不会收集任何类型的生物识别数据,而只是检测镜头前的人是否具有必要比例。

未来,Zoom 还计划通过与 OpenAI 和 Anthropic 的合作推出其他几项人工智能驱动的功能,包括将以过往的会议、电话和电邮内容生成电邮草稿,以及一键整合聊天室的对话。据悉,Zoom 正在开发会议查询功能,用户可以在聊天室内向 AI 发问,AI 便会在不打断会议的情况下生成其错过的会议内容。

结束语

不可忽视的是,对于普通用户来说,Zoom 的进入门槛比同类中的任何其他应用程序都要低。许多人会认为,相对隐私,可用性可能更为重要。但这并不意味着我们要在数据隐私上做出妥协。

最近,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,并规定生成式人工智能服务提供者在进行预训练、优化训练等训练数据处理活动时,要使用具有合法来源的数据和基础模型;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;涉及知识产权的,不得侵害他人依法享有的知识产权等。

欧洲议会在 6 月份通过了《人工智能法案》(AI Act),成为全球首个监管 AI 的法律草案。该法案规定,AI 基础模型供应商如谷歌、微软等有义务公开披露所用材料是否受版权保护,从而提高版权及核心数字资产的价值。

随着人工智能在我们生活中应用地不断增多,怎么安全、放心地使用这些功能不仅是对厂商们的考验,更是我们对自己负责的表现。

参考链接:

https://gizmodo.com/zoom-ai-privacy-policy-train-on-your-data-1850712655

https://www.theverge.com/2023/6/5/23749338/zoom-ai-summaries-missed-meetings

https://news.ycombinator.com/item?id=37021160

https://shimo.im/outlink/gray?url=https://blog.zoom.us/zooms-term-service-ai/

 活动推荐

以「启航·AIGC 软件工程变革」为主题的 QCon 全球软件开发大会·北京站将于 9 月 3-5 日在北京•富力万丽酒店举办,此次大会策划了从 BI 到 BI+AI,新计算范式下的大数据平台、AIGC 浪潮下的研发效能提升、面向 AI 的存储、大前端融合提效、大模型应用落地、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近 30 个精彩专题。

现在购票即可享受 9 折优惠,立减 ¥880。咨询购票可联系票务经理 18514549229(微信同手机号)。

点击「阅读原文」即可查看全部专题,期待与各位开发者现场交流。  

今日荐文

英伟达、云厂商们也没有H100余粮了!未来全球顶级芯片缺口达40多万张


大模型的竞争格局与产品经理的未来机遇


英伟达挖走小鹏自动驾驶负责人;爱奇艺被曝VR业务停摆、全员欠薪;室温超导新进展:韩国学会称LK-99并非超导体 | AI一周资讯


GitHub工程师分享开发Copilot所采用的提示词工程


顶级黑客组织出手,将推出新的反数据收集开源框架Veilid:用Rust编写,已有10万行代码


解锁 Serverless 新进展:与 AIGC 结合会有哪些搞头?



你也「在看」吗? 👇