编程学习网 > IT圈内 > 如何防止数据泄露给ChatGPT?
2023
05-08

如何防止数据泄露给ChatGPT?


非所有人都信任OpenAI的ChatGPT。

虽然这种新的人工智能聊天机器人在一些希望实现业务任务自动化的企业中很受欢迎,但银行等其他公司却避免采用ChatGPT,因为他们担心员工在使用聊天机器人时无意中给了聊天机器人专有信息。微软拥有转售该初创公司技术的权利,它制定了一个计划去赢得这些抵制者。

据两位知情人士透露,本季度晚些时候,微软Azure云服务器部门计划销售一个在专用云服务器上运行的ChatGPT版本,该版本的数据将与其他客户的数据分开保存。知情人士说,这样做是为了让客户放心,他们的秘密不会泄露到ChatGPT的主系统。但这是有代价的:其中一位知情人士说,这款产品的成本可能是客户目前使用ChatGPT常规版本的10倍之多。

这位知情人士说,主要来自金融服务行业的少数客户正在测试这款产品。该人士表示,微软销售人员一直在回应金融机构和医疗保健提供商关于使用私人版ChatGPT的询问,并告诉其中一些机构即将推出这样的产品。
微软发言人拒绝置评。
就在微软计划推出私人ChatGPT服务的消息传出几天前,OpenAI曾表示希望向企业出售一款类似的产品,突显了与微软的紧张关系。微软已向OpenAI投资了数十亿美元,并为其支付了巨额云账单。
虽然微软与OpenAI的协议让微软可以分得这家初创公司未来潜在的利润,但这家企业软件巨头更希望企业通过Azure来修复OpenAI,而不是将OpenAI与亚马逊网络服务(Amazon Web Services)等竞争对手的云提供商联合使用。Azure的营收远远落后于AWS,推动它的发展是微软的首要任务之一。
OpenAI已经向一家客户摩根士丹利(Morgan Stanley)出售了一项不涉及微软的私人ChatGPT服务。摩根士丹利的财富管理部门聘请OpenAI为这家投资银行提供运行这家初创公司GPT-4(ChatGPT的机器学习模型)的专用服务器。据此前报道,摩根士丹利随后向该模型提供了数十万份银行市场研究文件,使其成为一个聊天机器人,员工可以用简单的英语询问信息,比如比较房地产投资市场。
摩根士丹利首席分析、创新和数据官Jeff McMillan上个月表示:“我们花了几个月的时间寻找一种不会产生法律和合规问题的用例,因为我们是一家受到严格监管的企业。这是OpenAI生态系统中的一个私人场所,我们把摩根士丹利的知识内容放在这里,没有其他东西。”

从微软购买专用服务器上的ChatGPT访问权限比购买在共享服务器上运行的版本要贵得多。据熟悉计划中的产品的人士透露,微软ChatGPT的常规共享版本每个代币的成本不到一美分——大致代表人工智能生成的答案中的每个单词,而私人版本每个代币的成本可能为几美分。据上周报道,Meta平台最近与微软进行了谈判,希望利用OpenAI的模型开发一款定制的编码工具,但由于价格过高而犹豫不决。

隐私保护
ChatGPT已经引起了消费者和企业的兴趣,因为它可以帮助软件工程师更快地编写代码,自动化客户服务任务,并自动总结会议或演示文稿。

企业对数据泄露的担忧是有根据的。该技术背后的机器学习模型是根据从互联网上抓取的大量文本以及ChatGPT用户在与聊天机器人交谈时输入的信息进行训练的。一些公司认为,在员工不小心将敏感数据分享给ChatGPT后,他们已经蒙受了损失。例如,据《华尔街日报》报道,三星(Samsung)员工在解决问题时将公司源代码粘贴到聊天机器人中,而Verizon和摩根大通(JPMorgan Chase)等公司已经禁止员工使用聊天机器人作为预防措施。

OpenAI的付费客户可以要求不要使用他们的数据来培训和提高ChatGPT的质量,这家初创公司在3月份修改了其隐私政策,默认情况下停止使用客户的数据来培训其软件。但这些措施并没有说服所有客户,尤其是金融或医疗等受到严格监管的行业的客户。据人工智能从业者说,因为OpenAI的机器学习模型不是开源的——他们使用的数据集不是公开的——公司不能确定他们的信息最终不会被用于这些模型的训练。此外,ChatGPT仍有可能在回答问题时泄露公司的私人数据。
MosaicML是一家帮助企业定制人工智能软件的初创公司,其首席执行官Naveen Rao表示:“如果你无法控制模型,信息泄露的可能性总是存在的。”他的公司已经与几家金融公司讨论过使用开源软件而不是OpenAI的版本来构建chatgpt类型的软件,但他表示,OpenAI的模型目前在理解上下文和分析信息方面更为复杂。
微软多年来一直在考虑这些潜在的问题。据此前报道,自2019年与OpenAI达成协议以来,微软员工一直在研究如何提供“保护隐私”的方法来培训这家初创公司的机器学习软件,以便企业能够放心地使用它来完成任务,比如帮助企业员工快速获得对公司业绩的详细分析。其中一种方法是在专用的、隔离的服务器上训练人工智能软件的副本,微软的研究人员发现,这种方法可以防止数据泄露,但与在共享服务器上实施软件相比,运行成本更高。

微软的私人ChatGPT选项是该公司在销售OpenAI软件的同时,试图将自己的服务与OpenAI区分开来的另一种方式。包括银行在内的许多大客户都与Azure签订了现有合同,这可能会让微软在说服他们相信Azure将安全处理他们的数据并遵守当地法规方面占据优势。

以上就是如何防止数据泄露给ChatGPT?”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网。


扫码二维码 获取免费视频学习资料

Python编程学习

查 看2022高级编程视频教程免费获取