谷歌破解了AI审核系统 破解者就是谷歌
(资料图)
谷歌研究团队正在进行一项实验,他们利用OpenAI的GPT-4来破解其他AI模型的安全防护措施。目前,该团队已经成功破解了AI-Guardian审核系统,并公开了相关技术细节。 AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,以及图片是否被其他AI修改过。如果检测到图片存在上述问题,系统会提示管理员进行处理。谷歌Deep Mind的研究人员Nicholas Carlini在一篇论文中,探讨了使用GPT-4设计攻击方法、撰写攻击原理的方案,并将这些方案用于欺骗AI-Guardian的防御机制。 据了解,GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian。例如,GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%降低到仅8%。 目前,相关技术文档已经发布,有兴趣的人可以前往了解。然而,AI-Guardian的开发者也指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也可能会进行相应的更新,因此谷歌的这套攻击方案在未来可能只能作为参考。
关键词:
相关阅读
-
谷歌破解了AI审核系统 破解者就是谷歌
谷歌研究团队正在进行一项实验,他们利用OpenAI的GPT-4来破解其他AI模 -
俄总长赴前线、提醒部队先发制人,乌毫...
图为俄罗斯武装力量总参谋长瓦列里·格拉西莫夫本期话题,俄武装力... -
幼儿园教师的年度工作计划
乐乐学教研网精心为你收集整理了幼儿园教师的年度工作计划(精选15篇) -
股骨头坏死怎么办?微创手术可“保髋”
湖南日报·新湖南客户端8月2日讯(通讯员韩志鹏)股骨头坏死也被称... -
女子修手机时相册被看 31 分钟,律师解读
你修手机时踩过哪些坑?7月31日,广东一位女子发视频称,自己的苹果手 -
俄罗斯方块2022什么时候出 公测上线时间预告
导读:最近很多玩家都在关注俄罗斯方块2022这款手游,想知道具体的公测 -
深入一线课堂,炼就过硬本领
基层是最好的课堂,实践是最好的教材。为进一步提高新录用工作人员的综 -
今日白银价格走势图最新预测(2023年8月2日)
白银价格(XAG UD)在接近24 40美元的盘中高点时下跌,周三早些时候难 -
恒大物业宣布8月3日复牌,对“134亿应收...
8月2日,恒大物业发布公告称,公司已履行复牌指引。公司已向联交所申请 -
《一吻倾城》腾讯视频即将开播,7月28日...
由杭州传影文化传媒有限公司,浙江项氏文化传媒有限公司出品,杭州棠乐文 -
大爆冷!国乒3连败日本,丁宁亲自坐镇场...
大爆冷!国乒3连败日本,丁宁亲自坐镇场外,与国乒小将合影留念,国乒, -
Meta Connect 2023定档9月27-28,主题...
编译 VR陀螺MetaConnect是Meta的开发者大会,今年活动将于当地时间9月2 -
社会调查研究的对象有哪些 社会调查研...
最佳答案社会调查研究的对象是社会现象、社会问题、社会状态、社会矛盾 -
报告:7月中国65城新房找房热度环比涨4....
7月中旬以来,伴随中央和地方对房地产市场密集发声,楼市预期小幅回升 -
荣耀Play7T Pro充一次电可以用一天吗
荣耀Play7TPro手机充一次电可以用一天吗荣耀Play7TPro手机充一次电可以 -
整合态香蕉线条病毒是如何产生的?该病...
随着研究技术的进步,在一些寄主植物,如柑橘、矮牵牛、甜菜、红树莓、 -
小米不按关机键怎么重启手机呢
小米手机有多种方法可以重启手机而不使用关机键。以下是一些常用的方法 -
巴萨希望用三名球员作为交换姆巴佩的筹码
根据这份报道的描述,一位“有影响力”的经纪人已经造访了大巴黎,... -
永辉超市澄清:不存在“京东洽谈全资收...
8月2日消息,最近有传闻称京东正与永辉接洽收购事宜,双方进行了至少一 -
多项税收优惠政策出台 支持小微企业融资
8月2日,财政部、国家税务总局发布多项税收优惠政策公告,支持小微企业