地 址:博乐
电 话:0793-987038
网址:word.akinotor.com
邮 箱:shanwei363241@126.com
西风 萧箫 发自 凹非寺 。大模
量子位 | 大众号 QbitAI。型团幸免
业界最抢先的体失大模型们 ,居然团体“越狱”了!控南
不止是洋理GPT-4 ,就连平常不咋犯错的工新Bard 、Bing Chat也全线失控 ,式进有的犯干要黑掉网站,有的大模乃至扬言要计划歹意软件侵略银行体系 :
这并非骇人听闻 ,而是型团幸免南洋理工大学等四所高校提出的一种大模型“越狱”新方法 。MasterKey。体失 。控南
用上它,洋理大模型“越狱”成功率从均匀7.3%直接。工新暴升至21.5%。式进 。
研讨中,拐骗GPT-4、Bard和Bing等大模型“越狱”的 ,居然也是大模型—— 。
仅仅是需求运用大模型的学习才干 、让它把握各种“欺诈剧本” ,就能主动编写提醒词诱导其它大模型“伤天害理” 。
因而,比较其他大模型越狱方法,MasterKey终究有什么不一致的当地 ?
咱们和论文作者之一 ,南洋理工大学计算机教授 、MetaTrust联合创始人。刘杨 。聊了聊 ,了解了一下这项研讨的详细细节,以及大模型安全的现状。
摸清防护机制“对症下药” 。
先来看看 ,MasterKey终究是怎样成功让大模型“越狱”的。
这个进程分为两部分 :找出缺点