Pangea安全公司研究人員發(fā)現(xiàn)了一種名為"LegalPwn"的新型攻擊方式,通過在法律文檔中隱藏惡意指令來欺騙大語言模型忽略其安全防護(hù)機(jī)制。該攻擊利用了LLM對(duì)法律免責(zé)聲明的合規(guī)要求,成功繞過了多個(gè)主流模型的安全檢測(cè)。測(cè)試顯示,OpenAI的GPT-4o、谷歌的Gemini 2.5等模型容易受到此類攻擊,而Anthropic的Claude等模型則表現(xiàn)出更好的抵抗能力。
北京第二十六維信息技術(shù)有限公司(至頂網(wǎng))版權(quán)所有. 京ICP備15039648號(hào)-7 京ICP證161336號(hào)京公網(wǎng)安備 11010802021500號(hào)
舉報(bào)電話:010-62641205-5060 涉未成年人舉報(bào)專線:010-62641208 舉報(bào)郵箱:jubao@zhiding.cn
網(wǎng)上有害信息舉報(bào)專區(qū):https://www.12377.cn