在简报《LLMbotomy:关闭特洛伊木马后门》中,Tamás Vörös 将讨论大型语言模型(LLM)如何迅速发展并需要强大的安全措施,我们的研究如何针对嵌入的威胁如特洛伊木马后门,并提出了一种新方法,通过对关键神经元进行有针对性的噪声化来中和LLM特洛伊木马,有效地阻止特洛伊木马激活,同时保留模型的功能和性能。注册请点击 >> https://bit.ly/3BcjdK6