借助数学来越狱LLM这个论文有意思,把不安全的内容包装成数学问题,然后就能越狱LLM。原理是向量化之后,原始问题和数学编码后的问题之间存在着明显的语义偏移。论文:https://arxiv.org/abs/2409.11445