我对国内开源大模型是否有审查一直很好奇，今天看到一篇非常不错-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truealgorithmgeek

我对国内开源大模型是否有审查一直很好奇，今天看到一篇非常不错的文章《An Analysis of Chinese LLM Censorship and Bias with Qwen 2 Instruct》分享给大家。

这篇文章详细分析了中国 LLM 的审查现象，作者通过对 Qwen 2 Instruct 模型的测试，发现该模型在回答有关中国敏感话题的问题时，会有回避或选择与中国政府立场一致的回答。
作者不是中国审查制度的专家，借助 ChatGPT (4o) 和 Claude ( Opus ) 来帮他梳理讨论主题，并找出可能被拒绝或禁止的问题变体。然后在本地运行的 Qwen/Qwen2-7B-Instruct 实例测试，以验证哪些问题会稳定地被拒绝，并同时创建了一个数据集来记录这些拒绝问题。

他使用 Claude 将所有被拒绝的英文问题翻译成简体中文，并再次提出这些问题，测试哪些问题也会导致拒绝（令人意外的是，以中文提出的问题导致拒绝的情况要少得多，文章有详细解释）。最终，收集了大约 95 个会被拒绝的问题，并把它们编成一个数据集:augmxnt/deccp

非常精彩的一篇报告，大家自己看吧……
✦ 原文
 https://huggingface.co/blog/leonardlin/chinese-llm-censorship-analysis
✦ 收到审查数据集
https://huggingface.co/datasets/augmxnt/deccp?row=5

CSDN App 扫码分享

分享

10

104

复制链接
举报

下一条：

10/ AgentGym一个新框架，具有各种环境和任务，用于广泛、实时和并发的智能体探索；构建一个具有自我进化能力的通用LLM（大语言模型）智能体，并探索其在任务和环境中超越以往数据的潜力。https://x.com/arankomatsuzaki/status/1798904095669121443