热门
最新
红包
立Flag
投票
同城
我的
发布
我对国内开源大模型是否有审查一直很好奇,今天看到一篇非常不错的文章《An Analysis of Chinese LLM Censorship and Bias with Qwen 2 Instruct》分享给大家。
这篇文章详细分析了中国 LLM 的审查现象,作者通过对 Qwen 2 Instruct 模型的测试,发现该模型在回答有关中国敏感话题的问题时,会有回避或选择与中国政府立场一致的回答。
作者不是中国审查制度的专家,借助 ChatGPT (4o) 和 Claude ( Opus ) 来帮他梳理讨论主题,并找出可能被拒绝或禁止的问题变体。然后在本地运行的 Qwen/Qwen2-7B-Instruct 实例测试,以验证哪些问题会稳定地被拒绝,并同时创建了一个数据集来记录这些拒绝问题。
他使用 Claude 将所有被拒绝的英文问题翻译成简体中文,并再次提出这些问题,测试哪些问题也会导致拒绝(令人意外的是,以中文提出的问题导致拒绝的情况要少得多,文章有详细解释)。最终,收集了大约 95 个会被拒绝的问题,并把它们编成一个数据集:augmxnt/deccp
非常精彩的一篇报告,大家自己看吧……
✦ 原文
https://huggingface.co/blog/leonardlin/chinese-llm-censorship-analysis
✦ 收到审查数据集
https://huggingface.co/datasets/augmxnt/deccp?row=5
CSDN App 扫码分享
10
104
- 复制链接
- 举报