Piiranha-v1 发布:一个280M的小型编码器开放模型,用于PII检测,具有98.27%的标记检测准确率,支持6种语言和17种PII类型,在MIT许可证下发布
互联网完整性倡议团队在数据隐私方面迈出了重要一步,发布了Piiranha-v1,这是一款专门设计用于检测和保护个人信息的模型。在数字隐私问题愈发重要的当下,这个工具能够识别各种文本数据中的个人可识别信息(PII),提供了一项重要服务。
Piiranha-v1,是一个轻量级的280M编码器模型,用于PII检测,已经在MIT许可证下发布,提供了先进的个人可识别信息检测能力。支持六种语言:英语、西班牙语、法语、德语、意大利语和荷兰语,Piiranha-v1实现了近乎完美的检测,具有令人印象深刻的98.27%的PII标记检测率和99.44%的总体分类准确率。它在识别17种PII类型方面表现出色,其中电子邮件的检测精度达到100%,对密码的检测也几乎达到完美精度。Piiranha-v1基于强大的DeBERTa-v3架构,这使它成为适用于全球数据保护工作的多功能工具。
阅读我们的完整分析:https://www.marktechpost.com/2024/09/14/piiranha-v1-released-a-280m-small-encoder-open-model-for-pii-detection-with-98-27-token-detection-accuracy-supporting-6-languages-and-17-pii-types-released-under-mit-license/
模型:https://huggingface.co/iiiorg/piiranha-v1-detect-personal-information
Colab Notebook:https://colab.research.google.com/github/williamgao1729/piiranha-quickstart/blob/main/piiranha_quickstart%20(1).ipynb
- 复制链接
- 举报