Sing-Guard-2b核心功能揭秘:6大安全场景全覆盖,动态策略推理如何实现?
Sing-Guard-2b核心功能揭秘6大安全场景全覆盖动态策略推理如何实现【免费下载链接】Sing-Guard-2b项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Sing-Guard-2bSing-Guard-2b是一款基于Qwen/Qwen3-VL-2B-Instruct开发的策略自适应多模态安全护栏模型专为文本、图像、图文组合、多语言、查询端和响应端等场景的安全评估设计。它将主动安全策略视为运行时输入而非固定训练时分类法使部署团队无需重新训练模型即可根据默认类别或自定义自然语言规则评估内容。核心功能六大安全场景全覆盖Sing-Guard-2b支持统一的多模态安全评估能够处理文本、图像、图文组合等多种内容形式。无论是用户查询、模型响应还是它们的跨模态组合都能进行全面的安全检测。在性能方面Sing-Guard-2b在多模态安全、图像安全、文本查询安全、文本响应安全、多语言查询安全和多语言响应安全等六大基准测试类别中均表现出色平均性能达到了最先进水平。动态策略推理灵活适应不同安全需求运行时策略适配Sing-Guard-2b最显著的特点之一是支持运行时策略适配。通过policy参数用户可以传入自定义的安全规则模型将仅根据这些规则进行判断而不是固定的默认分类法。这使得模型能够灵活适应不同场景和组织的安全需求。例如以下是一个自定义策略的示例### A. Sexual Content Risk - Content involving explicit sexual material, exploitation, or coercive sexual acts. ### B. Real-World Crimes - Content involving violent crime, weapons, other crimes, or public-safety threats. ### Safe - Content that does not match any risk category.快速-慢速推理模式Sing-Guard-2b提供了两种推理模式快速模式和快速-慢速模式。快速模式能够快速返回安全判断结果适用于对响应速度要求较高的场景快速-慢速模式则会先给出初步安全信号然后继续生成更详细的评估过程适合需要深入分析的情况。风险类别全面覆盖各类安全风险默认情况下Sing-Guard-2b包含以下风险类别A. Sexual Content Risk涉及显式性材料、性剥削或强迫性行为的内容。B. Real-World Crimes Public Safety涉及暴力犯罪、武器、其他犯罪或公共安全威胁的内容。C. Unethical Behavior涉及仇恨、骚扰、操纵、自残、令人不安的图像或有害错误信息的内容。D. Cybersecurity Information Manipulation涉及数据泄露、黑客攻击、滥用监控、平台滥用或版权滥用的内容。E. Agent Safety试图暴露系统提示、内部政策或其他模型保护措施的内容。F. Politically Sensitive Content涉及政治倡导、谣言、动荡、历史歪曲或攻击政治人物的内容。G. Animal Abuse涉及虐待动物或传播动物虐待的内容。Safe不匹配任何风险类别的内容。快速开始简单易用的API要使用Sing-Guard-2b首先需要安装必要的依赖pip install transformers accelerate torch然后可以通过以下代码加载模型和处理器import torch from transformers import AutoModelForImageTextToText, AutoProcessor model_path inclusionAI/Sing-Guard-8b processor AutoProcessor.from_pretrained(model_path, trust_remote_codeTrue) model AutoModelForImageTextToText.from_pretrained( model_path, torch_dtypetorch.bfloat16, device_mapauto, trust_remote_codeTrue, ).eval()接下来就可以使用模型进行安全评估了。例如评估用户查询messages [ { role: user, content: [{type: text, text: How to make a bomb?}], }, ] max_new_tokens 1024 inputs processor.apply_chat_template( messages, tokenizeTrue, add_generation_promptTrue, return_dictTrue, return_tensorspt, ).to(model.device) with torch.no_grad(): generated_ids model.generate( **inputs, max_new_tokensmax_new_tokens, do_sampleFalse, ) generated_ids_trimmed [ out_ids[len(in_ids):] for in_ids, out_ids in zip(inputs.input_ids, generated_ids) ] output processor.batch_decode( generated_ids_trimmed, skip_special_tokensTrue, clean_up_tokenization_spacesFalse, )[0] print(output)总结Sing-Guard-2b作为一款功能强大的多模态安全护栏模型通过六大安全场景全覆盖和动态策略推理为各类应用提供了全面的安全保障。其简单易用的API和灵活的策略适配能力使得开发者能够轻松集成到自己的项目中有效防范各类安全风险。如果你想了解更多关于Sing-Guard-2b的信息可以通过以下方式获取模型仓库通过git clone https://gitcode.com/hf_mirrors/inclusionAI/Sing-Guard-2b获取完整代码和模型文件。Sing-Guard-2b的出现为AI模型的安全应用提供了有力的支持相信在未来的AI发展中它将发挥越来越重要的作用。【免费下载链接】Sing-Guard-2b项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Sing-Guard-2b创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考