AI 安全面试题目
AI 安全方向分为两类:用 AI 手段做安全(AI 赋能安全),以及保护 AI 系统本身的安全(AI 自身安全)。面试中两类都会考,需要同时具备安全基础和 AI 基础知识。
AI 基础
-
★★☆☆☆ 机器学习、深度学习、大语言模型(LLM)的区别?
提示:机器学习靠特征工程,深度学习靠神经网络自动提取特征,LLM 是基于 Transformer 的超大规模预训练模型。
-
★★★☆☆ 深度学习相较于经典机器学习的优劣势?
提示:优势是特征提取自动化、准确率高;劣势是需要大量数据、计算成本高、可解释性差。
-
★★★☆☆ 什么是 AI 可解释性?为什么在安全场景中重要?
提示:能解释模型决策的 Why/How/What,避免黑盒决策导致误封、绕过等问题,监管合规也需要。
AI 自身安全
-
★★★☆☆ AI 对抗攻击(Adversarial Attack)有哪些类型?
提示:白盒(FGSM、PGD、C&W)、黑盒(替代模型攻击、ZOO);目标是让模型做出错误预测。
-
★★★☆☆ 什么是数据投毒攻击(Data Poisoning)?如何防御?
提示:污染训练数据导致模型行为异常;防御靠数据来源验证、异常样本检测。
-
★★★★☆ Prompt Injection 的原理和危害?
提示:构造特殊 Prompt 使模型忽略系统指令,导致数据泄漏、越权操作、内容绕过。
-
★★★★☆ LLM 的主要安全风险有哪些?
提示:Prompt Injection、数据外泄(训练数据记忆)、幻觉(输出错误信息)、Agent 越权执行。
-
★★★★☆ 如何保护大模型不泄露训练数据中的敏感信息?
提示:差分隐私(DP)训练、数据脱敏、成员推断攻击检测、输出过滤。
AI 赋能安全
-
★★★☆☆ AI/LLM 在哪些安全场景下效果比较好?
提示:意图识别、日志解析与告警研判、钓鱼邮件检测、代码安全审计、威胁情报摘要。
-
★★★☆☆ 如何用 LLM 提升安全运营效率?
提示:告警自动研判、安全知识库问答、事件响应辅助(SOAR+LLM)、自然语言驱动规则生成。
-
★★★★☆ 如何平衡 AI 在安全场景中的效率收益和安全风险?
提示:最小权限接入、Agent 调用链审计、降低对模型原始知识的依赖、在特定受控场景中使用。
-
★★★★☆ 在内容安全(UGC)场景中,AI 模型如何识别变形文字攻击?
提示:音系变化(同音字、拼音缩写)、形变(特殊字符、形近字)、语序变化(乱序、间隔符)。
-
★★★★☆ 图片仿冒场景(假证件、截图篡改)中,有哪些检测手段?
提示:摩尔纹检测(拍摄屏幕)、边框与反光特征、哈希比对、数字水印验证。
Multi-Agent 与未来
-
★★★★☆ Multi-Agent 协同场景下有哪些新的安全问题?
提示:Agent 间的权限隔离、调用链审计、恶意 Agent 注入、数据污染跨 Agent 传播。
-
★★★★★ 如何设计一套面向 Agent 执行环境的安全架构?
提示:工具调用权限模型、沙箱隔离、运行时约束、调用链可观测、异常行为熔断。