跳到主要内容

AI 安全面试题目

AI 安全方向分为两类:用 AI 手段做安全(AI 赋能安全),以及保护 AI 系统本身的安全(AI 自身安全)。面试中两类都会考,需要同时具备安全基础和 AI 基础知识。

AI 基础

  • ★★☆☆☆ 机器学习、深度学习、大语言模型(LLM)的区别?

    提示:机器学习靠特征工程,深度学习靠神经网络自动提取特征,LLM 是基于 Transformer 的超大规模预训练模型。

  • ★★★☆☆ 深度学习相较于经典机器学习的优劣势?

    提示:优势是特征提取自动化、准确率高;劣势是需要大量数据、计算成本高、可解释性差。

  • ★★★☆☆ 什么是 AI 可解释性?为什么在安全场景中重要?

    提示:能解释模型决策的 Why/How/What,避免黑盒决策导致误封、绕过等问题,监管合规也需要。

AI 自身安全

  • ★★★☆☆ AI 对抗攻击(Adversarial Attack)有哪些类型?

    提示:白盒(FGSM、PGD、C&W)、黑盒(替代模型攻击、ZOO);目标是让模型做出错误预测。

  • ★★★☆☆ 什么是数据投毒攻击(Data Poisoning)?如何防御?

    提示:污染训练数据导致模型行为异常;防御靠数据来源验证、异常样本检测。

  • ★★★★☆ Prompt Injection 的原理和危害?

    提示:构造特殊 Prompt 使模型忽略系统指令,导致数据泄漏、越权操作、内容绕过。

  • ★★★★☆ LLM 的主要安全风险有哪些?

    提示:Prompt Injection、数据外泄(训练数据记忆)、幻觉(输出错误信息)、Agent 越权执行。

  • ★★★★☆ 如何保护大模型不泄露训练数据中的敏感信息?

    提示:差分隐私(DP)训练、数据脱敏、成员推断攻击检测、输出过滤。

AI 赋能安全

  • ★★★☆☆ AI/LLM 在哪些安全场景下效果比较好?

    提示:意图识别、日志解析与告警研判、钓鱼邮件检测、代码安全审计、威胁情报摘要。

  • ★★★☆☆ 如何用 LLM 提升安全运营效率?

    提示:告警自动研判、安全知识库问答、事件响应辅助(SOAR+LLM)、自然语言驱动规则生成。

  • ★★★★☆ 如何平衡 AI 在安全场景中的效率收益和安全风险?

    提示:最小权限接入、Agent 调用链审计、降低对模型原始知识的依赖、在特定受控场景中使用。

  • ★★★★☆ 在内容安全(UGC)场景中,AI 模型如何识别变形文字攻击?

    提示:音系变化(同音字、拼音缩写)、形变(特殊字符、形近字)、语序变化(乱序、间隔符)。

  • ★★★★☆ 图片仿冒场景(假证件、截图篡改)中,有哪些检测手段?

    提示:摩尔纹检测(拍摄屏幕)、边框与反光特征、哈希比对、数字水印验证。

Multi-Agent 与未来

  • ★★★★☆ Multi-Agent 协同场景下有哪些新的安全问题?

    提示:Agent 间的权限隔离、调用链审计、恶意 Agent 注入、数据污染跨 Agent 传播。

  • ★★★★★ 如何设计一套面向 Agent 执行环境的安全架构?

    提示:工具调用权限模型、沙箱隔离、运行时约束、调用链可观测、异常行为熔断。