跳到主要内容

AI 安全面试题目

AI 安全方向分为两类：用 AI 手段做安全（AI 赋能安全），以及保护 AI 系统本身的安全（AI 自身安全）。面试中两类都会考，需要同时具备安全基础和 AI 基础知识。

AI 基础

★★☆☆☆ 机器学习、深度学习、大语言模型（LLM）的区别？

提示：机器学习靠特征工程，深度学习靠神经网络自动提取特征，LLM 是基于 Transformer 的超大规模预训练模型。
★★★☆☆ 深度学习相较于经典机器学习的优劣势？

提示：优势是特征提取自动化、准确率高；劣势是需要大量数据、计算成本高、可解释性差。
★★★☆☆ 什么是 AI 可解释性？为什么在安全场景中重要？

提示：能解释模型决策的 Why/How/What，避免黑盒决策导致误封、绕过等问题，监管合规也需要。

AI 自身安全

★★★☆☆ AI 对抗攻击（Adversarial Attack）有哪些类型？

提示：白盒（FGSM、PGD、C&W）、黑盒（替代模型攻击、ZOO）；目标是让模型做出错误预测。
★★★☆☆ 什么是数据投毒攻击（Data Poisoning）？如何防御？

提示：污染训练数据导致模型行为异常；防御靠数据来源验证、异常样本检测。
★★★★☆ Prompt Injection 的原理和危害？

提示：构造特殊 Prompt 使模型忽略系统指令，导致数据泄漏、越权操作、内容绕过。
★★★★☆ LLM 的主要安全风险有哪些？

提示：Prompt Injection、数据外泄（训练数据记忆）、幻觉（输出错误信息）、Agent 越权执行。
★★★★☆ 如何保护大模型不泄露训练数据中的敏感信息？

提示：差分隐私（DP）训练、数据脱敏、成员推断攻击检测、输出过滤。

AI 赋能安全

★★★☆☆ AI/LLM 在哪些安全场景下效果比较好？

提示：意图识别、日志解析与告警研判、钓鱼邮件检测、代码安全审计、威胁情报摘要。
★★★☆☆ 如何用 LLM 提升安全运营效率？

提示：告警自动研判、安全知识库问答、事件响应辅助（SOAR+LLM）、自然语言驱动规则生成。
★★★★☆ 如何平衡 AI 在安全场景中的效率收益和安全风险？

提示：最小权限接入、Agent 调用链审计、降低对模型原始知识的依赖、在特定受控场景中使用。
★★★★☆ 在内容安全（UGC）场景中，AI 模型如何识别变形文字攻击？

提示：音系变化（同音字、拼音缩写）、形变（特殊字符、形近字）、语序变化（乱序、间隔符）。
★★★★☆ 图片仿冒场景（假证件、截图篡改）中，有哪些检测手段？

提示：摩尔纹检测（拍摄屏幕）、边框与反光特征、哈希比对、数字水印验证。

Multi-Agent 与未来

★★★★☆ Multi-Agent 协同场景下有哪些新的安全问题？

提示：Agent 间的权限隔离、调用链审计、恶意 Agent 注入、数据污染跨 Agent 传播。
★★★★★ 如何设计一套面向 Agent 执行环境的安全架构？

提示：工具调用权限模型、沙箱隔离、运行时约束、调用链可观测、异常行为熔断。

本章内容大纲

AI 基础
AI 自身安全
AI 赋能安全
Multi-Agent 与未来