首页 > 关于我们 > 安恒动态 > 2026 > 正文

9.9元 “咒语”致集体失守：多模态大模型的合规软肋

阅读量：次 文章来源：安恒信息

不久前，央视财经——《财经调查》栏目曝光了一条 AI“造黄”产业链。记者花 9.9元买来的隐晦提示词，轻松突破了10款主流AI应用的防线——1.4亿用户的知名App生成了擦边视频，“哩布哩布 AI”几分钟内生成了半裸舞蹈，全程无拦截。一款AI照片生成器更是只需一张图就能生成全裸照片。

这起事件照出了行业现实：缺乏针对高阶提示词注入的系统性防护，现有安全防线形同虚设。

护城河为什么成了纸糊的？

集体失守暴露了致命短板：防不住高阶提示词注入。黑产将敏感词翻译成英文，或用看似正常的动作描写构建隐蔽提示词，字面干干净净，却能精准绕过审查。AI 虚拟陪伴软件更是重灾区——当 Agent 被赋予“量身定制的人设”，攻击者很容易通过长对话诱导，把系统指令架跑偏。

监管加码，合规必须前置

此前，中央网信办部署 “清朗・整治 AI 技术滥用”专项行动，率先针对AI色情生成、换脸伪造、隐私侵犯等黑产开展集中整治。进入2026年，监管持续升级，4月底中央网信办启动为期四个月的“清朗・整治 AI 应用乱象” 年度专项整治，进一步深挖AI生成低俗色情、提示词对抗攻击等问题；同年4月10日五部门联合发布《人工智能拟人化互动服务管理暂行办法》，7月15日正式施行，明确要求安全评估和算法备案。信号很清晰：安全合规已是硬性门槛，企业必须在上线前拿出客观、可追溯的风险评测报告。但一个现实问题摆在面前：拿什么标准评？用什么工具测？评估报告出不来、依据说不清，合规审查就容易悬在空中。企业自查缺抓手，监管检查缺手段，双方都需要一把通用的 “标尺”。

让自查有抓手，让监管有工具

安恒大模型风险评估系统正是为此而建。对企业，它可以模拟极端对抗攻击，对图文、视频、语音进行全模态深度检测，把高阶提示词注入风险发现在发布之前，自动生成结构化的风险评测报告，让自查有章可循。对监管，这套系统提供的是可追溯、可复验的审查依据——哪些漏洞被触发、风险等级如何、是否达到准入基线，报告里一目了然，让合规检查从“凭经验判断”变成“用工具说话”。

让企业自查有章可循，让监管执法有据可查，这也是 AI 创新在阳光下稳健前行的路基。

扫码免费试用

关闭

AI智能体专区

AI智能体专区

告警研判和降噪智能体

安全运营咨询服务智能体

恶意邮件研判智能体

数据分类分级智能体

API安全智能体

自动化渗透测试智能体

终端数据防泄漏智能体

恶意软件检测智能体

数据安全咨询服务智能体

核心安全产品

场景解决方案

Saas产品订阅专区

热门产品推荐

安恒数盾数据安全管控平台最热

数据库审计与风险控制系统推荐

明御防火墙最热

ClawdSecbot-“龙虾卫士”一键下载免费用

AI安服数字员工

AI安服数字员工

AI渗透测试

AI应急响应

AI安全咨询

AI代码审计

AI数字安全教师

AI+安全服务

AI+ 安全服务

一切产品皆资源，一切资源皆服务

干货内容

干货内容

热门内容

精彩推荐

热门内容

精彩推荐

热门内容

精彩推荐

热门内容

精彩推荐

热门内容

精彩推荐

热门内容

精彩推荐

热门内容

精彩推荐

9.9元 “咒语”致集体失守：多模态大模型的合规软肋

相关推荐

AI智能客服

售前

售后

告警研判和
降噪智能体

安全运营咨询
服务智能体

恶意邮件研判
智能体

数据分类
分级智能体

API安全
智能体

自动化渗透
测试智能体

终端数据防
泄漏智能体

恶意软件检
测智能体

数据安全咨询
服务智能体

AI数字
安全教师