首家!安恒信息通过中国信通院面向大模型的可信执行环境产品专项测试
2024年5月23日,在中国信息通信研究院(以下简称“中国信通院”)组织的首批“面向大模型的增强型可信执行环境基础能力专项测试”中,安恒信息顺利完成全部测试内容,成为首家完成此项测试的企业。
标准及测试介绍
《面向大模型训练与推理数据保护的可信执行环境技术要求》是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合30余家企业的专家共同编制,旨在为可信执行环境产品/集群在面向大模型场景时的研发、测试、评估和验收提供参考和指引。
据此标准形成的测试方法考虑可信执行环境、模型类别和训练推理数据的特点,覆盖数据工程、模型训练支持、模型推理支持、硬件加速、安全要求五大能力域,包含数据增强、模型管理、环境安全和数据安全等16个子能力域,共计57个测试项。
安恒AiLand安全岛隐私计算平台介绍
AiLand安全岛隐私计算平台专注于保障数据安全流通,致力于解决数据流通过程中的信任和隐私保护问题。平台综合应用可信执行环境,安全多方计算,联邦学习,区块链等技术,结合环境隔离、关键行为数字验签、全流程审计等,实现共享数据的所有权和使用权分离,确保数据 “可用不可见”,保障数据共享交换过程的数据可控和流程可溯。
AiLand安全岛隐私计算平台架构
安恒AiLand安全岛隐私计算平台在机密计算方面具有业界领先的产品积累。近两年在国内各大赛事中屡获优异成绩,获得2023年度信通院星河杯TEE赛道全国一等奖,2022年度鲲鹏应用创新大赛全国总决赛数字政府赛道金奖等荣誉。
01
平台优势及主要能力
在面向大模型训练与推理场景,安恒AiLand安全岛隐私计算平台设计技术与产品的安全结合架构,支持融合多方数据集建设精调数据集,持续进行训练和推理。
1. 安全防护
为增强模型提供方、数据提供方与平台信任,平台使用机密计算技术提供硬件级的安全保护,通过算法一致性核验,交互数据安全保护机制,环境隔离机制等实现模型和数据全流程的机密性、完整性保护,满足大模型在高安全要求的业务场景需求。
在身份权限、计算任务、训练数据、精调模型等内容与机密计算技术深度融合,由硬件为上述内容提供了安全保护与隔离,即使是系统管理员也无法窥探到执行中的数据。
2. 安全评估
平台依托安恒信息在大模型内容安全上多年的积累,支持了模型安全检测能力。通过几千个测试用例,可以检测出包括提示词注入、不安全的内容输出、模型滥用风险、模型过度依赖、道德伦理风险、违规内容风险和数据泄露风险等七个方向的风险。
AiLand安全岛隐私计算平台安全评估示例
3. 模型开发
模型方面,平台支持ChatGLM3、Llama3、Baichuan2 、千问2、gemma-1.1等相关和其他模型运行。训练数据方面,支持大规模数据输入,支持数据处理和多源数据安全融合。
4. 低成本迁移
平台提供与传统大模型训练推理环境类似的界面环境,用户可以在非安全环境的模型轻松地迁移到隐私计算平台内。
AiLand安全岛隐私计算平台推理环境示例
5. 加速设备支持
目前已商用的产品中,支持可满足安全要求的异构加速设备,如Intel AMX、海光和NVIDIA等。例如Intel AMX是一种用于加速深度学习和矩阵计算的处理器扩展,可以为ChatGLM、Llama及QWen等系列模型的推理和训练提供加速能力,2粒第四代志强处理器环境下,模型的推理速度有近400%的提升,训练速度有近50%的提升。
这些硬件在提供强大计算能力的同时,还具备出色的安全性能,能够有效保护大模型相关数据的安全性和隐私性。AiLand安全岛隐私计算平台充分利用这些硬件优势,支持在算力基础设施上构建平台,确保在提供计算性能优化的同时,满足严格的数据安全和隐私保护要求。
02
主要应用
1. 模型精调
在行业或领域大模型训练等场景而言,企业通常会选择合适的大模型作为基础模型,使用本方数据或融合多方数据对模型进行精调。在这一过程中,需要保证模型提供方提供的基础模型的安全和各方用于精调训练的数据安全,防止模型和数据被未经授权的访问。
安恒AiLand安全岛隐私计算平台通过环境隔离、数据完整性和机密性保护、全流程监控审计等机制保护平台内数据安全,并提供模型仓库、模型导出、优化工具等功能,保证精调阶段的功能和性能可用。
2. 安全推理
在推理场景中需要考虑模型、数据和算力等条件,一是提供大模型推理服务的模型均为企业花费资金和时间训练得到的,是模型提供方的核心资产;二是,用户的输入数据和推理结果是用户希望被保护的数据;三是提供基于大模型的推理服务需要一定规模算力,但并非每家企业都具备独立搭建算力平台的能力。
因此,基于公有算力的大模型推理服务是较为常见的模式。安恒AiLand安全岛隐私计算平台,通过一致性检验、交互加密等方式对推理服务时模型和数据进行保护。