李 琦1,2,崔天宇1,肖 勇1,李思佳1,林鑫杰1,徐 恪3,吴建平1,3
摘 要:针对安全大模型的教学难题,提出面向网络安全专业人才培养的安全大模型教育实践案例内容体系,介绍该体系的 4 个层次设计,以“网络威胁检测与分析系统”为例,介绍教学实践过程,最后通过教学实践和学生参赛成绩说明该系统应用效果,为安全大模型专业人才培养工作提供示范案例。
关键词:安全大模型;人工智能;网络安全;人才培养;大模型竞赛
0
引 言
随着网络技术产业的飞速进步与创新,网络安全已经成为国家安全的重要组成部分。面对如今错综复杂的国际局势,我国的网络安全正面临着日益严峻的挑战。例如,2023 年 4 月,中国网络安全产业联盟[1]发布的报告中披露了近 10 年我国遭受的网络攻击、网络监控、网络窃密等多项案例。面对这些网络威胁,发展网络安全新技术是保障我国网络空间安全的关键。面对异构网络带来的复杂性与快速变化的威胁环境,如今的网络安全分析工作往往需要大量的专家经验用以分析海量的网络行为数据。同时,网络安全事业往往横跨多个领域知识,不同业务场景要维护不同的安全工具,自动化程度低且操作门槛高,使维护网络空间安全的人力成本加剧。
最近,大模型的出现给网络安全工作带来了契机[2-3]。大模型作为生成式人工智能的最新技术,大规模参数量带来的强大的学习能力使其在复杂知识提取与推理方面具有独特优势,大模型已开始为各个垂直领域赋能。网络安全场景迫切需要大模型技术,用以实现智能化网络安全能力的全面升级。目前,国内外众多企业与研究机构已纷纷投入安全大模型的探索与落地应用。例如,2023 年 5 月,深信服推出安全 GPT[4],可实现流量检测、事件解析、建议生成、事件处置等复杂工作。2023 年 8 月,360 集团发布安全行业大模型[5],充分发挥大模型优势,实现安全托管运营服务。2024 年 4 月,微软发布 Copilot for Security[6],利用生成式 AI 实现安全事件的威胁分析与警报响应的报告整合。依靠大模型的强大能力,安全大模型有望连通网络、系统等多个安全场景,全面提升安全分析效率并实现有效通解手段。
随着大模型的技术发展,安全大模型应用的专业人才需求将不断扩张,学术界与产业界迫切需要安全大模型的研究型人才。大模型的网络安全领域应用刚刚起步,教育实践中尚未形成体系化的安全大模型教育资源与方法论。同时,相比传统教学内容,安全大模型的人才培养要兼顾人工智能和网络空间安全的领域知识,由于横跨多个领域,其教学难度更高。针对以上问题,依据面向专业人才培养的安全大模型教育实践案例,首次规范安全大模型的教学内容体系,通过在清华大学课题实践和全国顶级安全大模型赛事“ATEC 2023”[7]的赛事验证,为安全大模型教育积累与人才培养提供教学案例与实践基础,支撑国家网络空间安全行业的专业人才输出。
1
安全大模型专业人才培养问题
安全大模型是大模型在网络安全领域的垂域大模型,是大模型在安全行业的垂直应用,可以解决网络安全方案依赖专家、人力成本高等问题。目前大模型技术仍处在快速发展阶段,要形成全面系统的安全大模型教学内容存在较大的挑战。同时,大模型在安全领域的垂直应用面临更强的实践性、综合性考查,对网络安全知识的运用场景和教学内容极多,范围极广。安全大模型专业人才培养主要面临如下的教学难题。
(1)安全大模型教学内容横跨人工智能和网络空间安全两个领域的专业知识,既要掌握预训练、指令微调、人类反馈强化学习等大模型训练的理论知识,也要熟悉网络流量检测、协议漏洞分析、威胁情报处理等网络安全的实战技能,教学内容要求更加全面。
(2)大模型作为新兴的生成式人工智能技术,其技术前沿的研究内容仍然在快速迭代与更新,教育内容要及时与前沿接轨,形成系统化的安全大模型教学内容体系较难。
(3)大模型的训练往往依赖海量的训练数据和硬件资源,教育成本较高,如何有效使用有限的教育资源以实现安全大模型专业的人才培养过程,是一个极具挑战性的教学工作。
(4)网络安全领域往往面临大量的实战场景,对网络安全的专业性要求极高,人才培养过程中的经验储备尤为重要,安全大模型的教学工作需要实践能力与实战经验的培养。
2
安全大模型教学案例内容体系
安全大模型的愿景是将生成式人工智能技术引入网络空间安全领域,以提高网络防御的效率和效果,并推动网络空间安全智能化,为社会提供更安全的数字生活环境。安全大模型课程教学的目标是使学生掌握安全大模型相关的理论知识和操作技能,具备安全大模型构建并应用的实践能力,并进一步培养学生在未来人工智能和网络空间安全领域的科技创新水平,真正做到产出导向式教学,使学生能够有效解决行业前沿研究问题和实际工程问题,为国家网络空间安全前沿技术攻坚与数字化经济发展作出贡献。
为了达到安全大模型课程教学目的,弥补现有教育实践中体系化的安全大模型课程资源与方法论的缺失,针对安全大模型的技术特点和实际网络安全问题,设计层次化、前沿化、实用化的课程教学案例,覆盖理论与实验教学全过程。
按照能力渐进原则,安全大模型教学案例内容体系设计如图 1 所示,分为 4 个层次:基础教学、进阶培训、综合指导和创新研究。①基础教学用于指导学生掌握安全大模型中有关深度学习、网络安全和大模型的理论知识,以及深度学习开源框架和网络分析工具的安装、配置、使用等基础知识和技能,通过将理论知识结合实际的案例操作,可以帮助学生对安全大模型基础的融会贯通,激发学生的学习兴趣,使学生能够充分理解不同知识点,进而为后续实际应用夯实基础。②进阶培训用于训练学生掌握安全数据预处理方法、安全大模型预训练技术和安全大模型监督微调技术等进阶技能,为实际工程项目研发与创新应用提供核心能力支撑。③综合指导用于引导学生按照人工智能与网络空间安全实践的研发要求,构建全流程可用的安全大模型,包括多模态数据预处理、提示工程、推理加速以及安全大模型能力评测,累积安全大模型的完整生命周期研发经验。④创新研究是基于课程团队有关研究方向设立的前沿实践课题,学生可以根据自身兴趣和能力水平进行选择,用于指导学生阅读相关科技文献,设计创新方案并进行实验验证,培养学生的创新思维和科研实践能力。
在案例实施环境方面,通过 Docker、Conda 等虚拟环境整合一系列实用软件构建安全大模型仿真实验教学系统,包括操作系统 Ubuntu、Nvidia 驱动程序、CUDA 工具包、PyTorch 框架、Transformers 依赖库[8]、DeepSpeed 框架[9]、Megatron-LM 框架[10]、vLLM 框架[11]、Python 集成开发环境等,为所有教学案例的演示、开发及评测提供支撑,且易于操作,能够循序渐进地引导学生进行课程学习。此外,学生可以便捷地访问教学系统,便于学生开展课外科研学习与创新技术研讨,解决有限的教学时长不利于达成教学目标的问题。与硬件实验环境相比,仿真虚拟化实验环境不仅避免了昂贵的硬件设施购置和管理成本,也降低了部署较大规模实验环境的难度,同时可以让教师和学生便携地进行相应案例有关操作,有益于实现安全大模型和网络空间安全技术的指导演示与实操应用,且在虚拟环境中构建并部署的大模型可以直接迁移使用,为不同场景应用部署提供便携性。
3
安全大模型教学案例:基于安全大模型的网络威胁检测与分析系统
3.1案例概述
随着人工智能的发展,越来越多的基于机器学习的流量检测方法发挥出了强大的安全检测能力。一些研究工作将大规模预训练模型[12-15]应用在了网络安全领域,实现了有效的流量表征学习。如何实现文本与流量模态的对齐,帮助模型听从安全从业人员的指令进行流量理解与检测工作,仍面临着巨大的挑战。近期快速发展的大模型技术在多个领域任务中表现出了强大的性能。其突出的理解、推理能力及泛化能力,能够有效改善当前技术的不足,为提升网络威胁检测与分析技术的性能提供了新的解决思路。
该案例在清华大学本科生课程“网络空间安全导论”和研究生课程“网络空间安全基础和前沿”以及全国安全大模型比赛 ATEC 2023 中进行了实践。在安全大模型比赛 ATEC 2023 中,来自 985、211 等百余家高校和单位的 3 000 余名参赛选手参与了该赛事。通过对赛事中该案例的讲解与实践,学生能够全面而深入地理解并掌握大模型与加密流量核心知识和技术。通过参与比赛实践,不仅有助于增强学生的网络空间安全基础及实践能力,还提升了他们的创新实践能力。
3.2系统设计
基于安全大模型的网络威胁检测与分析系统定位通过分析网络流量检测各种网络安全事件,可以作为网络安全管理的智能决策模块。整体系统体系框架如图 2 所示,主要分为数据预处理模块、微调模块和推理模块。
1)数据预处理模块。
2)安全数据微调模块。
3)安全任务推理模块。
3.3教学实践
基于网络威胁检测与分析系统的成果,开展了安全大模型实验的应用场景和平台建设。通过在平台部署安全大模型的赛题,实现安全大模型能力的实践与考查。为了确保平台能够在安全且高效的环境中运行,有效锻炼学生在安全大模型专业技能方面的目的,基于一系列分布式计算和容器化技术实现了基于安全大模型系统的实验平台及安全大模型实践赛题的部署。通过这些技术构建的安全大模型实验平台,学生可以进行开发、调试和任务提交,实现简便易用的赛事流程和资源的高效利用。安全大模型实验平台的网络拓扑如图 3 所示。终端机通过 SSH 协议连接到云堡垒机,确保能够安全地访问云端资源。云堡垒机对访问进行监控与控制,提供了一个安全的接入点。同时,通过 HTTP 协议访问操作前端界面。操作前端具有图形化界面,选手可以在该界面上进行操作与查询,方便预约计算资源卡时并查看任务执行结果。在通过云堡垒机进行身份验证后,会被自动跳转到选手开发机。云堡垒机作为一种先进的安全机制,利用多因素身份验证和单点登录技术,不仅可以管理对选手开发机的访问,也对所有操作进行实时监控与记录,审计并分析学生的安全大模型创新技术和研发工作。
学生在开发机上获取赛题样例工程文件和开发工具,进行本地数据分析、编写代码、调试并运行。开发机预装了所需的集成开发环境和依赖库,支持构建模型打包成镜像,提交到远端云环境中进行运行与验证。学生提交的镜像会在远端云环境中通过容器运行。容器化平台将应用程序及其依赖环境打包到轻量级的容器中,确保应用在环境下的一致性运行。同时,远端云环境采用了资源管理机制,其中包含排队机制,确保计算资源的充分利用。在获取运行结果后,平台会自动调用评分程序。评分程序使用预定义的评分算法,对学生提交的代码进行评估,通过利用预定义测试集中的标签与学生预测结果计算准确率。该分数会通过 API 接口同步到前端网页的排行榜中,便于学生实时查看结果,并根据反馈及时调整代码策略,实现安全大模型实践对于专业人才培养的创新激励作用。
4
赛题分析与收获
通过将安全大模型实验平台应用于清华大学本科生和研究生的网络空间安全课程实践以及 ATEC 2023 的大模型应用与安全赛事,显著提升了学生对大模型在安全领域应用的认知和技能。通过实际操作和解决具体安全问题,积累了宝贵的实践经验,从而为培养大模型背景下的安全领域人才奠定了坚实基础。赛事有效激发了参赛者利用大语言模型解决安全问题的热情,吸引了行业内的学生和专业人士共同关注大模型在网络流量分析任务中的应用。整个赛事共计 1 901 支队伍、3 000 余名选手报名参赛,创下了 ATEC 竞赛历史新高,其中报名者中,超过 51% 来自 985 和 211 高校。报名队伍数量前三的高校分别是北京邮电大学( 76 支 )、中国科学院大学( 47 支 )和浙江大学( 42 支 )。
4.1安全大模型数据基准建设
为了帮助学生更好地实践大模型在安全领域的应用,本次安全大模型的教学案例以流量检测任务为背景,基于 ATEC 2023 比赛平台设计了网络安全大模型赛题。当前复杂的互联网环境使网络流量分析工作变得极为困难,网络安全从业人员要具备完备的专业知识和丰富的专家经验,才能确保流量审查的准确性。赛题旨在利用大模型辅助完成网络流量分析任务,包括流量检测与基础流量理解,同时保证部署的大模型具备安全可靠性。
4.2安全大模型教学经验收获
通过利用大模型技术与网络安全数据集来培养参与者安全能力,赛事有效锻炼了参赛选手解决实际问题的能力。随着赛程的推进,选手提交的高分模型数量不断增加,其中榜单前 20 的模型有 75% 是在最后 48h 的冲刺阶段提交的(如图 4 所示),临近赛程结束时高分模型不断涌现。这表明参赛选手在使用多种方案解决问题的过程中,不断提升了自身利用大模型在处理安全专业问题上的水平。在安全大模型的赛事教育模式中,竞赛过程有效激发了参与者的安全问题理解与技术创新能力,这种模式显著增强了专业人才的技术水平和能力。
通过本次安全大模型赛事的教学经验和实践案例,广泛收获了来自人工智能与网络安全领域教育者和对应专业相关学生的教育实践反馈。利用所形成的实践经验,安全大模型赛事过程中凝结并转化了多项赛事成果,形成了大模型技术在网络安全领域实践的相关行业白皮书和综述。表 2 显示了安全大模型赛事转化的白皮书和综述论文成果。今后可以进一步加强安全大模型的教育案例,基于已有的基础出发形成系统化、体系化的安全大模型教育课本,并持续加强精通大模型技术的网络安全专业人才输送,为我国安全大模型教育培养普及提供指导方向。
5
结 语
针对安全大模型专业人才培养面临的教学内容难定义、教学资源成本高的问题,笔者进行了面向网络安全专业人才培养的安全大模型赛事教育实践,提出了系统化的安全大模型教学内容体系,形成了通用的面向人才培育的安全大模型系统构建教学案例。通过本科生教学课堂以及为期两个月的全国性安全大模型赛事 ATEC 2023 中的教学实践,收获了来自百余家高校和单位的 3 000 余名参赛选手的教学经验反馈。相关教学内容及成绩为安全大模型行业人才培养的探索形成了有效的示范作用,为我国网络空间安全的技术进步奠定了坚实的基础。基于已有的教学实践经验,未来将落实安全大模型人才培养的教育资源和教学课本,打造生成式人工智能在网络空间安全关键领域应用的良好教学环境与科研基础。构建专业化的网络安全领域训练语料数据和评测基准,提供开源的安全大模型构建框架和思路,支撑培养安全大模型行业人才的全方位能力,提升大模型技术在网络安全领域的应用效力。
参考文献:
[2] OpenAI. ChatGPT[EB/OL]. [2024-07-24]. https://chat.openai.com/.
[3] OpenAI. GPT-4 technical report[EB/OL]. [2024-10-12]. https://arxiv.org/pdf/2303.08774.
[4] 深信服科技. 深信服安全GPT[EB/OL]. [2024-07-24]. https://www.securitygpt.com.cn/.
[6] Microsoft. Microsoft copilot for security[EB/OL]. [2024-04-01]. https://www.microsoft.com/en-us/security/business/ai-machine-learning/microsoft-copilot-security.
[8] Wolf T, Debut L, Sanh V, et al. Transformers: State-of-the-art natural language processing[C]//Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. Kerrville: Association for Computational Linguistics, 2020: 38-45.
[10] Narayanan D, Shoeybi M, Casper J, et al. Efficient large-scale language model training on GPU clusters using megatron-lm[C]//International Conference for High Performance Computing, Networking, Storage and Analysis, New York: ACM, 2021: 58.
[11] Kwon W, Li Z, Zhuang S, et al. Efficient memory management for large language model serving with pagedattention [C]//Proceedings of the ACM SIGOPS 29th Symposium on Operating Systems Principles, New York: ACM, 2023: 611-626.
[12] Lin X, Xiong G, Gou G, et al. Et-bert: A contextualized datagram representation with pre-training transformers for encrypted traffic classification[C]. //Proceedings of the ACM Web Conference. New York: ACM, 2022: 633-642.
[14] He H, Yang Z, Chen X. PERT: Payload encoding representation from transformer for encrypted traffic classification[C]//ITU Kaleidoscope: Industry-Driven Digital Transformation (ITU K). New York: IEEE, 2020: 1-8.
[15] Chen Y, Li R, Zhao Z, et al. Netgpt: A native-ai network architecture beyond provisioning personalized generative services[EB/OL]. [2024-10-12]. https: //arxiv. org/pdf/2307. 06148.
[16] 清华大学, 中国信息通信研究院, 蚂蚁集团. 可信AI技术和应用进展白皮书2023[EB/OL]. [2023-07-07]. https: //mdn. alipayobjects. com/huamei_dz84ol/afts/file/A*wEpIRKIi2kIAAAAAAAAAAAAADm6lAQ.
[17] 清华大学, 中关村实验室, 中国信息通信研究院, 等. 大模型安全实践白皮书2024 [EB/OL]. [2024-07-05]. https: //mdn. alipayobjects. com/huamei_dz84ol/afts/file/A*f7sbRYT1ENUAAAAAAAAAAAAADm6lAQ/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%AE%89%E5%85%A8%E5%AE%9E%E8%B7%B5%E7%99%BD%E7%9A%AE%E4%B9%A6. pdf.
[18] Cui T, Wang Y, Fu C, et al. Risk taxonomy, mitigation, and assessment benchmarks of large language model systems[EB/OL]. [2024-10-12]. https: //arxiv. org/pdf/2401. 05778.
[19] Yi S, Liu Y, Sun Z, et al. Jailbreak attacks and defenses against large language models: A survey[EB/OL]. [2024-10-12]. https: //arxiv. org/pdf/2407. 04295.
第一作者简介:李琦,男,副教授,研究方向为网络安全,qli01@tsinghua.edu.cn。