【数据集】Maple-IDS——网络安全恶意流量检测数据集

maple,ids · 浏览次数 : 21

小编点评

本文介绍了一个名为Maple-IDS的网络入侵检测评估数据集,旨在提高异常基础入侵检测系统(IDS)和入侵预防系统(IPS)的性能和可靠性。该数据集由东北林业大学网络安全实验室发布,完全免费,欢迎引用和使用。文章首先描述了数据集发布的背景,然后详细介绍了数据集的内容、特点以及与现有数据集的兼容性。接下来,文章提到了数据集生成的过程、使用的处理工具以及数据集的下载和联系信息。 1. **数据集介绍**: - Maple-IDS数据集是一个用于入侵检测研究的网络流量数据集。 - 数据集由东北林业大学网络安全实验室发布,提供了丰富的攻击类型和多样的流量模式。 - 数据集的发布旨在应对网络空间安全领域攻击的复杂化和HTTPS/TLS加密的普及。 2. **数据集发布背景**: - 传统的评估数据集存在内容过时、流量多样性不足等问题。 - Maple-IDS数据集提供了一个全面、现代的数据集来应对这些挑战。 3. **Maple-IDS兼容使用**: - 如果您的代码是基于CIC-IDS数据集训练或编写的,可以直接使用Maple-IDS数据集。 - Maple-IDS数据集与之前的工作兼容,可以使用CICFlowMeter生成CSV文件。 4. **数据集类别概览**: - 数据集包含最新的常见攻击,流量分析基于时间戳、源和目标IP地址等信息。 - 包含DDoS攻击、GET、POST、HEAD和OPTIONS等HTTP方法的数据。 - 提供了对每种服务(如HTTP、HTTPS、SMTP等)的细分流量包和数据集。 5. **更多功能即将推出**: - 支持DPDK和PF_RING。 - 即将推出更多处理工具和功能。 6. **数据集生成**: - 通过模拟真实世界的网络流量模式构建用户抽象行为。 - 构建了包括SSH、RESTful API、gRPC、WASM等现代协议的流量内容。 7. **处理工具**: - 开发了许多开源工具,可用于处理和分析数据集。 - 工具仓库中有教程可供参考。 8. **数据集下载**: - 访问东北林业大学网络安全实验室官网下载数据集。 - 提供了详细的下载指南和注意事项。 9. **联系我们**: - 提供了电子邮箱、GitHub和QQ群等联系方式。 - 可以通过邮件或GitHub提交问题和提出建议。 总的来说,Maple-IDS数据集是一个全面、现代且实用的网络入侵检测评估数据集,它不仅提供了丰富的攻击类型和多样的流量模式,还支持现有的CIC-IDS数据集代码的直接使用,并且即将推出更多功能和处理工具,为网络入侵检测领域的研究和应用提供了宝贵的资源。

正文

一、数据集介绍
Maple-IDS数据集是一个网络入侵检测评估数据集,旨在增强异常基础入侵检测系统(IDS)和入侵预防系统(IPS)的性能和可靠性。随着网络空间安全领域攻击的日益复杂化,拥有一个可靠和最新的数据集对于测试和验证IDS和IPS解决方案至关重要。

数据集由东北林业大学网络安全实验室发布,欢迎引用和使用,完全免费!

实验室官网:东北林业大学网络安全实验室

二、数据集发布背景
传统的评估数据集的攻击流量和利用方式,往往内容过时、流量多样性不足、攻击种类不足、特征不足,最重要的是 HTTPS/TLS 加密已经普及了。枫叶数据集提供了一个全面、现代的数据集来应对这些挑战,用于入侵检测研究。

三、Maple-IDS兼容使用CIC-IDS数据集的代码
如果你的代码是用CIC-IDS数据集训练或者编写的,那么可以直接更换到Maple-IDS数据集上。 Maple-IDS数据集与您之前的工作兼容。可以直接使用 CICFlowMeter 生成 CSV 文件! 无需重写代码或进行其他工作。

四、Maple-IDS数据集类别概览(包含内容)
内容:数据集包含最新的常见攻击,类似于真实世界的网络流量(PCAP/PCAPNG 格式)。
流量分析:使用 CICFlowMeter 进行的网络流量分析结果,标记基于时间戳、源和目标IP地址、端口、协议和攻击类型的流,存储在CSV文件中。
DDoS 攻击:数据集包括 DDoS 攻击,这些在真实世界的网络流量中很常见。并且由于随机内容,数据集更加多样化。GET、POST、HEAD 和 OPTIONS 是最常见的 HTTP 方法。
对每种服务细分的流量包和数据集 :我们对于每种服务(HTTP、HTTPS、SMTP、IMAP、POP3、FTP、SSH、RESTful API、gRPC、WASM)都提供了数据集。
多样的流量 :对于 ping 或者 HTTP,DDoS 的形式就多种多样,TCP,UDP, SYN 攻击,还有 ICMP 走私,我们的数据集都有覆盖到。
N-day 漏洞:数据集包括 n-day 漏洞,如 OpenSSL 中存在的著名漏洞 HeartBleed,日后打算囊括更多的 CVE 漏洞。

五、更多功能即将推出
DPDK、PF_RING 支持
如果您有任何问题或建议,请给我们反馈。

六、Maple-IDS数据集生成
我们通过模拟真实世界的网络流量中观察到的模式和模式来对流量进行配置。基于HTTP、HTTPS与SM3/4、GOST等,我们构建了用户的抽象行为。SSH、RESTful API、gRPC、WASM,这些现代+协议及其各种实现等,都为这个数据集构建了内容。

七、我们提供的处理工具
在创建数据集的过程中,我们使用了许多自己开发的工具。它们是开源的,可以免费下载。一般来说,工具的仓库中都有教程。见:https://github.com/maple-nefu/pcap2para

更多工具即将推出,请给我们一点时间,我们在用心做的更好!一起为恶意流量检测科研添砖加瓦!

八、数据集下载
请登录我们的实验室官网下载,东北林业大学网络安全实验室Maple Dateset站点:

https://maple.nefu.edu.cn/

九、联系我们
有任何问题或需要帮助,请随时与我们联系:
电子邮件:maple@nefu.edu.cn
GitHub:github.com/maple-nefu
QQ 群:631300176

十、欢迎引用和使用
请在使用我们的数据集时候请引用我们的官网发布的论文,谢谢!

与【数据集】Maple-IDS——网络安全恶意流量检测数据集相似的内容:

【数据集】Maple-IDS——网络安全恶意流量检测数据集

一、数据集介绍 Maple-IDS数据集是一个网络入侵检测评估数据集,旨在增强异常基础入侵检测系统(IDS)和入侵预防系统(IPS)的性能和可靠性。随着网络空间安全领域攻击的日益复杂化,拥有一个可靠和最新的数据集对于测试和验证IDS和IPS解决方案至关重要。 数据集由东北林业大学网络安全实验室发布,

【pandas基础】--数据拆分与合并

数据集拆分是将一个大型的数据集拆分为多个较小的数据集,可以让数据更加清晰易懂,也方便对单个数据集进行分析和处理。 同时,分开的数据集也可以分别应用不同的数据分析方法进行处理,更加高效和专业。 数据集合并则是将多个数据集合并成一个大的数据集,可以提供更全面的信息,也可以进行更综合的数据分析。 同时,数

使用数据集工具

一.数据集工具介绍 HuggingFace通过API提供了统一的数据集处理工具,它提供的数据集如下所示: 该界面左侧可以根据不同的任务类型、类库、语言、License等来筛选数据集,右侧为具体的数据集列表,其中有经典的glue、super_glue数据集,问答数据集squad,情感分类数据集imdb

心理健康数据集:mental_health_chatbot_dataset

一.数据集描述 1.数据集摘要 该数据集包含与心理健康相关的问题和答案的对话对,以单一文本形式呈现。数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源精选而来的。所有问题和答案都经过匿名化处理,以删除任何个人身份信息(PII),并经过预处理以删

ArcMap镶嵌数据集的创建、数据导入与数据范围修改方法

本文介绍基于ArcMap软件,建立镶嵌数据集(Mosaic Datasets)、导入栅格图像数据,并调整像元数值范围的方法~

[转帖]指令微调数据集整理

`https://blog.csdn.net/dzysunshine/article/details/130870398` 文章目录 开源指令数据集斯坦福数据链家数据Baize(基于少量种子问题的对话数据) 垂直领域数据集医疗领域的英文数据医疗领域的中文数据法律领域中文数据 COIG数据集(可商用的

中文情感分类

本文通过ChnSentiCorp数据集介绍了文本分类任务过程,主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试,也简要介绍了模型训练流程,不过最后没有保存训练好的模型。 一.任务和数据集介绍 1.任务 中文情感分类本质还是一个文本分类问题。 2.数据集 本文使用ChnS

中文完形填空

本文通过ChnSentiCorp数据集介绍了完型填空任务过程,主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试,也简要介绍了模型训练流程,不过最后没有保存训练好的模型。 一.完形填空 完形填空应该大家都比较熟悉,就是把句子中的词挖掉,根据上下文推测挖掉的词是什么。 二.

中文句子关系推断

本文通过ChnSentiCorp数据集介绍了中文句子关系推断任务过程,主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试,也简要介绍了模型训练流程,不过最后没有保存训练好的模型。 一.任务简介和数据集 通过模型来判断2个句子是否连续,使用ChnSentiCorp数据集,不

Azure Data Factory(六)数据集类型为Dataverse的Link测试

一,引言 之前有讲过 Azure Data Factory 的 Copy Data 的操作,演示了将 Blob Storage1 的数据通过 Azure Data Factory 复制到 Blob Storage2 中,今天我们玩一个不一样的,Azure Dataverse -》 Azure Dat