《数据驱动安全:数据安全分析、可视化和仪表盘》一3.2 获取数据

本文涉及的产品
数据安全中心,免费版
简介: 本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第3章 ,第3.2节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第3章 ,第3.2节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2 获取数据

我们正在进入信息安全的数据时代。当前的挑战不是从哪里获得数据而是如何处理数据,数据集中信息的种类将决定你的研究类型。
对于这个例子,SOC选择整合AlienVault的IP信誉数据库放入SIME(http://labs.alienvault.com/labs/index.php/projects/open-source-ip-reputation-portal/download-ip-reputation-database/)。AlienVault自己研发了OSSIM,OSSIM既是一个开源的安全信息管理器,也是一个专有的统一安全管理(USM)产品。OSSIM可以使用各类免费的数据集,其中包含来自互联网的各种类型的“坏数据”。AlienVault提供各种格式的免费数据。在这里,你所使用的是OSSIM格式的数据(http://reputation.alienvault.com/reputation.data),在众多数据格式中它能提供最丰富的信息。
AlienVault按小时更新其IP信誉数据集,并且同步产生一个名为“修订版”(revision)(https://reputation.alienvault.com/reputation.rev)的文件,使你能够确定你正在使用的是最新数据集或保存了历史数据集。如果你计划对这个数据集进行长时间的分析(这通常称为纵向研究),一个好的办法是修改一些代码来执行检查,看看是否需要下载一个新的数据集,即使是在进行一些预定的作业时。
在进行探索性分析或者想先看一看数据集的时候,你可以通过浏览器(或者使用wget和curl命令)将它下载下来。AlienVault数据库的大小将近16MB,在较慢的网络环境下可能要花费1到2分钟的时间下载。当你下载了AlienVault IP信誉数据库并且验证了第一部分的数据元素时,你会对这些数据的内容和格式产生一些想法,这些想法会在你阅读和处理数据的过程中派上用场。在后续的代码中,你可以使用一些简单的Linux/UNIX命令进行下载:
image

对于大多数项目,最好养成直接从你的分析脚本中获取数据源的习惯。如果你仍然喜欢手动下载文件,应该在程序中增加一些注释来记录数据的来源以及当前分析数据的获取时间。这些注释能够帮助你在之后更容易地重复这些分析。请相信我们,你一定会比你预期的更频繁地重新阅读你的代码以及重新进行分析。
接下来的示例(程序清单3-2和程序清单3-3)展示了如何使用R和Python两种语言来获取这些数据。如果你依照RStudio或者IPython,所有的代码示例都假定位于项目结构的顶层的工作目录(例如在第2章中建议的执行book/ch03目录,可以手动生成或者用prep脚本来生成该目录)。对于大多数情况,代码块是独立的,但每个块都期望在已经运行了RStudio或IPython的会话中执行这部分片段以及下一节中的片段。
程序清单3-2
image

程序清单3-3
image

R语言和Python语言的代码看起来非常相似并且遵循相同的基本结构:对URL和文件名尽可能使用变量,在重新下载之前验证这些数据文件是否已经存在。这些都是很好的习惯,我们会在本书的其余部分强调其他的良好习惯。
获得了IP信誉数据,到了读入并使用这些数据的时候了。

相关文章
|
1月前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
94 6
|
2月前
|
存储 人工智能 安全
数据治理:强化数据安全与隐私保护的基石
在当今这个数字化时代,数据已成为推动社会进步和企业发展的核心驱动力。从个人消费习惯到企业运营策略,从政府决策支持到科研创新突破,数据无处不在,其价值不言而喻。然而,随着数据量的爆炸性增长和流通范围的扩大,数据安全与隐私保护问题也日益凸显,成为制约数据价值最大化利用的重要瓶颈。因此,构建完善的数据治理体系,特别是强化数据安全与隐私保护,成为了时代发展的必然要求。
|
2月前
|
人工智能 安全 大数据
CDGA|数据要素与数据安全:携手构建可信数据生态的深远探讨
数据要素与数据安全是数字经济时代不可分割的双生子。只有在保障数据安全的前提下,才能充分发挥数据要素的价值,推动数字经济持续健康发展。构建可信数据生态,需要政府、企业、社会组织及广大公众的共同努力,形成合力,共同应对挑战,共创数字经济的美好未来。
|
4月前
|
监控 安全 数据安全/隐私保护
确保数据安全与隐私保护的数据治理最佳实践
【8月更文第13天】随着数据成为企业最重要的资产之一,数据安全和隐私保护变得至关重要。本文将探讨数据治理中的一些最佳实践,并提供具体的代码示例来说明如何实施这些策略。
868 4
|
4月前
|
Kubernetes 安全 Cloud Native
解锁安全新纪元:利用服务网格Istio,打造全链路mTLS加密隧道,从入口网关到出口网关,守护数据安全的每一步
【8月更文挑战第2天】随着云原生技术的发展,服务网格(Service Mesh)如Istio已成为微服务架构的核心,通过双向TLS(mTLS)确保通信安全。首先,在Kubernetes部署Istio以管理服务通信。接着,配置入口网关实现所有入向流量的加密处理,防止数据泄露。最后,通过配置Sidecar代理如Envoy,确保服务网格安全访问外部mTLS服务,从而构建起全链路的数据安全防护。
87 11
|
5月前
|
存储 安全 数据安全/隐私保护
🔎Android安全攻防实战!守护你的应用数据安全,让用户放心使用!🛡️
【7月更文挑战第28天】在移动应用盛行的时代,确保Android应用安全性至关重要。本文以问答形式探讨了主要安全威胁(如逆向工程、数据窃取)及其对策。建议使用代码混淆、签名验证、数据加密等技术来增强应用保护。此外,还推荐了加密API、HTTPS通信、代码审计等措施来进一步加强安全性。综上所述,全面的安全策略对于构建安全可靠的应用环境必不可少。#Android #应用安全 #代码混淆 #数据加密
86 3
|
5月前
|
SQL 存储 安全
SQL安全深度剖析:守护数据安全的坚固防线
展望未来,随着技术的不断进步和攻击手段的不断翻新,SQL安全将面临更多的挑战。因此,我们需要持续关注SQL安全领域的最新动态和技术发展,并不断更新和完善我们的防护措施。同时,加强国际合作与信息共享也是提升全球SQL安全性的重要途径。让我们共同努力,为构建一个更加安全、可靠的数字化环境而奋斗。
|
6月前
|
存储 安全 网络安全
APP 安全评估报告:直面移动应用安全威胁,守护用户数据安全
移动APP安全问题日益严重,包括数据泄露、恶意软件和权限滥用等威胁。例如,Ring App安全漏洞导致用户信息曝光,13款Android应用暴露大量用户数据。此外,工信部通报50款APP违规收集个人信息。安全评估是保障APP安全的关键,涉及代码安全、数据传输安全、用户权限管理和隐私保护等方面。经过评估,这款APP在所有方面表现出色,符合最高安全标准,确保用户隐私和数据安全。
193 2
|
7月前
|
SQL 安全 数据库
安全编码:守护数据安全
安全编码:守护数据安全
|
7月前
|
存储 安全 算法
【专栏】保护数据安全的重要性以及安全加密算法在数据保护中的应用
【4月更文挑战第27天】在数字化时代,数据安全至关重要,关系到个人隐私、企业商业机密、国家安全及经济发展。安全加密算法(如对称加密、非对称加密和哈希算法)在保护数据方面发挥关键作用。它们应用于电子商务、金融、物联网、云存储和数字签名等领域,确保信息传输和存储的安全。面对日益复杂的挑战,我们需要持续研究和应用加密技术,提高数据安全意识,共同维护数字世界的繁荣与安全。
198 2