用于能量分解(Energy Disaggregation)研究的REDD数据集

简介: REDD的全称为 The Reference Energy Disaggregation Data Set, 目前的版本是Version 1.0目前版本的下载地址为: http://redd.csail.

REDD的全称为 The Reference Energy Disaggregation Data Set, 目前的版本是Version 1.0
目前版本的下载地址为: http://redd.csail.mit.edu
如果使用该数据集完成研究,发表论文,可以引入如下的文献,这是REDD作者的原始文献:
[1] J. Zico Kolter and Matthew J. Johnson. REDD: A public data set for energy disaggregation research. In proceedings of the SustKDD workshop on Data Mining Applications in Sustainability, 2011.

介绍一下REDD的内容组织和格式:
REDD包含2种类型的数据集:高频数据集和低频数据集,描述如下:
(1)high-frequency current/voltage waveform data of the two power mains(15kHz)
(2)lower-frequency power data including the mains and individual, labeled circuits(up to 24 devices, 1Hz,161MB of zip and 2.48GB of unzip).

数据文件组织如下:
low_freq/ -- ~1Hz power readings, whole home and circuits
high_freq/ -- aligned and group current/voltage waveforms
high_freq_raw/ -- raw current/voltage waveforms

low frequency data(1Hz)的文件内容格式如下:
1306541834 102.964 UTC timestamp and the apparent power
1306541835 103.125
1306541836 104.001

High frequency data(15kHz)的文件内容格式如下:
The high_freq/ directory contains AC waveform data for the power mains and a single phase of the voltage for the home.
current_1.dat -- current waveforms for first power mains

current_2.dat        -- current waveforms for second power mains

voltage.dat -- voltage waveforms

这是从高频数据中的数据格式:
1297340206.597013 135.000000 0.000000 3.623859 7.254136 10.949398 ...
1297340208.844086 722.000000 0.000000 3.638527 7.249567 10.929027 ...
关于这个格式的说明如下:
1) A decimal UTC timestamp, in the same format as the timestamps for the low frequency data, but allowing for fractional parts.
2) A cycle count. Although this is represented in the file as a double, it is in fact an integer that indicates for how many AC cycles this particular waveform remains.(keep invariable)
3) 275 decimal values, indicating the value of the waveform (in amps or volts), at equally-spaced portions of the cycle.
这个数据集是为数不多的用于能量分解研究的数据集,价值很高。

目录
相关文章
|
存储 安全 Linux
Docker 离线安装与基本使用
Docker 离线安装与基本使用
3998 0
Docker 离线安装与基本使用
|
算法 安全 数据挖掘
如何更轻松地学习差分隐私——《动手学差分隐私》中文版正式发布!
2022年10月28日,阿里巴巴集团数据技术及产品部DataTrust团队成员刘巍然、李双为差分隐私在线书籍《动手学差分隐私(Programming Differential Privacy )》提供的中文翻译版本正式被原著作者Joseph P. Near和Chiké Abuah合并到书籍GitHub仓库(https://github.com/uvm-plaid/programming-dp/)中
3340 0
如何更轻松地学习差分隐私——《动手学差分隐私》中文版正式发布!
|
7月前
|
机器学习/深度学习 人工智能 前端开发
终端里的 AI 编程助手:OpenCode 使用指南
OpenCode 是开源的终端 AI 编码助手,支持 Claude、GPT-4 等模型,可在命令行完成代码编写、Bug 修复、项目重构。提供原生终端界面和上下文感知能力,适合全栈开发者和终端用户使用。
55578 11
|
6月前
|
缓存 Ubuntu Linux
Docker安装
本文介绍Docker在CentOS和Ubuntu系统中的安装与配置方法,涵盖卸载旧版本、配置yum源、在线/离线安装、启动服务、设置开机自启、运行HelloWorld测试及daemon.json配置详解,并提供阿里云镜像加速、日志管理、命令补全等实用操作步骤。
|
9月前
|
算法 安全 新能源
基于DistFlow的含分布式电源配电网优化模型【IEEE39节点】(Python代码实现)
基于DistFlow的含分布式电源配电网优化模型【IEEE39节点】(Python代码实现)
732 0
|
机器学习/深度学习 人工智能 算法
探索机器学习中的过拟合现象及其解决方案
在机器学习领域,过拟合是一个常见且棘手的问题,它发生在模型过于复杂以至于捕捉到训练数据中的噪声而非信号时。本文将深入探讨过拟合的原因、影响以及如何通过技术手段有效缓解这一问题,旨在为读者提供一个全面而实用的指南。
|
机器学习/深度学习 自然语言处理 算法
词嵌入(Word Embeddings)
词嵌入(Word Embeddings)
|
机器学习/深度学习 人工智能 供应链
量子计算有哪些应用场景
量子计算有哪些应用场景
3432 6
|
存储 监控 算法
动物目标检测——基于YOLOv5和树莓派4B平台
目标检测在计算机视觉领域中具有重要意义。YOLOv5(You Only Look One-level)是目标检测算法中的一种代表性方法,以其高效性和准确性备受关注,并且在各种目标检测任务中都表现出卓越的性能。本文将详细介绍如何在性能更强的计算机上训练YOLOv5模型,并将训练好的模型部署到树莓派4B上,通过树莓派的摄像头进行实时动物目标检测。 一、在电脑上训练YOLOv5模型 1. 安装Anaconda 在性能更强的计算机上安装Anaconda,方便管理Python环境和依赖。 从Anaconda官网(https://www.anaconda.com/products/distribu
700 6