【BetterBench博士】2024华为杯C题:数据驱动下磁性元件的磁芯损耗建模 Python代码实现

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 本文介绍了2024年中国研究生数学建模竞赛C题的详细分析,涵盖数据预处理、特征提取、模型训练及评估等多个方面。通过对磁通密度数据的处理,提取关键特征并应用多种分类算法进行波形分类。此外,还探讨了斯坦麦茨方程及其温度修正模型的应用,分析了温度、励磁波形和磁芯材料对磁芯损耗的影响,并提出了优化磁芯损耗与传输磁能的方法。最后,提供了B站视频教程链接,供进一步学习参考。

在这里插入图片描述

题目

【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析

【BetterBench博士】2024年中国研究生数学建模竞赛 E题:高速公路应急车道紧急启用模型 问题分析

【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析

1 问题一

首先,针对磁通密度的数据进行预处理,去除噪声和异常值,确保数据的完整性和一致性。可以使用统计分析方法,例如异常值检测,来清理数据。

对于磁通密度数据,提取一些重要的特征来帮助分类波形,可能的特征包括:

  • 波形的周期性:通过FFT(快速傅里叶变换)提取频率特征。
  • 幅度和对称性:计算波形的最大值、最小值以及均值。
  • 波峰和波谷数量:通过零交叉点和局部极值点的数量确定波形的形状特征。

利用提取的特征训练分类模型。常用的分类算法包括:

  • 随机森林
  • 支持向量机(SVM)
  • K近邻算法(KNN)
  • 神经网络
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report, roc_auc_score
import matplotlib.pyplot as plt
from scipy.fftpack import fft
from scipy.signal import find_peaks
plt.rcParams['font.sans-serif'] = 'SimSun' # 换成自己环境下的中文字体,比如'SimHei'


# 读取附件1和附件2
df1 = pd.read_excel('data/附件一(训练集).xlsx')
df2 = pd.read_excel('data/附件二(测试集).xlsx')

# 数据预处理:清理异常值
def clean_data(df):
    # 去除不合理的异常值
    df = df[(df['0(磁通密度B,T)'].abs() < 1)]
    return df

df1 = clean_data(df1)
df2 = clean_data(df2)

# 特征提取:使用磁通密度数据提取特征
def extract_features(df):
    features = []
    for i in range(len(df)):
        row = df.iloc[i, 4:]  # 只考虑磁通密度数据
        # FFT变换
        fft_vals = fft(row)
        fft_amplitude = np.abs(fft_vals[:len(fft_vals) // 2])
        # 波峰波谷特征
        peaks, _ = find_peaks(row)
        troughs, _ = find_peaks(-row)
        # 构造特征
        feature_row = [
            np.max(row),  # 最大值
            np.min(row),  # 最小值
            np.mean(row),  # 均值
            len(peaks),  # 波峰数量
            len(troughs),  # 波谷数量
            np.max(fft_amplitude)  # FFT幅度最大值
        ]
        features.append(feature_row)
    return pd.DataFrame(features, columns=['max_val', 'min_val', 'mean_val', 'n_peaks', 'n_troughs', 'max_fft_amp'])

# 提取特征
X = extract_features(df1)
y = df1['励磁波形'].map({
   '正弦波': 1, '三角波': 2, '梯形波': 3})  # 标签编码

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)



# 模型评估
y_pred = clf.predict(X_test)
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

在这里插入图片描述

# 对附件2中的样本进行预测
X_new = extract_features(df2)
y_new_pred = clf.predict(X_new)
# 将分类结果写入附件3
df3 = pd.DataFrame({
   '序号': df2['序号'], '励磁波形分类结果': y_new_pred})
df3.to_csv('data/问题一预测结果-附件4.csv', index=False)
# 1. 波形图:展示不同样本的磁通密度波形,观察波形的直观差异
plt.figure(figsize=(10, 6))
for i in range(3):  # 展示前三个样本的波形
    plt.plot(df1.iloc[i, 4:].to_list(), label=f'样本 {i+1}')
plt.title('不同样本的磁通密度波形')
plt.xlabel('时间')
plt.ylabel('磁通密度')
plt.legend()
plt.show()

在这里插入图片描述

import seaborn as sns

# 2. 混淆矩阵:展示分类模型的预测结果与实际标签的匹配情况
cm = confusion_matrix(y_test, y_pred)

plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=['正弦波', '三角波', '梯形波'], yticklabels=['正弦波', '三角波', '梯形波'])
plt.title('混淆矩阵')
plt.xlabel('预测标签')
plt.ylabel('实际标签')
plt.show()

在这里插入图片描述

2 问题二

2.1 思路

  1. 拟合原始斯坦麦茨方程拟合:通过 工具包 拟合原始斯坦麦茨方程,找到 $k_1$、$a_1$ 和 $\beta_1$。
  2. 然后拟合带温度修正的斯坦麦茨方程:通过拟合带温度修正的方程,找到温度敏感系数 $\gamma$。
  3. 误差比较:通过实际数据和预测数据的误差进行比较,判断哪个方程在不同温度下更准确。
  4. 可视化分析:展示实际损耗和两个方程预测损耗的曲线。

要在斯坦麦茨方程中引入温度修正,以适应不同温度变化对磁芯损耗的影响,可以假设温度对损耗有指数或线性影响。那么在原方程中增加一个温度相关项,如:

$$P_{T} = k_1 * f^{a_1} * B_{m}^{\beta_1} * e^{\gamma(T - T_{ref})}$$

其中:

  • $P_T$ 是带有温度修正的磁芯损耗。
  • $T$ 是实际温度,$T_{ref}$ 是参考温度(如25°C)。
  • $\gamma$ 是温度敏感系数,它表明温度变化对损耗的影响程度。

import numpy as np
import pandas as pd
from scipy.optimize import curve_fit
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import StandardScaler
plt.rcParams['font.sans-serif'] = 'SimSun' # 换成自己环境下的中文字体,比如'SimHei'
# 读取数据
data = pd.read_excel('data/附件一(训练集).xlsx')
# 提取相关数据
df = pd.DataFrame({
   
    'temperature': data['温度,oC'],
    'frequency': data['频率,Hz'],
    'core_loss': data['磁芯损耗,w/m3'],
    'flux_density': data.iloc[:, 4:].max(axis=1)  # 磁通密度峰值
})
# 去除异常值函数,使用Z-score方法
def remove_outliers(df, column, threshold=3):
    z_scores = np.abs((df[column] - df[column].mean()) / df[column].std())
    return df[z_scores < threshold]

# 对整个DataFrame应用异常值去除
df_cleaned = df.copy()
for column in df_cleaned.columns:
    df_cleaned = remove_outliers(df_cleaned, column)

# 归一化处理
scaler = StandardScaler()
df_cleaned[['temperature', 'frequency', 'flux_density']] = scaler.fit_transform(df_cleaned[['temperature', 'frequency', 'flux_density']])
# df_cleaned = df_cleaned
# 提取处理后的数据
temperature = df_cleaned['temperature'].values
frequency = df_cleaned['frequency'].values
core_loss = df_cleaned['core_loss'].values
flux_density = df_cleaned['flux_density'].values


# 2. 斯坦麦茨方程和带温度修正方程的定义
# 斯坦麦茨方程
...# 带温度修正的斯坦麦茨方程
...# 3. 优化函数的定义
# 定义误差函数(目标函数),用于最小化
...# 进行斯坦麦茨方程优化
result_steinmetz = differential_evolution(objective_steinmetz, bounds_steinmetz)
params_steinmetz = result_steinmetz.x
print(f"Steinmetz方程拟合参数: k1={params_steinmetz[0]}, a1={params_steinmetz[1]}, beta1={params_steinmetz[2]}")

# 进行带温度修正的斯坦麦茨方程优化
result_steinmetz_temp = differential_evolution(objective_steinmetz_temp, bounds_steinmetz_temp)
params_steinmetz_temp = result_steinmetz_temp.x
print(f"带温度修正的Steinmetz方程拟合参数: k1={params_steinmetz_temp[0]}, a1={params_steinmetz_temp[1]}, beta1={params_steinmetz_temp[2]}, gamma={params_steinmetz_temp[3]}")

在这里插入图片描述

问题三

要分析温度、励磁波形和磁芯材料对磁芯损耗的独立和协同影响,并找出在何种条件下磁芯损耗达到最小,分析步骤如下:

  1. 数据清洗与整理,将数据加载到Pandas数据框中,检查是否存在缺失值或异常值,并对数据进行标准化或编码(对于分类变量如励磁波形类型,需要编码)。
  2. 统计分析
    • 计算描述性统计量(如均值、方差等),观察每个因素与磁芯损耗的关系。
    • 绘制箱型图、散点图等可视化图表,分析不同因素对磁芯损耗的分布影响。
  3. 方差分析 (ANOVA),用于检验单个因素对磁芯损耗的影响显著性。
  4. 多元线性回归,构建一个多元回归模型来分析每个因素对磁芯损耗的影响程度,特别是两两因素的协同效应。
  5. 交互效应分析,使用可视化和回归系数分析两两因素之间的协同效应,特别是交互作用项。
  6. 最优条件探索,基于回归模型,使用优化方法来找到最优的温度、励磁波形和磁芯材料组合,使磁芯损耗达到最小。


# 5. 交互作用分析
# 增加交互项(温度*频率,温度*励磁波形,频率*励磁波形)
data['Temperature_Frequency'] = data['Temperature'] * data['Frequency']
data['Temperature_Waveform'] = data['Temperature'] * data['Waveform_Encoded']
data['Frequency_Waveform'] = data['Frequency'] * data['Waveform_Encoded']

# 构建包含交互项的多元回归模型
interaction_model = ols('Core_Loss ~ C(Temperature) * C(Waveform_Encoded) * Frequency', data=data).fit()
print(interaction_model.summary())

# 6. 可视化交互效应
plt.figure(figsize=(10,6))
sns.boxplot(x='Temperature', y='Core_Loss', hue='Waveform', data=data)
plt.title('温度与励磁波形对磁芯损耗的影响')
plt.show()

plt.figure(figsize=(10,6))
sns.scatterplot(x='Frequency', y='Core_Loss', hue='Temperature', data=data)
plt.title('频率与温度对磁芯损耗的影响')
plt.show()

在这里插入图片描述

问题四

  1. 数据加载与预处理:

    • 将磁通密度采样点(从第4列到第1024列)的列名从数字转换为字符串形式,方便后续操作。

    • 首先对(励磁波形)列使用LabelEncoder进行编码,将正弦波、三角波、梯形波分别映射为0、1、2。

  2. 特征工程:

    • 将温度、频率、磁通密度等数值特征进行标准化(StandardScaler),确保不同量纲的特征对模型的影响均衡。
  3. 模型选择与构建:

    • 选择随机森林回归模型(RandomForestRegressor)进行回归任务,以预测磁芯损耗。
    • 使用Pipeline构建完整的模型管道,包括数据预处理(特征标准化)和模型训练。
  4. 模型训练与评估:

    • 将数据划分为训练集和测试集,使用训练集训练模型。
    • 在测试集上进行预测,计算均方误差(MSE)和R²分数,以评估模型的性能。
  5. 样本预测与输出:

    • 读取附件3中的数据,对其按照附件1相同的编码操作。
    • 使用训练好的模型对附件3中的样本进行预测,将结果保存到附件4.csv中。
    • 输出指定样本的预测结果,保留一位小数。


# 预测附件3中的磁芯损耗
attachment3_data = pd.read_excel('data/附件三(测试集).xlsx')

# 对附件3的'Waveform'列进行编码处理
attachment3_data = attachment3_data.rename(columns={
   
    '温度,oC': '温度',
    '频率,Hz': '频率',
    '磁芯损耗,w/m3': '磁芯损耗',
    '励磁波形': 'Waveform',
    '0(磁通密度B,T)':'0'
})


attachment3_data['Waveform'] = waveform_encoder.transform(attachment3_data['Waveform'])
attachment3_data = attachment3_data.drop(columns=['序号','磁芯材料'])
attachment3_data.columns =  ['温度','频率','Waveform']+ [str(i) for i in range(1024)]
attachment3_data

在这里插入图片描述

# 使用模型预测附件3中的数据
y_pred_attachment3 = model.predict(attachment3_data)

# 将预测结果填入附件4并保存,只保留小数点后一位
attachment4 = pd.DataFrame({
   
    '序号': attachment3_data.index + 1,
    '磁芯损耗预测结果': np.round(y_pred_attachment3, 1)
})
attachment4.to_csv('data/附件4-问题四.csv', index=False)
attachment4
# 输出特定样本的预测结果
sample_indices = [16, 76, 98, 126, 168, 230, 271, 338, 348, 379]
sample_results = attachment4.iloc[sample_indices]
print("指定样本的磁芯损耗预测结果:")
print(sample_results)

在这里插入图片描述

问题五

为了同时优化磁芯损耗与传输磁能,构建一个优化问题。目标是找到能够最小化磁芯损耗且最大化传输磁能的条件。传输磁能可以简化为频率($f$)与磁通密度峰值($B_m$)的乘积:

  1. 目标函数:

平衡两个目标:

  • 最小化磁芯损耗:$L_c$,使用我们构建的磁芯损耗预测模型来预测。
  • 最大化传输磁能:$T_e = f \cdot B_m$。

为了将这两个目标结合为一个优化问题,定义一个加权目标函数:

$$ \text{Minimize } \alpha L_c - \beta T_e $$

其中,$\alpha$ 和 $\beta$ 是权重参数,表示磁芯损耗与传输磁能的相对重要性。通常需要调节这些参数以实现某种平衡。

  1. 约束条件:
  • 频率 $f$ 的取值范围:$f{\min} \leq f \leq f{\max}$

  • 磁通密度峰值 $Bm$ 的取值范围:$B{m,\min} \leq Bm \leq B{m,\max}$

  • 温度 $T$、励磁波形等其他变量的取值范围。

$$ T \in \{25, 50, 70, 90\} $$

$$ \text{waveform} \in \{0, 1, 2\} $$

在这里插入图片描述

完整资料

转到B站视频介绍
【2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模】
bilibili.com/video/BV1fPskeqEQH/?share_source=copy_web&vd_source=d2dd5fcbeeeec396792650b25c110a13
在这里插入图片描述

目录
相关文章
|
1天前
|
测试技术 Python
探索Python中的装饰器:简化代码,增强功能
在Python的世界中,装饰器是那些能够为我们的代码增添魔力的小精灵。它们不仅让代码看起来更加优雅,还能在不改变原有函数定义的情况下,增加额外的功能。本文将通过生动的例子和易于理解的语言,带你领略装饰器的奥秘,从基础概念到实际应用,一起开启Python装饰器的奇妙旅程。
20 11
|
16天前
|
缓存 监控 测试技术
Python中的装饰器:功能扩展与代码复用的利器###
本文深入探讨了Python中装饰器的概念、实现机制及其在实际开发中的应用价值。通过生动的实例和详尽的解释,文章展示了装饰器如何增强函数功能、提升代码可读性和维护性,并鼓励读者在项目中灵活运用这一强大的语言特性。 ###
|
19天前
|
缓存 开发者 Python
探索Python中的装饰器:简化代码,增强功能
【10月更文挑战第35天】装饰器在Python中是一种强大的工具,它允许开发者在不修改原有函数代码的情况下增加额外的功能。本文旨在通过简明的语言和实际的编码示例,带领读者理解装饰器的概念、用法及其在实际编程场景中的应用,从而提升代码的可读性和复用性。
|
15天前
|
Python
探索Python中的装饰器:简化代码,提升效率
【10月更文挑战第39天】在编程的世界中,我们总是在寻找使代码更简洁、更高效的方法。Python的装饰器提供了一种强大的工具,能够让我们做到这一点。本文将深入探讨装饰器的基本概念,展示如何通过它们来增强函数的功能,同时保持代码的整洁性。我们将从基础开始,逐步深入到装饰器的高级用法,让你了解如何利用这一特性来优化你的Python代码。准备好让你的代码变得更加优雅和强大了吗?让我们开始吧!
22 1
|
20天前
|
设计模式 缓存 监控
Python中的装饰器:代码的魔法增强剂
在Python编程中,装饰器是一种强大而灵活的工具,它允许程序员在不修改函数或方法源代码的情况下增加额外的功能。本文将探讨装饰器的定义、工作原理以及如何通过自定义和标准库中的装饰器来优化代码结构和提高开发效率。通过实例演示,我们将深入了解装饰器的应用,包括日志记录、性能测量、事务处理等常见场景。此外,我们还将讨论装饰器的高级用法,如带参数的装饰器和类装饰器,为读者提供全面的装饰器使用指南。
|
16天前
|
存储 缓存 监控
掌握Python装饰器:提升代码复用性与可读性的利器
在本文中,我们将深入探讨Python装饰器的概念、工作原理以及如何有效地应用它们来增强代码的可读性和复用性。不同于传统的函数调用,装饰器提供了一种优雅的方式来修改或扩展函数的行为,而无需直接修改原始函数代码。通过实际示例和应用场景分析,本文旨在帮助读者理解装饰器的实用性,并鼓励在日常编程实践中灵活运用这一强大特性。
|
20天前
|
存储 算法 搜索推荐
Python高手必备!揭秘图(Graph)的N种风骚表示法,让你的代码瞬间高大上
在Python中,图作为重要的数据结构,广泛应用于社交网络分析、路径查找等领域。本文介绍四种图的表示方法:邻接矩阵、邻接表、边列表和邻接集。每种方法都有其特点和适用场景,掌握它们能提升代码效率和可读性,让你在项目中脱颖而出。
28 5
|
18天前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
39 2
|
20天前
|
数据库 Python
异步编程不再难!Python asyncio库实战,让你的代码流畅如丝!
在编程中,随着应用复杂度的提升,对并发和异步处理的需求日益增长。Python的asyncio库通过async和await关键字,简化了异步编程,使其变得流畅高效。本文将通过实战示例,介绍异步编程的基本概念、如何使用asyncio编写异步代码以及处理多个异步任务的方法,帮助你掌握异步编程技巧,提高代码性能。
53 4
|
20天前
|
API 数据处理 Python
探秘Python并发新世界:asyncio库,让你的代码并发更优雅!
在Python编程中,随着网络应用和数据处理需求的增长,并发编程变得愈发重要。asyncio库作为Python 3.4及以上版本的标准库,以其简洁的API和强大的异步编程能力,成为提升性能和优化资源利用的关键工具。本文介绍了asyncio的基本概念、异步函数的定义与使用、并发控制和资源管理等核心功能,通过具体示例展示了如何高效地编写并发代码。
30 2