【2023 年第十三届 MathorCup 高校数学建模挑战赛】A 题 量子计算机在信用评分卡组合优化中的应用 详细建模过程解析及代码实现

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 本文详细介绍了2023年第十三届MathorCup高校数学建模挑战赛A题的解题过程,包括量子计算机在信用评分卡组合优化中的应用,提供了详细的建模方案、QUBO模型的构建方法以及相应的代码实现。

相关信息

(1)建模思路

【2023 年第十三届 MathorCup 高校数学建模挑战赛】A 题 量子计算机在信用评分卡组合优化中的应用 详细建模过程解析及代码实现

【2023 年第十三届 MathorCup 高校数学建模挑战赛】 B 题 城市轨道交通列车时刻表优化问题 详细建模方案及代码实现

【2023 年第十三届 MathorCup 高校数学建模挑战赛】C 题 电商物流网络包裹应急调运与结构优化问题 建模方案及代码实现

(2)完整论文

【2023 年第十三届 MathorCup 高校数学建模挑战赛】A 题 量子计算机在信用评分卡组合优化中的应用 42页论文及代码

【2023 年第十三届 MathorCup 高校数学建模挑战赛】 B 题 城市轨道交通列车时刻表优化问题 42页论文及代码

【2023 年第十三届 MathorCup 高校数学建模挑战赛】C 题 电商物流网络包裹应急调运与结构优化问题 赛后总结之31页论文及代码

【2023 年第十三届 MathorCup 高校数学建模挑战赛】D 题 航空安全风险分析和飞行技术评估问题 27页论文及代码

请添加图片描述
更新信息:2023-4-15 更新了代码

1 题目

在银行信用卡或相关的贷款等业务中,对客户授信之前,需要先通过 各种审核规则对客户的信用等级进行评定,通过评定后的客户才能获得信 用或贷款资格。规则审核过程实际是经过一重或者多重组合规则后对客户 进行打分,这些规则就被称为信用评分卡,每个信用评分卡又有多种阈值 设置(但且只有一个阈值生效),这就使得不同的信用评分卡在不同的阈值 下,对应不同的通过率和坏账率,一般通过率越高,坏账率也会越高,反 之,通过率越低,坏账率也越低。对银行来说,通过率越高,通过贷款资格审核的客户数量就越多,相 应的银行获得的利息收入就会越多,但高通过率一般对应着高坏账率,而 坏账意味着资金的损失风险,因此银行最终的收入可以定义为:最终收入 = 贷款利息收入 - 坏账损失

下表举例 3 个不同的信用评分卡,可以看到每种信用评分卡有 10 个阈值,每种阈值对应不同的坏账率和通过率:

在这里插入图片描述

赛题说明 1:流程简化及示例

由于银行场景的复杂性,往往需要采用选择多个不同的信用评分卡进 行组合来实现最佳的风险控制策略。而实际中的信用评分卡组合是一个非 常复杂的过程,为便于建模,我们将该问题进行做如下简化(本简化只适 用本次比赛赛题,不能完全代表实际场景)。假设贷款资金为 1000000 元,银行贷款利息收入率为 8%,并以上面列举的三个信用评分卡作为选定的信用评分卡组合来测算银行最终收入。由于每一信用评分卡有且只可选择 1 个阈值,假设信用评分卡 1 的阈值设置为 8,则通过表格可知,对应通过率为 70%,坏账率为 4.00%,信用评分卡 2 的阈值设置为 6,则通过率为 50%,坏账率为 2.70%,信用评分卡3 的阈值设置为 7,则通过率为 62%,坏账率为 3.70%。例如如果我们选择三重信用卡组合策略,那么这三种信用评分卡组合 后的总通过率为所有信用评分卡通过率相乘,即:0.7×0.5×0.62 = 0.217。总坏账率为三种信用评分卡对应坏账率的平均值,即:1/3×(0.04+0.027+0.037) = 0.0367。基于以上条件可求得,本次贷款利息收入为:贷款资金×利息收入率×总通过率×(1-总坏账率),即:1000000×0.08×(0.7×0.5×0.62) ×(1-1/3×(0.04+0.027+0.037)) =16758.18(元)。由坏账带来的坏账损失为:贷款资金×总通过率×总坏账率,即:1000000×(0.7×0.5×0.62) ×(1/3×(0.04+0.027+0.037))=7522.666(元)。那么银行的最终收入为:贷款利息收入**-**坏账损失,即

16758.18-7522.666 = 9235.514 (元)

由此可见,选择不同的信用评分卡,不同的阈值组合,会给银行带来 不同的收入与损失,由此决定银行最终收入。因此,银行的目标是选择最 合理的信用评分卡组合以及其阈值,使得银行最终收入最多。

赛题说明2:QUB 模型简介

QUBO 模型是指二次无约束二值优化(Quadratic Unconstrained Binary Optimization)模型,它是一种用于解决组合优化问题的数学模型。在QUBO模型中,需要将问题转化为一个决策变量为二值变量,目标函数是一个二 次函数形式优化模型。

QUBO 模型可以运行在量子计算机硬件上,通过量子计算机进行毫秒级的加速求解。这种模型和加速方式在未来各行业中将得到广泛的实际应 用。因此现阶段研究基于 QUBO 模型的量子专用算法十分有应用价值。例如典型的图着色、旅行商问题、车辆路径优化问题等,都可以转化为 QUBO 模型并借助于量子计算机求解。

相关的 QUBO 的转化方法与例子可参考附件 2 中的参考文献。

赛题说明3:赛题数据

附件 1 中共包含 100 张信用评分卡,每张卡可设置 10 种阈值之一,并对应各自的通过率与坏账率共 200 列,其中 t_1 代表信用评分卡 1 的通过率共 10 项,h_1 代表信用评分卡 1 的坏账率共 10 项,依次类推 t_100 代表信用评分卡 100 的通过率,h_100 代表信用评分卡 100 的坏账率。根据上面的赛题说明及附件 1 中的数据,请你们团队通过建立数学模型完成如下问题 1 至问题 3。

问题 1:在 100 个信用评分卡中找出 1 张及其对应阈值,使最终收入

最多,请针对该问题进行建模,将该模型转为 QUBO 形式并求解。

问题 2:假设赛题说明 3 目前已经选定了数据集中给出的信用评分卡1、信用评分卡 2、信用评分卡 3 这三种规则,如何设置其对应的阈值,使最终收入最多,请针对该问题进行建模,将模型转为 QUBO 形式并求解。

问题 3:从所给附录中 100 个信用评分卡中任选取 3 种信用评分卡, 并设置合理的阈值,使得最终收入最多,请针对该问题进行建模,并将模 型转为 QUBO 形式并求解。

2 方案解析

2.1 问题一

这是一个组合优化问题,需要在100张信用评分卡中找到最优的一张卡和对应的阈值,使得最终收入最多。因为每张卡都有10个阈值选项,因此总共有1000个可能的选择。为了将该问题转化为QUBO模型,需要定义一组变量,表示选择第i张卡的第j个阈值时是否为1,其中i∈[1,100], j∈[1,10]。另外,需要定义一个目标函数来最大化最终收入。目标函数的形式为:
$$maximize:\sum_i \sum_i r_{ij} x_{ij}$$
其中 $r_{ij}$​是选择第i张卡的第j个阈值时的收入。$x_{ij}$​表示选择第i张卡的第j个阈值时的变量。

为了使得选择的方案符合题意,需要加入约束条件。首先,每张卡只能选择一个阈值,因此需要添加如下约束:
$$\sum_j x_{ij} = 1 \quad i = 1,2,...,100$$
其次,只能选择一个卡和对应的阈值,因此需要添加如下约束:
$$\sum_i \sum_j x_{ij} = 1$$
最后,
。。。。略,请下载完整文档

2 问题二

对模型进行线性化,将二次项转化为一次项,然后将模型转化为 QUBO 形式。具体地,我们定义 $x_{ij}$表示信用评分卡 i中选择第 j个阈值,其中i∈1,2,3,j∈1,2,…,10,$y_i$表示是否选择信用评分卡i,其中i∈1,2,3,$z_j$表示是否选择第 j个阈值,其中j∈1,2,…,10。同时,我们引入一个变量r表示总收入。

根据前面的分析,可以得到以下约束条件:

每个信用评分卡最多选择一个阈值,即

$$∑_{j=1}^{10} x_{ij} \leq 1, i \in \{1,2,3\} $$

选择某个信用评分卡的同时必须选择该信用评分卡对应的一个阈值,即

$$x_{ij} \leq y_i, i \in \{1,2,3\}, j \in \{1,2,\dots,10\}$$

总共只能选择三个信用评分卡,即

$$∑_{i=1}^{3} y_i = 3 $$
选择某个阈值的同时必须选择对应的信用评分卡,即

$$x_{1j} + x_{2j} + x_{3j} - z_j = 0, j \in \{1,2,\dots,10\}$$
根据信用评分卡的阈值和数据集中给出的通过率和坏账率,计算收入,即

r = 200 ∑ i = 1 3 ∑ j = 1 10 x i j ( t i − h i ) z j r = 200\sum_{i=1}^{3} \sum_{j=1}^{10} x_{ij} (t_i - h_i) z_j r\=200i\=1∑3​j\=1∑10​xij​(ti​−hi​)zj​

其中第 4 个约束条件是一个等式约束,我们可以将其转化为两个不等式约束:

$$x_{1j} + x_{2j} + x_{3j} \leq 1 + z_j, j \in \{1,2,\dots,10\} \\\ x_{1j} + x_{2j} + x_{3j} \geq 1 - 2(1 - z_j), j \in \{1,2,\dots,10\} $$
接下来,我们将每个约束条件转化为 QUBO 表达式。首先,我们考虑将约束条件中的不等式转化为等式。对于一个不等式 a ≤ b ,我们可以引入一个非负变量 s,并将其转化为等式 a + s = b,其中 s表示两边差的绝对值。这样,我们就可以将所有约束条件转化为等式的形式,从而将模型转化为 QUBO 形式。

具体地,我们可以将目标函数表示为:
$$H = A r + ∑_{i=1}^3 ∑{j=1}^{10} B_i x_ij + ∑_{j=1}^{10} C_j z_j + ∑{i=1}^3 D_i y_i + ∑_{i=1}^3 ∑_{j=1}^{10} ∑ _{k=1}^{10} E_{ij}^k x_{ij} x_{ik} + ∑ _{i=1}^3 ∑ _{j=1}^9 ∑_{k=j+1}^{10} F_{ij}^k x_{ij} x_{ik} $$
其中
。。。。略,请下载完整文档

2.3 问题三

首先,我们定义三个二元变量 x1​,x2​,x3​,表示我们是否选择了每个评分卡。

其次,我们需要定义一个阈值 T ,表示最小的信用评分得分,只有评分高于此阈值的评分卡才会被选择。

最后,我们需要定义一个目标函数,表示我们希望最大化的收入。在这个问题中,我们可以将收入定义为三个选择的信用评分卡的得分之和。

因此,我们的目标是将以下函数最大化:
$$f(x1,x2,x3)=s1x1+s2x2+s3 $$
其中s1​,s2​,s3​ 分别表示我们选择的三个信用评分卡的得分。

接下来,我们需要定义约束条件。首先,我们需要确保只选择了三个信用评分卡:
$$x1+x2+x3=3∗x∗1+∗x∗2+∗x∗3=3$$
其次,我们需要确保选择的评分卡的得分都高于阈值 T:
$$s1x1≥T,s2x2≥T,s3x3≥T∗s∗1∗x∗1≥∗T∗,∗s∗2∗x∗2≥∗T∗,∗s∗3∗x∗3≥∗T∗$$

最后,我们需要确保变量x1​,x2​,x3​ 都是二元变量:
$$x12=x1,x22=x2,x32=x3∗x∗12=∗x∗1,∗x∗22=∗x∗2,∗x∗32=∗x∗3 $$
将目标函数和约束条件转换为 QUBO 形式:
。。。。略,请下载完整文档

3 代码实现

data = readmatrix('附件1:data_100.csv');
rates = data(:,1:100);
loss_rates = data(:,101:200);

R = rates .* loss_rates;

Q = zeros(100,100);
for i = 1:100
    for j = i:100
        for k = 1:10
            for l = 1:10
                Q(i,j) = Q(i,j) + R(k,l)*rates(k,i)*rates(l,j);
            end
        end
        Q(j,i) = Q(i,j);
    end
end

C1 = zeros(100,100);
for i = 1:100
    for j = 1:100
        for k = 1:10
            C1(i,j) = C1(i,j) + rates(k,i)*rates(k,j);
        end
        C1(i,j) = C1(i,j)*(sum(rates(:,i))-1)^2;
    end
end

C2 = (sum(sum(rates))-1)^2;

QUBO = Q - C1 - lambda*C2;
%qubo_solver 通常用于解决二次无约束二元优化问题(QUBO)或二次无约束整数规划问题(QUIP)
solution = qubo_solver(qubo_matrix, 'qbsolv', 'timeout', 30, 'num_reads', 100);

。。。略,请下载完整代码

4 下载

查看知乎文章最底部的,或者私信我

zhuanlan.zhihu.com/p/621628668

目录
相关文章
RS-485网络中的标准端接与交流电端接应用解析
RS-485,作为一种广泛应用的差分信号传输标准,因其传输距离远、抗干扰能力强、支持多点通讯等优点,在工业自动化、智能建筑、交通运输等领域得到了广泛应用。在构建RS-485网络时,端接技术扮演着至关重要的角色,它直接影响到网络的信号完整性、稳定性和通信质量。
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
67 11
|
12天前
|
自然语言处理 并行计算 数据可视化
免费开源法律文档比对工具:技术解析与应用
这款免费开源的法律文档比对工具,利用先进的文本分析和自然语言处理技术,实现高效、精准的文档比对。核心功能包括文本差异检测、多格式支持、语义分析、批量处理及用户友好的可视化界面,广泛适用于法律行业的各类场景。
|
14天前
|
安全 编译器 PHP
PHP 8新特性解析与实践应用####
————探索PHP 8的创新功能及其在现代Web开发中的实际应用
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
医疗行业的语音识别技术解析:AI多模态能力平台的应用与架构
AI多模态能力平台通过语音识别技术,实现实时转录医患对话,自动生成结构化数据,提高医疗效率。平台具备强大的环境降噪、语音分离及自然语言处理能力,支持与医院系统无缝集成,广泛应用于门诊记录、多学科会诊和急诊场景,显著提升工作效率和数据准确性。
|
22天前
|
存储 安全 Java
系统安全架构的深度解析与实践:Java代码实现
【11月更文挑战第1天】系统安全架构是保护信息系统免受各种威胁和攻击的关键。作为系统架构师,设计一套完善的系统安全架构不仅需要对各种安全威胁有深入理解,还需要熟练掌握各种安全技术和工具。
64 10
|
17天前
|
机器学习/深度学习 人工智能 安全
TPAMI:安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析
【10月更文挑战第27天】强化学习(RL)在实际应用中展现出巨大潜力,但其安全性问题日益凸显。为此,安全强化学习(SRL)应运而生。近日,来自慕尼黑工业大学、同济大学和加州大学伯克利分校的研究人员在《IEEE模式分析与机器智能汇刊》上发表了一篇综述论文,系统介绍了SRL的方法、理论和应用。SRL主要面临安全性定义模糊、探索与利用平衡以及鲁棒性与可靠性等挑战。研究人员提出了基于约束、基于风险和基于监督学习等多种方法来应对这些挑战。
38 2
|
21天前
|
测试技术 开发者 Python
深入浅出:Python中的装饰器解析与应用###
【10月更文挑战第22天】 本文将带你走进Python装饰器的世界,揭示其背后的魔法。我们将一起探索装饰器的定义、工作原理、常见用法以及如何自定义装饰器,让你的代码更加简洁高效。无论你是Python新手还是有一定经验的开发者,相信这篇文章都能为你带来新的启发和收获。 ###
12 1
|
22天前
|
前端开发 JavaScript 开发者
揭秘前端高手的秘密武器:深度解析递归组件与动态组件的奥妙,让你代码效率翻倍!
【10月更文挑战第23天】在Web开发中,组件化已成为主流。本文深入探讨了递归组件与动态组件的概念、应用及实现方式。递归组件通过在组件内部调用自身,适用于处理层级结构数据,如菜单和树形控件。动态组件则根据数据变化动态切换组件显示,适用于不同业务逻辑下的组件展示。通过示例,展示了这两种组件的实现方法及其在实际开发中的应用价值。
28 1
|
25天前
|
传感器 监控 安全

推荐镜像

更多