数据审计 -本福德定律 Benford‘s law (sample database classicmodels _No.6)

简介: 数据审计 -本福德定律 Benford‘s law (sample database classicmodels _No.6)

数据审计 -本福德定律 Benford’s law

准备工作,可以去下载 classicmodels 数据库资源如下

[ 点击:classicmodels]


前言

假设 classicmodels 公司的 CEO 想知道 自己的 公司的数据是可能造假,于是找到了 小Tom kk 帮他分析数据。


一、什么是 本福德定律?

本福特定律,也称为本福德法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的机率就越低。它可用于检查各种数据是否有造假。


本福特定律最早由数学家暨天文学家纽康伯(Simon Newcomb)在1881年观察到,而通用电器公司的物理学家本福特(Frank Benford)博士在1938年正式将其公开发表。这一定律因其贡献而被命名为本福特定律。本福特通过对各种数值数据的分析,确定了从1到9中以任意数字n作为第一位数的概率为log10(1+1/n)。


在我们的日常生活中,以数字1开头的数字在各个领域中出现的频率似乎要高于其他数字。这就是著名的本福特定律,也被称为“第一位数定律”或者“首位数现象”。本文将详细介绍本福特定律的历史背景、原理,并且探讨它的应用领域和实际意义。


大家可以去看 下 百度的文章,

二、数学公式

以n开头的数的出现概率为log10(1 + 1/n)。

三、应用领域


会计欺诈检测

在刑事审判中的使用

宏观经济数据

价格数字分析

基因组数据

四、应用(看看是否有 会计、审计和欺诈检测。)

也称为第一位数字定律,规定在来自许多(但不是全部)现实生活数据源的数字列表中,前导数字以特定的、不均匀的方式分布。准确地说,P(d) = log 10 (1 + 1/d),其中 d 是 1-9 范围内的数字。因此,如果您对某列有 n 个观察值,则每个数字的预期值为 n*log 10 (1 + 1/d)


编写 SQL 代码来计算 Payments 中金额第一位数字的观察值和预期值。您需要使用卡方统计量来检验观察到的数据是否遵循本福德定律。

本福德定律

SELECT LEFT(amount,1) as Digit, COUNT(*) as Observed,
ROUND((SELECT COUNT(*) FROM Payments)*LOG10(1+1/left(amount,1)),0) as Expected
FROM Payments
GROUP BY Digit, Expected
ORDER BY Digit;

卡方统计

excel 永远是神器

用CHISQ.TEST进行卡方检验,得到P值,如果P值小于0.05,则拒绝观察的样本跟期望的样本比例一致。

总结

本福德定律在在统计学用的比较多。特别是上市公司财报。最后谢谢大家。

希望大家喜欢 , 谢谢大家,我一直在一边面试,一边学习,一边考证,一边写作,充实自己。

目录
相关文章
|
1天前
|
关系型数据库 MySQL 数据库
mysql 8.0 递归(例子分享)(sample database classicmodels _No.4)
本文介绍了如何在MySQL8.0中使用递归查询处理部门表和员工表的树形结构数据,包括查看文档、准备数据、递归处理以及提取层级信息。作者通过示例展示了WITHRECURSIVE语句的应用及其在数仓中的结构表示。
6 2
|
1天前
|
安全 关系型数据库 MySQL
mysql8.0 正值表达式Regular expressions (sample database classicmodels _No.5)
本文介绍了MySQL8.0中的正值表达式及其相关函数,通过实例展示了如何使用正则表达式进行字符串匹配,并提出了关于执行效率的问题。
9 1
|
1天前
|
存储 关系型数据库 MySQL
环比、环比增长率、同比、同比增长率 ,占比,Mysql 8.0 实例(最简单的方法之一)(sample database classicmodels _No.2 )
环比、环比增长率、同比、同比增长率 ,占比,Mysql 8.0 实例(最简单的方法之一)(sample database classicmodels _No.2 )
8 1
|
1天前
|
SQL 前端开发 关系型数据库
全表数据核对 ,行数据核对,列数据核对,Mysql 8.0 实例(sample database classicmodels _No.3 )
全表数据核对 ,行数据核对,列数据核对,Mysql 8.0 实例(sample database classicmodels _No.3 )
5 0
全表数据核对 ,行数据核对,列数据核对,Mysql 8.0 实例(sample database classicmodels _No.3 )
|
1天前
|
SQL Oracle 关系型数据库
窗口函数(sample database classicmodels _No.8 )
本文介绍了SQL中的窗口函数,包括其概念、语法以及在实例中的应用。重点讲解了如何使用窗口函数进行聚合、排序和分析操作,特别提到了MySQL中常见的四个窗口函数:DENSE_RANK(),RANK(),ROW_NUMBER(),LAG()。
7 0
|
1天前
|
存储 Oracle 数据建模
大工程 从0到1 数据治理 之数据模型和设计篇(sample database classicmodels _No.7)
大工程 从0到1 数据治理 之数据模型和设计篇(sample database classicmodels _No.7)
4 0
|
1天前
|
存储 SQL NoSQL
大工程 从0到1 数据治理 数仓篇(sample database classicmodels _No.7)
大工程 从0到1 数据治理 数仓篇(sample database classicmodels _No.7)
4 0
|
1天前
|
算法 关系型数据库 MySQL
复购率 mysql 实例(sample database classicmodels _No.1 )
复购率 mysql 实例(sample database classicmodels _No.1 )
4 0
|
5月前
|
SQL Oracle 关系型数据库
WARNING: Too Many Parse Errors With error=911 When Running a JDBC Application Connected to an Oracle 19c database
WARNING: Too Many Parse Errors With error=911 When Running a JDBC Application Connected to an Oracle 19c database (
84 2
|
5月前
|
Oracle 关系型数据库
19c 开启Oracle Database Vault
19c 开启Oracle Database Vault
150 1