php hash算法类

简介: php hash算法类

hash算法,又称散列算法,杂凑算法

它可以将一个长度不固定的数据,通过算法,获取其特征值生成一个固定的,较短的数据,压缩其文件标识.

实现用一个较短的数据进行标识一个大数据标识.比如用32位字符串的md5,标识整个文件

我们可以自定义一个算法,将中文字符串,只获取拼音首字母的特征,转成hash:

"仙士可"=>'xsk'

"阿伟死了"=>'awsl'

如果使用中文表示,需要的字符串长度是字母缩写的2-4倍.

重复性

通过上面的例子,我们可能会发现一些问题,例如: "啊我死了" ,"阿王死了",都会对应 'awsl'

这时候,就发生了 哈希冲突,  不同的数据,可能会因为提取特征值,而产生相同的hash结果

逆推性

可以发现,我们可以通过 "sl","sb","nt"等字母,很容易隐隐约约的知道原来的中文意思

这就造成了如果我们中文的一句话如果都有这些意思,那生成的hash重复性将会非常大.

因此,一个优秀的hash算法,应该具备以下条件:

1:正向快速计算,能通过输入的数据,在有限的时间,利用有限的资源就能计算出hash值(比如说你要用数据 做1亿次加减乘除法计算,虽然很难重复了,但是每次都计算1亿次,非常不现实)

2:逆向困难,hash字符串不能直接被逆向推算出.

3:输入敏感,原始信息就算多了一个空格,也应该跟原来的字符串非常不一致

4:冲突避免,hash的数据应该尽可能避免冲突,均匀分布,否则将失去hash本身的特性

目前最经典的hash算法有md5,time33,sha

在实际使用中,md5是字符串hash,并且性能较差,php在hashtable中hash计算使用的是time33算法.

最后附带上使用php实现的各种流行hash算法

<?php
class Hash
{
    /**
     * 加法hash
     * additiveHash
     * @param string $key
     * @param int    $mask
     * @return int
     * @author tioncico
     * Time: 11:38 上午
     */
    public static function additiveHash(string $key, $mask = 0x8765fed1)
    {
        for ($hash = strlen($key), $i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash += $charIndex;
        }
        return ($hash % $mask);
    }
    /**
     * 旋转hash
     * rotatingHash
     * @param string $key
     * @param int    $mask
     * @return int
     * @author tioncico
     * Time: 11:38 上午
     */
    public static function rotatingHash(string $key, $mask = 0x8765fed1)
    {
        for ($hash = strlen($key), $i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 4) ^ ($hash >> 28) ^ $charIndex;
        }
//        return ($hash % $prime);
        return ($hash ^ ($hash >> 10) ^ ($hash >> 20)) & $mask;
    }
    /**
     * 一次一个hash
     * oneByOneHash
     * @param     $key
     * @param int $mask
     * @return int
     * @author tioncico
     * Time: 11:38 上午
     */
    public static function oneByOneHash(string $key, $mask = 0x8765fed1)
    {
        for ($hash = strlen($key), $i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash += $charIndex;
            $hash += $hash << 10;
            $hash ^= $hash >> 6;
        }
        $hash += ($hash << 3);
        $hash ^= ($hash >> 11);
        $hash += ($hash << 15);
        return $hash & $mask;
    }
    public static function time33(string $key)
    {
        // hash($i) = hash($i-1) * 33 + str\[$i\]
        $hash = 5381;
        for ($i = 0; $i < strlen($key); $i++) {
            // (hash << 5) + hash 相当于 hash * 33
            //$hash = sprintf("%u", $hash * 33) + ord($s{$i});
            //$hash = ($hash * 33 + ord($s{$i})) & 0x7FFFFFFF;
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 5) + $hash + $charIndex;
        }
        return $hash & 0x7FFFFFFF;
    }
    public static function fnvHash(string $key, $mask = 0x8765fed1, $mShift = 0)
    {
        $hash = 2166136261;
        $p = 16777619;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $p) ^ $charIndex;
        }
        if ($mShift == 0) {
            return $hash;
        }
        return ($hash ^ ($hash >> $mShift)) & $mask;
    }
    public static function fnvHash1(string $key)
    {
        $p = 16777619;
        $hash = 2166136261;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $p) ^ $charIndex;
        }
        $hash += $hash << 13;
        $hash ^= $hash >> 7;
        $hash += $hash << 3;
        $hash ^= $hash >> 17;
        $hash += $hash << 5;
        return $hash;
    }
    public static function intHash(int $key)
    {
        $key += ~($key << 15);
        $key ^= ~(self::uRight($key, 10));
        $key += ~($key << 3);
        $key ^= ~(self::uRight($key, 6));
        $key += ~($key << 11);
        $key ^= ~(self::uRight($key, 16));
        return $key;
    }
    protected static function uRight($a, $n)
    {
        $c = 2147483647 >> ($n - 1);
        return $c & ($a >> $n);
    }
    public static function rsHash(string $key)
    {
        $b = 3787551;
        $a = 636789;
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $a) + $charIndex;
            $a = $a * $b;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function jsHash(string $key)
    {
        $hash = 1315423911;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = (($hash << 5) + $charIndex + ($hash >> 2));
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function pjwHash(string $key)
    {
        $bitsInUnsignedInt = 32;
        $threeQuarters = ($bitsInUnsignedInt * 3) / 4;
        $oneEighth = $bitsInUnsignedInt / 8;
        $highBits = 0xFFFFFFFF << ($bitsInUnsignedInt - $oneEighth);
        $hash = 0;
        $test = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << $oneEighth) + $charIndex;
            if (($test = $hash & $highBits) != 0) {
                $hash = (($hash ^ ($test >> $threeQuarters)) & (~$highBits));
            }
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function elfHash(string $key)
    {
        $hash = 0;
        $x = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 4) + $charIndex;
            if (($x = (int)$hash & 0xF0000000 != 0)) {
                $hash ^= ($x >> 24);
                $hash &= ~$x;
            }
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function bkdrHash(string $key)
    {
        $hash = 0;
        $seed = 131; //31 131 1313 13131 131313
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $seed) + $charIndex;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function sdbmHash(string $key)
    {
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = $charIndex + ($hash << 6) + ($hash >> 15) - $hash;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function dekHash(string $key)
    {
        $hash = strlen($key);
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 5) ^ ($hash >> 27) ^ $charIndex;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function apHash(string $key)
    {
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash ^= (($i & 1) == 0) ? (($hash << 7) ^ $charIndex ^ ($hash >> 3)) : (~(($hash << 11) ^ $charIndex ^ ($hash >> 5)));
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function javaHash(string $key)
    {
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = 31 * $hash + $charIndex;
        }
        return ($hash & 0x7FFFFFFF);
    }
}

参考文章:https://blog.csdn.net/wzygis/article/details/101112678

目录
相关文章
|
6天前
|
搜索推荐 算法 Java
现有一个接口DataOperation定义了排序方法sort(int[])和查找方法search(int[],int),已知类QuickSort的quickSort(int[])方法实现了快速排序算法
该博客文章通过UML类图和Java源码示例,展示了如何使用适配器模式将QuickSort类和BinarySearch类的排序和查找功能适配到DataOperation接口中,实现算法的解耦和复用。
现有一个接口DataOperation定义了排序方法sort(int[])和查找方法search(int[],int),已知类QuickSort的quickSort(int[])方法实现了快速排序算法
|
13天前
|
数据采集 算法 数据可视化
基于K-Means聚类算法对球员数据的聚类分析,可以自主寻找最优聚类数进行聚类
本文介绍了一个基于K-Means聚类算法的NBA球员数据分析项目,该项目通过采集和分析球员的得分、篮板、助攻等统计数据,使用轮廓系数法和拐点法确定最优聚类数,将球员分为不同群组,并提供了一个可视化界面以便直观比较不同群组的球员表现。
基于K-Means聚类算法对球员数据的聚类分析,可以自主寻找最优聚类数进行聚类
|
28天前
创建KNN类
【7月更文挑战第22天】创建KNN类。
22 8
|
1月前
|
算法 数据库
|
1月前
|
算法 PHP
【php经典算法】冒泡排序,冒泡排序原理,冒泡排序执行逻辑,执行过程,执行结果 代码
【php经典算法】冒泡排序,冒泡排序原理,冒泡排序执行逻辑,执行过程,执行结果 代码
17 1
|
2月前
|
数据采集 算法 安全
CVPR 2024:给NeRF开透视眼!稀疏视角下用X光进行三维重建,9类算法工具包全开源
【6月更文挑战第28天】CVPR 2024亮点:SAX-NeRF框架开源!融合X光与NeRF,提升3D重建效果。X3D数据集验证,Lineformer+MLG策略揭示物体内部结构,增强几何理解。虽有计算成本及泛化挑战,但为计算机视觉和医学影像开辟新路径。[论文链接](https://arxiv.org/abs/2311.10959)**
65 5
|
2月前
|
算法 PHP 数据中心
基于php雪花算法工具类Snowflake -来自chatGPT
基于php雪花算法工具类Snowflake -来自chatGPT
32 2
|
1月前
|
PHP
如何在PHP中创建一个自定义的观察者类?
【7月更文挑战第2天】如何在PHP中创建一个自定义的观察者类?
13 0
|
1月前
|
PHP
PHP中,你可以使用class关键字来定义一个类
【7月更文挑战第2天】PHP中,你可以使用class关键字来定义一个类
15 0
|
2月前
|
搜索推荐 算法 Java
JAVA中的交换类排序算法详解
JAVA中的交换类排序算法详解
29 1