php hash算法类

简介: php hash算法类

hash算法,又称散列算法,杂凑算法

它可以将一个长度不固定的数据,通过算法,获取其特征值生成一个固定的,较短的数据,压缩其文件标识.

实现用一个较短的数据进行标识一个大数据标识.比如用32位字符串的md5,标识整个文件

我们可以自定义一个算法,将中文字符串,只获取拼音首字母的特征,转成hash:

"仙士可"=>'xsk'

"阿伟死了"=>'awsl'

如果使用中文表示,需要的字符串长度是字母缩写的2-4倍.

重复性

通过上面的例子,我们可能会发现一些问题,例如: "啊我死了" ,"阿王死了",都会对应 'awsl'

这时候,就发生了 哈希冲突,  不同的数据,可能会因为提取特征值,而产生相同的hash结果

逆推性

可以发现,我们可以通过 "sl","sb","nt"等字母,很容易隐隐约约的知道原来的中文意思

这就造成了如果我们中文的一句话如果都有这些意思,那生成的hash重复性将会非常大.

因此,一个优秀的hash算法,应该具备以下条件:

1:正向快速计算,能通过输入的数据,在有限的时间,利用有限的资源就能计算出hash值(比如说你要用数据 做1亿次加减乘除法计算,虽然很难重复了,但是每次都计算1亿次,非常不现实)

2:逆向困难,hash字符串不能直接被逆向推算出.

3:输入敏感,原始信息就算多了一个空格,也应该跟原来的字符串非常不一致

4:冲突避免,hash的数据应该尽可能避免冲突,均匀分布,否则将失去hash本身的特性

目前最经典的hash算法有md5,time33,sha

在实际使用中,md5是字符串hash,并且性能较差,php在hashtable中hash计算使用的是time33算法.

最后附带上使用php实现的各种流行hash算法

<?php
class Hash
{
    /**
     * 加法hash
     * additiveHash
     * @param string $key
     * @param int    $mask
     * @return int
     * @author tioncico
     * Time: 11:38 上午
     */
    public static function additiveHash(string $key, $mask = 0x8765fed1)
    {
        for ($hash = strlen($key), $i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash += $charIndex;
        }
        return ($hash % $mask);
    }
    /**
     * 旋转hash
     * rotatingHash
     * @param string $key
     * @param int    $mask
     * @return int
     * @author tioncico
     * Time: 11:38 上午
     */
    public static function rotatingHash(string $key, $mask = 0x8765fed1)
    {
        for ($hash = strlen($key), $i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 4) ^ ($hash >> 28) ^ $charIndex;
        }
//        return ($hash % $prime);
        return ($hash ^ ($hash >> 10) ^ ($hash >> 20)) & $mask;
    }
    /**
     * 一次一个hash
     * oneByOneHash
     * @param     $key
     * @param int $mask
     * @return int
     * @author tioncico
     * Time: 11:38 上午
     */
    public static function oneByOneHash(string $key, $mask = 0x8765fed1)
    {
        for ($hash = strlen($key), $i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash += $charIndex;
            $hash += $hash << 10;
            $hash ^= $hash >> 6;
        }
        $hash += ($hash << 3);
        $hash ^= ($hash >> 11);
        $hash += ($hash << 15);
        return $hash & $mask;
    }
    public static function time33(string $key)
    {
        // hash($i) = hash($i-1) * 33 + str\[$i\]
        $hash = 5381;
        for ($i = 0; $i < strlen($key); $i++) {
            // (hash << 5) + hash 相当于 hash * 33
            //$hash = sprintf("%u", $hash * 33) + ord($s{$i});
            //$hash = ($hash * 33 + ord($s{$i})) & 0x7FFFFFFF;
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 5) + $hash + $charIndex;
        }
        return $hash & 0x7FFFFFFF;
    }
    public static function fnvHash(string $key, $mask = 0x8765fed1, $mShift = 0)
    {
        $hash = 2166136261;
        $p = 16777619;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $p) ^ $charIndex;
        }
        if ($mShift == 0) {
            return $hash;
        }
        return ($hash ^ ($hash >> $mShift)) & $mask;
    }
    public static function fnvHash1(string $key)
    {
        $p = 16777619;
        $hash = 2166136261;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $p) ^ $charIndex;
        }
        $hash += $hash << 13;
        $hash ^= $hash >> 7;
        $hash += $hash << 3;
        $hash ^= $hash >> 17;
        $hash += $hash << 5;
        return $hash;
    }
    public static function intHash(int $key)
    {
        $key += ~($key << 15);
        $key ^= ~(self::uRight($key, 10));
        $key += ~($key << 3);
        $key ^= ~(self::uRight($key, 6));
        $key += ~($key << 11);
        $key ^= ~(self::uRight($key, 16));
        return $key;
    }
    protected static function uRight($a, $n)
    {
        $c = 2147483647 >> ($n - 1);
        return $c & ($a >> $n);
    }
    public static function rsHash(string $key)
    {
        $b = 3787551;
        $a = 636789;
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $a) + $charIndex;
            $a = $a * $b;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function jsHash(string $key)
    {
        $hash = 1315423911;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = (($hash << 5) + $charIndex + ($hash >> 2));
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function pjwHash(string $key)
    {
        $bitsInUnsignedInt = 32;
        $threeQuarters = ($bitsInUnsignedInt * 3) / 4;
        $oneEighth = $bitsInUnsignedInt / 8;
        $highBits = 0xFFFFFFFF << ($bitsInUnsignedInt - $oneEighth);
        $hash = 0;
        $test = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << $oneEighth) + $charIndex;
            if (($test = $hash & $highBits) != 0) {
                $hash = (($hash ^ ($test >> $threeQuarters)) & (~$highBits));
            }
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function elfHash(string $key)
    {
        $hash = 0;
        $x = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 4) + $charIndex;
            if (($x = (int)$hash & 0xF0000000 != 0)) {
                $hash ^= ($x >> 24);
                $hash &= ~$x;
            }
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function bkdrHash(string $key)
    {
        $hash = 0;
        $seed = 131; //31 131 1313 13131 131313
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash * $seed) + $charIndex;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function sdbmHash(string $key)
    {
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = $charIndex + ($hash << 6) + ($hash >> 15) - $hash;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function dekHash(string $key)
    {
        $hash = strlen($key);
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = ($hash << 5) ^ ($hash >> 27) ^ $charIndex;
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function apHash(string $key)
    {
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash ^= (($i & 1) == 0) ? (($hash << 7) ^ $charIndex ^ ($hash >> 3)) : (~(($hash << 11) ^ $charIndex ^ ($hash >> 5)));
        }
        return ($hash & 0x7FFFFFFF);
    }
    public static function javaHash(string $key)
    {
        $hash = 0;
        for ($i = 0; $i < strlen($key); $i++) {
            $charIndex = ord($key\[$i\]);
            $hash = 31 * $hash + $charIndex;
        }
        return ($hash & 0x7FFFFFFF);
    }
}

参考文章:https://blog.csdn.net/wzygis/article/details/101112678

目录
相关文章
|
3月前
|
存储 算法 Java
Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性
Java Set因其“无重复”特性在集合框架中独树一帜。本文解析了Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定数据结构和算法确保元素唯一性,并提供了最佳实践建议,包括选择合适的Set实现类和正确实现自定义对象的hashCode()与equals()方法。
57 4
|
3月前
|
设计模式 SQL 安全
PHP中的设计模式:单例模式的深入探索与实践在PHP开发领域,设计模式是解决常见问题的高效方案集合。它们不是具体的代码,而是一种编码和设计经验的总结。单例模式作为设计模式中的一种,确保了一个类仅有一个实例,并提供一个全局访问点。本文将深入探讨单例模式的基本概念、实现方式及其在PHP中的应用。
单例模式在PHP中的应用广泛,尤其在处理数据库连接、日志记录等场景时,能显著提高资源利用率和执行效率。本文从单例模式的定义出发,详细解释了其在PHP中的不同实现方法,并探讨了使用单例模式的优势与注意事项。通过对示例代码的分析,读者将能够理解如何在PHP项目中有效应用单例模式。
|
4月前
|
设计模式 SQL 安全
PHP中的设计模式:单例模式的深入探索与实践在PHP的编程实践中,设计模式是解决常见软件设计问题的最佳实践。单例模式作为设计模式中的一种,确保一个类只有一个实例,并提供全局访问点,广泛应用于配置管理、日志记录和测试框架等场景。本文将深入探讨单例模式的原理、实现方式及其在PHP中的应用,帮助开发者更好地理解和运用这一设计模式。
在PHP开发中,单例模式通过确保类仅有一个实例并提供一个全局访问点,有效管理和访问共享资源。本文详细介绍了单例模式的概念、PHP实现方式及应用场景,并通过具体代码示例展示如何在PHP中实现单例模式以及如何在实际项目中正确使用它来优化代码结构和性能。
60 2
|
4月前
|
PHP
PHP中的面向对象编程:理解类与对象
本文将深入探讨PHP中面向对象编程的核心概念——类与对象。通过实例讲解,帮助读者更好地理解如何在PHP中运用OOP编写更高效、可维护的代码。
67 9
|
5月前
|
搜索推荐 算法 Java
现有一个接口DataOperation定义了排序方法sort(int[])和查找方法search(int[],int),已知类QuickSort的quickSort(int[])方法实现了快速排序算法
该博客文章通过UML类图和Java源码示例,展示了如何使用适配器模式将QuickSort类和BinarySearch类的排序和查找功能适配到DataOperation接口中,实现算法的解耦和复用。
57 1
现有一个接口DataOperation定义了排序方法sort(int[])和查找方法search(int[],int),已知类QuickSort的quickSort(int[])方法实现了快速排序算法
|
5月前
|
PHP 开发者
PHP中的面向对象编程:掌握类与对象的精髓
探索PHP的面向对象编程世界,本文将带你了解如何通过创建和操作类来实例化对象。我们将深入讲解类的声明、构造函数的使用以及继承和多态性的概念。准备好,让我们一起在代码的海洋中航行,揭开PHP对象编程的神秘面纱!
|
5月前
|
数据采集 算法 数据可视化
基于K-Means聚类算法对球员数据的聚类分析,可以自主寻找最优聚类数进行聚类
本文介绍了一个基于K-Means聚类算法的NBA球员数据分析项目,该项目通过采集和分析球员的得分、篮板、助攻等统计数据,使用轮廓系数法和拐点法确定最优聚类数,将球员分为不同群组,并提供了一个可视化界面以便直观比较不同群组的球员表现。
107 0
基于K-Means聚类算法对球员数据的聚类分析,可以自主寻找最优聚类数进行聚类
|
6月前
创建KNN类
【7月更文挑战第22天】创建KNN类。
39 8
|
6月前
|
算法 数据库
|
7月前
|
数据采集 算法 安全
CVPR 2024:给NeRF开透视眼!稀疏视角下用X光进行三维重建,9类算法工具包全开源
【6月更文挑战第28天】CVPR 2024亮点:SAX-NeRF框架开源!融合X光与NeRF,提升3D重建效果。X3D数据集验证,Lineformer+MLG策略揭示物体内部结构,增强几何理解。虽有计算成本及泛化挑战,但为计算机视觉和医学影像开辟新路径。[论文链接](https://arxiv.org/abs/2311.10959)**
206 5