算法设计与分析 前缀树与贪心算法

简介: 算法设计与分析 前缀树与贪心算法

前缀树与贪心算法

前缀树

前缀树介绍

例题:一个字符串类型的数组arr1,另一个字符串类型的数组arr2。

(1)arr2中有哪些字符,是在arr1中出现的

(2)arr2中有哪些字符,是在arr1中的某个字符串的前缀出现

(3)arr2中出现次数最多的前缀

  • 经典前缀树:字符串写在“路”上
  • image.png

数据结构

前缀树节点
    public static class TrieNode{
        public int pass; //表示形成前缀树时,该节点经过的次数
        public int end; //该节点是多少个字符串的结尾节点
        public TrieNode[] nexts; //类似于HashMap<char, Node> nexts; 当字符特别多的时候可以使用HashMap
        public TrieNode(){
            //构造函数初始化
            pass = 0;
            end = 0;
            //nexts[0] == null 没有走向'a'的路
            //nexts[0] != null 有走向'a'的路
            //……
            //next[25] != null 有走向'z'的路
            nexts = new TrieNode[26];
        }
    }
    public static class Trie{
        //头节点
        private TrieNode root;
        public Trie(){
            //初始化
            root = new TrieNode();
        }
    //插入,删除,查找……方法
   }

9c5484319b884b348b9786a8b0feacd6.png

image.png

使用场景

  1. 字符串的查找
  2. 部分字符的在字符串中作为前缀的使用次数

主要方法

添加字符串
    public static class Trie{
        //头节点
        private TrieNode root;
        public Trie(){
            //初始化
            root = new TrieNode();
        }
        public void insert(String word){
            //沿途的pass++,结束节点的end++
            if (word == null){
                return;
            }
            //将字符串转化为字符数组
            char[] chars = word.toCharArray();
            TrieNode node = root;
            root.pass++; //通过根节点
            int index = 0;
            for (char ch : chars) {
                //遍历字符数组
                index = ch - 'a'; //由字符,对应到路
                if (node.nexts[index] == null) {
                    //判断该路是否存在
                    node.nexts[index] = new TrieNode();
                }
                node = node.nexts[index]; //移动node
                node.pass++;
            }
            node.end++; //最后一个节点
        }
    }
检查字符串加入次数
        public int search(String word){
          //查看结束节点的end
            if (word== null){
                return 0;
            }
            char[] chars = word.toCharArray();
            TrieNode node = root;
            int index = 0;
            for (char ch : chars){
                index = ch - 'a';
                if (node.nexts[index] == null){
                    //不存在该字符串
                    return 0;
                }
                node = node.nexts[index];
            }
            return node.end;
        }
检查以pre为前缀的字符串个数
        public int prefixNumber(String pre){
          //查看结束节点的pass
            if (pre == null){
                return 0;
            }
            char[] chars = pre.toCharArray();
            TrieNode node = root;
            int index = 0;
            for (char ch : chars){
                index = ch - 'a';
                if (node.nexts[index] == null){
                    //不存在该前缀
                    return 0;
                }
                node = node.nexts[index];
            }
            return node.pass;
        }
删除字符串
        public void delete(String word){
            //沿途节点的pass--,结束节点的end--
            //如果沿途节点--pass == 0,直接释放该节点及其以后节点
            if (search(word) == 0){
                return;
            }
            char[] chars = word.toCharArray();
            TrieNode node = root;
            root.pass--;
            int index = 0;
            for (char ch : chars){
                index = ch - 'a';
                if (--node.nexts[index].pass == 0){
                  //java写法,C++要遍历
                    node.nexts[index] = null;
                }
                node = node.nexts[index];
            }
            node.end--;
        }

贪心算法

概述

  • 在某一个标准下,优先考虑满足标准的样本,最后考虑最不满足标准的样本,最终得到一个答案的算法,叫作贪心算法
  • 也就是说,不从整体最优上加以考虑,所做出的是某种意义上的局部最优解
  • 局部 —?--->整体最优

题目一:会议室安排(任务安排)

image.png

  • 贪心策略一:先安排开始时间早的?错误:只可能是局部最优不可能全局最优
  • 贪心策略二:先安排持续时间短的?错误:若短时间的任务同时于多个别的任务时间重合则会导致会议室使用效率下降‘
  • 贪心策略三:先安排结束时间早的?正确
    public static class Program{
        //项目类
        public int start; //开始时间
        public int end; //结束时间
        public Program(int start, int end){
            //初始化
            this.start = start;
            this.end = end;
        }
    }
    public static class ProgramComparator implements Comparator<Program>{
        //比较器
       @Override
        public int compare(Program o1, Program o2){
            return o1.end - o2.end;
        }
    }
    public static int bestArrange(Program[] programs, int timePoint){
        //timePoint:开始时间 + 目前时间
        //按照结束时间对项目进行排序
        Arrays.sort(programs, new ProgramComparator());
        int result = 0; //记录项目个数
        for (Program program : programs){
            //按照结束时间的次序遍历 
            if (timePoint <= program.start){
                //当目前的时间小于项目开始的时间
                result++;
                timePoint = program.end;
            }
        }
        return result;
    }

题目二:分割金条(哈夫曼编码)

image.png

  • 贪心策略:将数组中的数字组成哈夫曼树,整个哈夫曼树就是分割的最小代价
  • 技巧:使用小根堆构造哈夫曼树
    public static int lessMoney(int[] arr){
        //使用小根堆构造哈夫曼树
        PriorityQueue<Integer> heap = new PriorityQueue<>();
        for (int i : arr){
            //将数组加入小根堆
            heap.add(i);
        }
        int sum = 0;
        while (!heap.isEmpty()){
            int temp = heap.poll() + heap.poll();
            sum += temp;
            heap.add(temp);
        }
        return sum;
    }

题目三:投资问题

image.png

  • 贪心策略:使用初始资金的大小先挑选出初始资金大于花费的项目,再从这些项目中挑选出利润最大的项目优先去做,每次做完项目积累到资金后立刻重新挑选
  • 技巧:先建立costs花费数组的小根堆(类似于锁)解锁花费小于资金的项目到profits建立的大根堆中,从大根堆中选取项目
    public static class Project{
        public int cost; //花费
        public int profit; //利润
        public Project(int cost, int profit){
            //初始化
            this.cost = cost;
            this.profit = profit;
        }
    }
    public static class minCostComparator implements Comparator<Project>{
        //花费的比较器
        @Override
        public int compare(Project o1, Project o2){
            return o1.cost - o2.cost;
        }
    }
    public static class maxProfitComparator implements Comparator<Project>{
        //利润的比较器
        @Override
        public int compare(Project o1, Project o2){
            return o2.profit - o1.profit;
        }
    }
    public static int maxMoney(int k, int m, int[] costs, int[] profits){
        //花费的小根堆
        PriorityQueue<Project> minCosts= new PriorityQueue<>(new minCostComparator());
        //利润的大根堆
        PriorityQueue<Project> maxProfits = new PriorityQueue<>(new maxProfitComparator());
        for (int i = 0; i < costs.length; i++){
            //项目加入花费的小根堆
            minCosts.add(new Project(costs[i], profits[i]));
        }
        for (int i = 0; i < k; i++){
            //完成k个项目
            while (!minCosts.isEmpty() && minCosts.peek().cost < m){
                //解锁满足条件的项目到利润的大根堆
                maxProfits.add(minCosts.poll());
            }
            if (maxProfits.isEmpty()){
                //能够实现的项目已经全部完成
                return m;
            }
            //选择利润中最大的一个
            m += maxProfits.poll().profit;
        }
        return m;
    }

题目四:数据流求中位数(大根堆与小根堆的结合)

image.png

  • 思路:加入数据时一分为二,较大的一部分,较小的一部分,便可以随时得到中位数
  • 技巧:
    (1)准备一个大根堆和一个小根堆
    (2)每次加入数字时先与大根堆的堆顶进行元素的比较(当前元素 <= 大根堆堆顶)
    (3)若是则进入大根堆,若否则进入小根堆
    (4)进行大小根堆规模的比较,若规模的大小差值达到2则将规模较大的堆顶加入规模较小的堆
    (5)重复2,3,4则较小的部分在大根堆中,较大的部分在小根堆中,中位数便可通过两个堆顶获得
    public static class maxInt implements Comparator<Integer>{
        //大根堆的比较器
        @Override
        public int compare(Integer o1, Integer o2){
            return o2 - o1;
        }
    }
    public static int getMedian(int[] nums){
        //数据流num返回中位数
        //小根堆
        PriorityQueue<Integer> minHeap = new PriorityQueue<>();
        //大根堆
        PriorityQueue<Integer> maxHeap = new PriorityQueue<>(new maxInt());
        //第一个元素进入大根堆
        maxHeap.add(nums[0]);
        for (int i = 1; i < nums.length; i++){
            //遍历数组
            if (nums[i] <= maxHeap.peek()){
                //判断加入大根堆还是小根堆
                maxHeap.add(nums[i]);
            }
            else {
                minHeap.add(nums[i]);
            }
            if (maxHeap.size() - minHeap.size() == 2){
                //大根堆的规模比小根堆的规模大 2
                minHeap.add(maxHeap.poll());
            }
            else if (minHeap.size() - maxHeap.size() == 2){
                //小根堆的规模比大根堆的规模大 2
                maxHeap.add(minHeap.poll());
            }
        }
        if (minHeap.size() == maxHeap.size()){
            //nums数组为偶数个
            return (minHeap.poll() + maxHeap.poll())/ 2;
        }
        else if (minHeap.size() - maxHeap.size() == 1){
            //小根堆多一个
            return minHeap.poll();
        }
        else {
            //大根堆多一个
            return maxHeap.poll();
        }
    }


目录
相关文章
|
9月前
|
数据采集 机器学习/深度学习 算法
别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?
别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?
625 4
|
7月前
|
机器学习/深度学习 边缘计算 算法
NOMA和OFDMA优化算法分析
NOMA和OFDMA优化算法分析
384 127
|
4月前
|
运维 监控 JavaScript
基于 Node.js 图结构的局域网设备拓扑分析算法在局域网内监控软件中的应用研究
本文探讨图结构在局域网监控系统中的应用,通过Node.js实现设备拓扑建模、路径分析与故障定位,提升网络可视化、可追溯性与运维效率,结合模拟实验验证其高效性与准确性。
293 3
|
4月前
|
存储 边缘计算 算法
【太阳能学报EI复现】基于粒子群优化算法的风-水电联合优化运行分析(Matlab代码实现)
【太阳能学报EI复现】基于粒子群优化算法的风-水电联合优化运行分析(Matlab代码实现)
101 0
|
5月前
|
机器学习/深度学习 算法 5G
【MUSIC、最大似然与克拉美-罗下界】MUSIC与ESPRIT 算法来估计到达角(AoA),并尝试推导克拉美-罗下界(CRLB)以分析其性能研究(Matlab代码实现)
【MUSIC、最大似然与克拉美-罗下界】MUSIC与ESPRIT 算法来估计到达角(AoA),并尝试推导克拉美-罗下界(CRLB)以分析其性能研究(Matlab代码实现)
242 0
|
6月前
|
编解码 算法 5G
MIMO雷达空间谱估计中Capon算法与MUSIC算法的对比分析及实现
MIMO雷达空间谱估计中Capon算法与MUSIC算法的对比分析及实现
518 2
|
6月前
|
人工智能 自然语言处理 算法
2025 年 7 月境内深度合成服务算法备案情况分析报告
2025年7月,中央网信办发布第十二批深度合成算法备案信息,全国389款产品通过备案,服务提供者占比超七成。截至7月14日,全国累计备案达3834款,覆盖文本、图像、音视频等多模态场景,广泛应用于生活服务、医疗、金融等领域。广东以135款居首,数字人、AI客服等C端应用主导,民营企业成主力,国企聚焦公共服务。随着AI政策推动,备案已成为AI产品合规上线关键环节。
|
9月前
|
存储 监控 算法
员工行为监控软件中的 Go 语言哈希表算法:理论、实现与分析
当代企业管理体系中,员工行为监控软件已逐步成为维护企业信息安全、提升工作效能的关键工具。这类软件能够实时记录员工操作行为,为企业管理者提供数据驱动的决策依据。其核心支撑技术在于数据结构与算法的精妙运用。本文聚焦于 Go 语言中的哈希表算法,深入探究其在员工行为监控软件中的应用逻辑与实现机制。
230 14
|
10月前
|
自然语言处理 算法 安全
境内深度合成服务算法备案通过名单分析报告
本报告基于《境内深度合成服务算法备案通过名单》,分析了2023年6月至2025年3月公布的10批备案数据,涵盖属地分布、行业应用及产品形式等多个维度。报告显示,深度合成算法主要集中于经济发达地区,如北京、广东、上海等地,涉及教育、医疗、金融、娱乐等多行业。未来趋势显示技术将向多模态融合、行业定制化和安全合规方向发展。建议企业加强技术研发、拓展应用场景、关注政策动态,以在深度合成领域抢占先机。此分析旨在为企业提供参考,助力把握技术发展机遇。
境内深度合成服务算法备案通过名单分析报告
|
10月前
|
供应链 算法 搜索推荐
从公布的前十一批其他算法备案通过名单分析
2025年3月12日,国家网信办发布算法备案信息,深度合成算法通过395款,其他算法45款。前10次备案中,深度合成算法累计3234款,其他类别647款。个性化推送类占比49%,涵盖电商、资讯、视频推荐;检索过滤类占31.53%,用于搜索优化和内容安全;调度决策类占9.12%,集中在物流配送等;排序精选类占8.81%,生成合成类占1.55%。应用领域包括电商、社交媒体、物流、金融、医疗等,互联网科技企业主导,技术向垂直行业渗透,内容安全和多模态技术成新增长点。未来大模型检索和多模态生成或成重点。
从公布的前十一批其他算法备案通过名单分析