采用归并排序算法查找两个字符串数组中的不同数据

简介:   现在项目中有需求比较两个字符串数组,找出其中不同的部分,并保存到本地txt。实现方式每个人都有自己的思路,这里提供一种通过归并排序实现的方式供大家参考。

  现在项目中有需求比较两个字符串数组,找出其中不同的部分,并保存到本地txt。实现方式每个人都有自己的思路,这里提供一种通过归并排序实现的方式供大家参考。

  基本思路是数组A和数组B对比,使用数组a来保存数组A中比数组B中多的元素(即在A中存在,B中不存在的元素),b来保存数据B中比数组A中多的元素(即B中存在,A中不存在的元素)。开始需要分别调用Sort()函数对A、B数组进行排序,然后使用CompareTo从两个数组中第一个数组进行比较,当A.0(A中第一个元素)>B.0时A.CompareTo(B)==1,当A.0=B.0时A.CompareTo(B)==0,当A.0<B.0时A.CompareTo(B)==-1。通过判断A.CompareTo(B)的值来执行a.add和b.add操作,最终就能得到a、b数组,然后写入到txt就可以了。

  核心代码如下:

 /// <summary>
    /// 归并排序: 查找两个集合中的不同数据
    /// </summary>
    /// <param name="root">源数据集合</param>
    /// <param name="source">新数据集合</param>
    /// <param name="remove">需在源数据中移除的集合</param>
    /// <param name="add">需在源数据中添加的集合</param>
    public void FindDistinct(List<string> root, List<string> source, out List<string> remove, out List<string> add)
    {
        remove = new List<string>();
        add = new List<string>();

        root.Sort();
        source.Sort();
        //foreach (string str in root) Console.WriteLine(str);
        //Console.WriteLine("\r\n");
        //foreach (string str in source) Console.WriteLine(str);
        //Console.WriteLine("\r\n");

        int i = 0, j = 0;
        while (i < root.Count && j < source.Count)
        {
            switch (root[i].CompareTo(source[j]))
            {
                case -1:
                    remove.Add(root[i]); i++;
                    break;
                case 0:
                    i++; j++;
                    break;
                case 1:
                    add.Add(source[j]); j++;
                    break;
            }
        }

        if (i < root.Count)
        {
            for (int m = i; m < root.Count; m++) remove.Add(root[m]);
        }
        else if (j < source.Count)
        {
            for (int m = j; m < source.Count; m++) add.Add(source[m]);
        }

        //Console.WriteLine("\r\nroot中不同的数据:");
        //foreach (string str in remove) Console.WriteLine(str);

        //Console.WriteLine("\r\nsource中不同的数据:");
        //foreach (string str in add) Console.WriteLine(str);
    }
  调用:

        List<string> remove;
        List<string> add;
        FindDistinct(rpqlist, pdflist, out remove, out add);
        //将strArray输出到文本文件
        using (TextWriter tw = new StreamWriter(@"D:\RPQ.txt"))
        {
            int index = 0;
            foreach (string str in remove)
            {
                string s = string.Format("{0:d3}\t{1}", index, str);
                tw.WriteLine(s);
                index++;
            }
        }
        using (TextWriter tw = new StreamWriter(@"D:\PDF.txt"))
        {
            int index = 0;
            foreach (string str in add)
            {
                string s = string.Format("{0:d3}\t{1}", index, str);
                tw.WriteLine(s);
                index++;
            }
        }
        MessageBox.Show("数据对比完毕,文件已经保存到D盘!");
  这里是对归并排序算法的一个小应用,希望对大家有所帮助,不足之处请大家批评指正。


目录
相关文章
|
1月前
|
存储 编解码 负载均衡
数据分片算法
【10月更文挑战第25天】不同的数据分片算法适用于不同的应用场景和数据特点,在实际应用中,需要根据具体的业务需求、数据分布情况、系统性能要求等因素综合考虑,选择合适的数据分片算法,以实现数据的高效存储、查询和处理。
|
2月前
|
算法 程序员 索引
数据结构与算法学习七:栈、数组模拟栈、单链表模拟栈、栈应用实例 实现 综合计算器
栈的基本概念、应用场景以及如何使用数组和单链表模拟栈,并展示了如何利用栈和中缀表达式实现一个综合计算器。
40 1
数据结构与算法学习七:栈、数组模拟栈、单链表模拟栈、栈应用实例 实现 综合计算器
|
1月前
|
存储 缓存 算法
分布式缓存有哪些常用的数据分片算法?
【10月更文挑战第25天】在实际应用中,需要根据具体的业务需求、数据特征以及系统的可扩展性要求等因素综合考虑,选择合适的数据分片算法,以实现分布式缓存的高效运行和数据的合理分布。
|
2月前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
92 1
两个字符串匹配出最长公共子序列算法
|
2月前
|
机器学习/深度学习 人工智能 算法
"拥抱AI规模化浪潮:从数据到算法,解锁未来无限可能,你准备好迎接这场技术革命了吗?"
【10月更文挑战第14天】本文探讨了AI规模化的重要性和挑战,涵盖数据、算法、算力和应用场景等方面。通过使用Python和TensorFlow的示例代码,展示了如何训练并应用一个基本的AI模型进行图像分类,强调了AI规模化在各行业的广泛应用前景。
34 5
|
2月前
|
算法 搜索推荐 Shell
数据结构与算法学习十二:希尔排序、快速排序(递归、好理解)、归并排序(递归、难理解)
这篇文章介绍了希尔排序、快速排序和归并排序三种排序算法的基本概念、实现思路、代码实现及其测试结果。
27 1
|
2月前
|
存储 算法 定位技术
数据结构与算法学习二、稀疏数组与队列,数组模拟队列,模拟环形队列
这篇文章主要介绍了稀疏数组和队列的概念、应用实例以及如何使用数组模拟队列和环形队列的实现方法。
25 0
数据结构与算法学习二、稀疏数组与队列,数组模拟队列,模拟环形队列
|
1月前
|
存储 JSON 算法
TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案
在使用 TDengine 存储时序数据时,压缩数据以节省磁盘空间是至关重要的。TDengine 支持用户根据自身数据特性灵活指定压缩算法,从而实现更高效的存储。然而,如何选择最合适的压缩算法,才能最大限度地降低存储开销?为了解决这一问题,我们特别推出了一个实用工具,帮助用户快速判断并选择最适合其数据特征的压缩算法。
42 0
|
2月前
|
人工智能 算法 前端开发
无界批发零售定义及无界AI算法,打破传统壁垒,累积数据流量
“无界批发与零售”是一种结合了批发与零售的商业模式,通过后端逻辑、数据库设计和前端用户界面实现。该模式支持用户注册、登录、商品管理、订单处理、批发与零售功能,并根据用户行为计算信用等级,确保交易安全与高效。
|
2月前
|
前端开发 算法 JavaScript
无界SaaS模式深度解析:算力算法、链接力、数据确权制度
私域电商的无界SaaS模式涉及后端开发、前端开发、数据库设计、API接口、区块链技术、支付和身份验证系统等多个技术领域。本文通过简化框架和示例代码,指导如何将核心功能转化为技术实现,涵盖用户管理、企业店铺管理、数据流量管理等关键环节。