【POI xls Java map】使用POI处理xls 抽取出异常信息 --java1.8Group by ---map迭代 -- 设置单元格高度

简介:  代码处理逻辑:  代码流程: 1.首先需要创建一个实体 用来存储 相关信息 1 package com.sxd.test.unusualName; 2 3 public class NameEntity { 4 5 private String ...

 

代码处理逻辑:

 

 

代码流程:

 

1.首先需要创建一个实体 用来存储 相关信息

 1 package com.sxd.test.unusualName;
 2 
 3 public class NameEntity {
 4     
 5     private String name;//姓名
 6     private String num;//编号
 7     private String rsNum;//RS号
 8     private String disease;//疾病
 9     private String rsInfo;//rs值
10     
11     public NameEntity() {
12         // TODO Auto-generated constructor stub
13     }
14 
15     public NameEntity(String name, String num, String rsNum, String disease,
16             String rsInfo) {
17         super();
18         this.name = name;
19         this.num = num;
20         this.rsNum = rsNum;
21         this.disease = disease;
22         this.rsInfo = rsInfo;
23     }
24 
25     public String getName() {
26         return name;
27     }
28 
29     public void setName(String name) {
30         this.name = name;
31     }
32 
33     public String getNum() {
34         return num;
35     }
36 
37     public void setNum(String num) {
38         this.num = num;
39     }
40 
41     public String getRsNum() {
42         return rsNum;
43     }
44 
45     public void setRsNum(String rsNum) {
46         this.rsNum = rsNum;
47     }
48 
49     public String getDisease() {
50         return disease;
51     }
52 
53     public void setDisease(String disease) {
54         this.disease = disease;
55     }
56 
57     public String getRsInfo() {
58         return rsInfo;
59     }
60 
61     public void setRsInfo(String rsInfo) {
62         this.rsInfo = rsInfo;
63     }
64     
65 }
View Code

2.具体的处理方法

  1 package com.sxd.test.unusualName;
  2 
  3 import java.io.File;
  4 import java.io.FileInputStream;
  5 import java.io.FileOutputStream;
  6 import java.io.IOException;
  7 import java.util.ArrayList;
  8 import java.util.List;
  9 import java.util.Map;
 10 import java.util.Set;
 11 import java.util.stream.Collectors;
 12 
 13 import org.apache.poi.hssf.usermodel.HSSFCellStyle;
 14 import org.apache.poi.hssf.usermodel.HSSFFont;
 15 import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 16 import org.apache.poi.hssf.util.HSSFColor;
 17 import org.apache.poi.ss.usermodel.Cell;
 18 import org.apache.poi.ss.usermodel.Row;
 19 import org.apache.poi.ss.usermodel.Sheet;
 20 import org.junit.Test;
 21 
 22 
 23 public class Xls4Name {
 24     
 25     /**
 26      * 主方法--处理多份xls文件中 不同sheet[疾病]下  姓名/位点一致||订单编号一致,但是位点值不同的信息
 27      * @throws IOException
 28      */
 29     @Test
 30     public void mainTest() throws IOException{
 31         
 32         test1();
 33         test2();
 34         test3();
 35         
 36         
 37     }
 38     /**
 39      * 处理 肝癌  冠心病 脑梗  位点信息为rs1801133
 40      * @throws IOException
 41      */
 42     public void test1() throws IOException{
 43         File file = new File("D:/20161110-时代基因大批量检测结果/");
 44         File [] allFile = file.listFiles();
 45         if(allFile.length > 0){
 46             List<NameEntity> listAll = new ArrayList<NameEntity>();
 47             String outPath = null;
 48             for (int i = 0; i < allFile.length; i++) {
 49                 String fileName = allFile[i].getName();
 50                 String filePath = "D:/20161110-时代基因大批量检测结果/"+fileName;
 51                 String [] sheetName = {"肝癌","冠心病","脑梗(缺血性脑卒中)"};
 52                 String RsNum = "rs1801133";
 53                 outPath = "d:/异常/"+"异常1---"+fileName.substring(0,fileName.lastIndexOf("."))+".xls";
 54                 //获取原始数据
 55                 listAll = just4ListArr(filePath,RsNum,sheetName);
 56             }
 57             //对原始数据分组
 58             List<NameEntity> list = groupByList(listAll);
 59             //将处理好的数据存入异常文件
 60             if(list.size() > 0){
 61                 just4Result(list,outPath);
 62             }
 63         }
 64     }
 65     /**
 66      * 处理 胃癌  食管癌  位点信息  rs2274223
 67      * @throws IOException
 68      */
 69     public void test2() throws IOException{
 70         File file = new File("D:/20161110-时代基因大批量检测结果/");
 71         File [] allFile = file.listFiles();
 72         if(allFile.length > 0){
 73             List<NameEntity> listAll = new ArrayList<NameEntity>();//listAll放在循环内部 可以单独处理多个文件 放在循环外面可以将多个文件统一处理
 74             String outPath = null;
 75             for (int i = 0; i < allFile.length; i++) {
 76                 String fileName = allFile[i].getName();
 77                 String filePath = "D:/20161110-时代基因大批量检测结果/"+fileName;
 78                 String [] sheetName = {"胃癌","食管癌"};
 79                 String RsNum = "rs2274223";
 80                 outPath = "d:/异常/"+"异常2---"+fileName.substring(0,fileName.lastIndexOf("."))+".xls";
 81                 //获取原始数据
 82                 listAll = just4ListArr(filePath,RsNum,sheetName);
 83                 
 84             }
 85             //对原始数据分组
 86             List<NameEntity> list = groupByList(listAll);
 87             //将处理好的数据存入异常文件
 88             if(list.size() > 0){
 89                 just4Result(list,outPath);
 90             }
 91         }
 92     }
 93     /**
 94      * 高血压  脑梗  位点信息rs699
 95      * @throws IOException
 96      */
 97     public void test3() throws IOException{
 98         File file = new File("D:/20161110-时代基因大批量检测结果/");
 99         File [] allFile = file.listFiles();
100         if(allFile.length > 0){
101             List<NameEntity> listAll = new ArrayList<NameEntity>();
102             String outPath = null;
103             for (int i = 0; i < allFile.length; i++) {
104                 String fileName = allFile[i].getName();
105                 String filePath = "D:/20161110-时代基因大批量检测结果/"+fileName;
106                 String [] sheetName = {"高血压","脑梗(缺血性脑卒中)"};
107                 String RsNum = "rs699";
108                 outPath = "d:/异常/"+"异常3---"+fileName.substring(0,fileName.lastIndexOf("."))+".xls";
109                 
110                 //获取原始数据
111                 listAll = just4ListArr(filePath,RsNum,sheetName);
112             }
113             //对原始数据分组
114             List<NameEntity> list = groupByList(listAll);
115             //将处理好的数据存入异常文件
116             if(list.size() > 0){
117                 just4Result(list,outPath);
118             }
119         }
120     }
121     
122     /**
123      * 根据传入的 文件路径以及sheet名称  分别创建sheet,并传入just4List(listAll,sheet)进行处理
124      * @param filePath
125      * @param sheetName
126      * @return
127      * @throws IOException
128      */
129     public List<NameEntity> just4ListArr(String filePath,String RsNum,String ...sheetName) throws IOException{
130         FileInputStream in = new FileInputStream(new File(filePath));
131         HSSFWorkbook work = new HSSFWorkbook(in);
132         
133         List<NameEntity> listAll = new ArrayList<>();
134         for (String sName : sheetName) {
135             Sheet sheet =  work.getSheet(sName);//根据sheet名称 获取几种疾病的信息
136             listAll = just4List(listAll,sheet,RsNum);
137         }
138         
139         work.close();
140         in.close();
141         return  listAll;
142         
143     }
144     
145     /**
146      * 对xls中抽取出来的原始数据进行分组处理  按照用户名name称分组/或者按照订单号num分组  java1.8
147      * @param listAll
148      * @return
149      */
150     public List<NameEntity> groupByList(List<NameEntity> listAll){
151         List<NameEntity> result = new ArrayList<NameEntity>();
152         
153 //            Map<String,List<NameEntity>> map = listAll.stream().collect(Collectors.groupingBy(e->((NameEntity) e).getName()));
154             Map<String,List<NameEntity>> map = listAll.stream().collect(Collectors.groupingBy(e->((NameEntity) e).getNum()));
155             //下面对map进行迭代
156             Set<String> set = map.keySet();
157             for (String string : set) {
158                 int listSize = map.get(string).size();
159                 if(listSize > 1){
160                     String rs = map.get(string).get(0).getRsInfo();//获取第一个的rs号
161                     for (int i = 1; i < listSize; i++) {//循环判断  若出现rs号不一致 即抽取出同组的多条信息 保存
162                         if(!map.get(string).get(i).getRsInfo().equals(rs)){
163                             result.addAll(map.get(string));
164                             break;
165                         }
166                     }
167                 }
168             }
169             
170         
171         return result;
172     }
173     
174     
175     /**
176      * 根据最终传入的list  
177      * @param list
178      * @throws IOException
179      */
180     public void just4Result(List<NameEntity> list,String outPath) throws IOException{
181         //输出文档
182                 FileOutputStream out = new FileOutputStream(new File(outPath));
183                 HSSFWorkbook workOut = new HSSFWorkbook();
184                 //设置sheet名称
185                 Sheet sheet = workOut.createSheet("异常名称");
186                 //设置第2列的宽度为 100*256
187                 sheet.setColumnWidth(1, 50 * 256);
188                 sheet.setColumnWidth(2, 15 * 256);
189                 sheet.setColumnWidth(3, 30 * 256);
190                 //创建首行
191                 Row row1 = sheet.createRow(0);
192                 //首行 行高
193                 row1.setHeight((short)500);
194                 //首行 列名数组
195                 String []rowName = {"姓名","编号(采样号)","RS号","疾病","RS值"};
196                 //设置首行样式
197                 HSSFCellStyle cellStyle = workOut.createCellStyle(); 
198                 //创建字体
199                 HSSFFont font = workOut.createFont();
200                 //设置加粗
201                 font.setBold(true);
202                 //设置字体颜色
203                 font.setColor(HSSFColor.AQUA.index);
204                 //设置字体大小
205                 font.setFontHeightInPoints((short)14);
206                 cellStyle.setFont(font);
207                 for (int i = 0; i < 5; i++) {
208                     Cell cell = row1.createCell(i);
209                     cell.setCellValue(rowName[i]);
210                     cell.setCellStyle(cellStyle);
211                 }
212                 
213                 //对应列放入对应数据
214                 for (int i = 0; i < list.size(); i++) {
215                     Row row2 = sheet.createRow(i+1);
216                     NameEntity nameEntity = list.get(i);
217                     for (int j = 0; j < 5; j++) {
218                         Cell cell = row2.createCell(j);
219                         switch (j) {
220                         case 0: cell.setCellValue(nameEntity.getName()); break;
221                         case 1: cell.setCellValue(nameEntity.getNum()); break;
222                         case 2: cell.setCellValue(nameEntity.getRsNum()); break;
223                         case 3: cell.setCellValue(nameEntity.getDisease()); break;
224                         case 4: cell.setCellValue(nameEntity.getRsInfo()); break;
225 
226                         default: cell.setCellValue("数据异常");
227                             break;
228                         }
229                         
230                     }
231                 }
232                 
233                 workOut.write(out);
234                 out.close();
235                 workOut.close();
236     }
237     
238     
239     
240     /**
241      * 从原始xls文件中抽取出来最原始的数据  存放如listAll中
242      * @param listAll
243      * @param sheet
244      * @return
245      */
246     public List<NameEntity> just4List(List<NameEntity> listAll,Sheet sheet,String RsNum){
247         String diseaseName = sheet.getSheetName();
248         
249         Row row1 = sheet.getRow(0);
250         Cell cell = row1.getCell(0);
251         int maxRowNum = just4MaxRowNum(sheet);//先计算出 最大行数
252         int maxCellNum = row1.getLastCellNum();//最大列数
253         row1 = sheet.getRow(2);                    //固定 rsNum放在第三行 故 获取第三行
254         int rsNum = 0;
255         //判断对应的rsNum在第几列  记录列号
256             cell = row1.getCell(4);
257             String value = cell.getRichStringCellValue().toString();
258             if(RsNum.equals(value)){
259                 rsNum = 4;
260             }else {
261                 rsNum = 5;
262             }
263         
264             //循环从5开始  因为原始文件中的前5行非数据
265         for (int i = 5; i < maxRowNum ; i++) {//然后纵向提取  获取所有rs信息
266             NameEntity nameEntity = new NameEntity();//实例化对象
267             row1 = sheet.getRow(i);
268             String  rs = row1.getCell(rsNum).getStringCellValue();//获取rs  由于rs号不确定在第几列  故进行判断
269             String name = row1.getCell(3).getStringCellValue();//获取name   name列确定列号为3  即在第四行  也可以自行判断
270             String num = null;
271             if(row1.getCell(2).getCellType() == Cell.CELL_TYPE_NUMERIC){
272                  num = String.valueOf(row1.getCell(2).getNumericCellValue());//获取num  编号 条形码
273             }else{
274                  num = String.valueOf(row1.getCell(2).getStringCellValue());
275             }
276             nameEntity.setNum(num);
277             nameEntity.setName(name);
278             nameEntity.setRsNum(RsNum);
279             nameEntity.setDisease(diseaseName);
280             nameEntity.setRsInfo(rs);
281             listAll.add(nameEntity);
282         }
283         
284         return listAll;
285     }
286     
287     /**
288      * 获取最大行数  由于人为原因  xls中某个单元格中内容虽然已经删除 但是单元格的对象依旧创建,因此需要自己获取有效行数
289      * @param sheet
290      * @return
291      */
292     public int just4MaxRowNum(Sheet sheet){
293         int maxRowNum = sheet.getLastRowNum();//获取最大行号  但不是有效行号
294         
295         for (int i = 5; i < maxRowNum; i++) {
296             Row row = sheet.getRow(i);
297             Cell cell = row.getCell(3);
298             if(cell == null || cell.getCellType() == Cell.CELL_TYPE_BLANK){//判断cell单元格为null或者单元格类型为blank就表示此单元格没有数据  那这一行的上一行就是有效行数
299                 maxRowNum = i-1;
300                 break;
301             }
302         }    
303         return maxRowNum;
304     }
305 }
View Code

3.在处理完成业务之后   可以调用方法将文件夹中的 使用过的文件删除

 1 package com.sxd.test.unusualName;
 2 
 3 import java.io.File;
 4 
 5 import org.junit.Test;
 6 
 7 /**
 8  * 一键删除   异常文件以及 源文件
 9  * @author Administrator
10  *
11  */
12 public class DeleteUnusualFile {
13 
14     @Test
15     public void deleteFile(){
16         deleteSourceFile();
17         deleteUnusualFile();
18     }
19     
20     /**
21      *删除源文件 
22      */
23     public void deleteSourceFile(){
24         File file = new File("D:/20161110-时代基因大批量检测结果");
25         File[] fileArr = file.listFiles();
26         if(file.isDirectory() && fileArr.length > 0){//若此路径是文件夹 且 下面的子文件不为null
27             for (int i = 0; i < fileArr.length; i++) {
28                 if(fileArr[i].isFile()){
29                     fileArr[i].delete();
30                 }
31             }
32         }
33         
34     }
35     /**
36      * 删除异常文件
37      */
38     public void deleteUnusualFile(){
39         File file = new File("D:/异常");
40         File[] fileArr = file.listFiles();
41         if(file.isDirectory() && fileArr.length > 0){//若此路径是文件夹 且 下面的子文件不为null
42             for (int i = 0; i < fileArr.length; i++) {
43                 if(fileArr[i].isFile()){
44                     fileArr[i].delete();
45                 }
46             }
47         }
48     }
49 }
View Code

 

相关文章
|
3月前
|
存储 安全 Java
从入门到精通:Java Map全攻略,一篇文章就够了!
【10月更文挑战第17天】本文详细介绍了Java编程中Map的使用,涵盖Map的基本概念、创建、访问与修改、遍历方法、常用实现类(如HashMap、TreeMap、LinkedHashMap)及其特点,以及Map在多线程环境下的并发处理和性能优化技巧,适合初学者和进阶者学习。
86 3
|
3月前
|
存储 安全 Java
Java Map新玩法:探索HashMap和TreeMap的高级特性,让你的代码更强大!
【10月更文挑战第17天】Java Map新玩法:探索HashMap和TreeMap的高级特性,让你的代码更强大!
88 2
|
3月前
|
存储 Java
告别混乱!用Java Map优雅管理你的数据结构
【10月更文挑战第17天】在软件开发中,随着项目复杂度增加,数据结构的组织和管理至关重要。Java中的Map接口提供了一种优雅的解决方案,帮助我们高效、清晰地管理数据。本文通过在线购物平台的案例,展示了Map在商品管理、用户管理和订单管理中的具体应用,有效提升了代码质量和维护性。
100 2
|
2月前
|
存储 Java API
Java交换map的key和value值
通过本文介绍的几种方法,可以在Java中实现Map键值对的交换。每种方法都有其优缺点,具体选择哪种方法应根据实际需求和场景决定。对于简单的键值对交换,可以使用简单遍历法或Java 8的Stream API;对于需要处理值不唯一的情况,可以使用集合存储或Guava的Multimap。希望本文对您理解和实现Java中的Map键值对交换有所帮助。
48 1
|
3月前
|
存储 安全 Java
从入门到精通:Java Map全攻略,一篇文章就够了!
【10月更文挑战第19天】本文介绍了Java编程中重要的数据结构——Map,通过问答形式讲解了Map的基本概念、创建、访问与修改、遍历方法、常用实现类(如HashMap、TreeMap、LinkedHashMap)及其特点,以及Map在多线程环境下的使用和性能优化技巧,适合初学者和进阶者学习。
100 4
|
3月前
|
存储 Java API
优雅地使用Java Map,通过掌握其高级特性和技巧,让代码更简洁。
【10月更文挑战第19天】本文介绍了如何优雅地使用Java Map,通过掌握其高级特性和技巧,让代码更简洁。内容包括Map的初始化、使用Stream API处理Map、利用merge方法、使用ComputeIfAbsent和ComputeIfPresent,以及Map的默认方法。这些技巧不仅提高了代码的可读性和维护性,还提升了开发效率。
125 3
|
3月前
|
存储 Java API
详细解析HashMap、TreeMap、LinkedHashMap等实现类,帮助您更好地理解和应用Java Map。
【10月更文挑战第19天】深入剖析Java Map:不仅是高效存储键值对的数据结构,更是展现设计艺术的典范。本文从基本概念、设计艺术和使用技巧三个方面,详细解析HashMap、TreeMap、LinkedHashMap等实现类,帮助您更好地理解和应用Java Map。
77 3
|
3月前
|
存储 缓存 安全
在Java的Map家族中,HashMap和TreeMap各具特色
【10月更文挑战第19天】在Java的Map家族中,HashMap和TreeMap各具特色。HashMap基于哈希表实现,提供O(1)时间复杂度的高效操作,适合性能要求高的场景;TreeMap基于红黑树,提供O(log n)时间复杂度的有序操作,适合需要排序和范围查询的场景。两者在不同需求下各有优势,选择时需根据具体应用场景权衡。
42 2
|
3月前
|
存储 安全 Java
Java Map新玩法:深入探讨HashMap和TreeMap的高级特性
【10月更文挑战第19天】Java Map新玩法:深入探讨HashMap和TreeMap的高级特性,包括初始容量与加载因子的优化、高效的遍历方法、线程安全性处理以及TreeMap的自然排序、自定义排序、范围查询等功能,助你提升代码性能与灵活性。
33 2
|
3月前
|
存储 Java 开发者
Java中的Map接口提供了一种优雅的方式来管理数据结构,使代码更加清晰、高效
【10月更文挑战第19天】在软件开发中,随着项目复杂度的增加,数据结构的组织和管理变得至关重要。Java中的Map接口提供了一种优雅的方式来管理数据结构,使代码更加清晰、高效。本文通过在线购物平台的案例,展示了Map在商品管理、用户管理和订单管理中的具体应用,帮助开发者告别混乱,提升代码质量。
38 1