Java读取Excel并解析文本(并格式化输出)

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

说明

最近在做一个比较小型的Java网站,需要批量导入注册用户.用户的信息写在一张excel表格里面.

所以就需要读取excel.所以就记录下遇到的问题,以及以后查看.

相关技术

使用的POI解析Excel需要使用的jar包

注(使用的maven.我就添加了右边的两个依赖就可以了)

分析

解析Excel首先就要解析Excel的结构.然后用面向对象的思想分析一下

这是一个excel文件.下面我们就来分析一下如果让你写这个poi框架,那么你会怎么设计.

1. 首先要有一个对象表示这整个Excel文件.

2. 可是这个excel文件中有好多页.Sheet1, Sheet2等等,所以我们还需要一个对象表示页.

3. 在页中,有行,所以还需要一个对象表示行.

4. 在行中,最后细分到格cell.

5. 格cell中数据还有好多类型.有字符串,数字,时间等等.

如果你想学习Java可以来这个Q群,首先是220,中间是142,最后是906,里面可以学习和交流,也有资料可以下载。

POI中的对象与excel对象的对应

excel文件就有多种类型了.后缀有 xls 与 xlsx

所以对于不同类型的文件,就需要使用不同的poi中的对象了.

1. 如果你要解析的是xls文件

从代码不难发现,这里的处理逻辑是

1>. 先用inputstream获取excel文件的io流

2>. 然后创建一个内存中的excel文件HSSFWorkbook类型对象.这个对象表示了整个excel文件.

3>. 对这个excel文件的每页做循环处理

4>. 对每页中的每行做循环处理.

5>. 对每行中的每个单元格做做处理,获取这个单元格的值.

6>. 把这行的结果添加到一个List数组中.

7>. 把每行的结果添加到最后的总结果中.

8>. 解析完以后就获取了一个List< List < String > > 类型的对象了.

2. 如果你要处理xlsx类型的文件则

和上面一样,我就不说了.

存在的问题

其实有时候我们希望得到的数据就是excel中的数据,可是最后发现结果不理想

如果你的excel中的数据是数字,你会发现java中对应的变成了科学计数法的.

所以在获取值的时候就要做一些特殊处理.

这样就能保证获取的值是我想要的值.

网上的做法是对于数值类型的数据格式化,获取自己想要的结果.

其实也没有那么麻烦.我在做的时候突然想到了一种处理解决方案.供参考

我们看一下poi中对于的toString()方法

该方法是poi的方法,从源码中我们可以发现,该处理流程是

1. 获取单元格的类型

2. 根据类型格式化数据并输出.这不一下子就造成了很多不是我们想要的.

所以我们就要改造一下这个方法例如这样

我的做法是这样的

1. 对于不熟悉的类型,或者为空则返回”” 控制串.

2.如果是数字,则修改单元格类型为String,然后返回String.这样就保证数字不被格式化了.

3. 虽然不知道这么做有什么后果,可是成功了

相关文章
|
6天前
|
存储 Java 编译器
Java内存模型(JMM)深度解析####
本文深入探讨了Java内存模型(JMM)的工作原理,旨在帮助开发者理解多线程环境下并发编程的挑战与解决方案。通过剖析JVM如何管理线程间的数据可见性、原子性和有序性问题,本文将揭示synchronized关键字背后的机制,并介绍volatile关键字和final关键字在保证变量同步与不可变性方面的作用。同时,文章还将讨论现代Java并发工具类如java.util.concurrent包中的核心组件,以及它们如何简化高效并发程序的设计。无论你是初学者还是有经验的开发者,本文都将为你提供宝贵的见解,助你在Java并发编程领域更进一步。 ####
|
4天前
|
存储 设计模式 分布式计算
Java中的多线程编程:并发与并行的深度解析####
在当今软件开发领域,多线程编程已成为提升应用性能、响应速度及资源利用率的关键手段之一。本文将深入探讨Java平台上的多线程机制,从基础概念到高级应用,全面解析并发与并行编程的核心理念、实现方式及其在实际项目中的应用策略。不同于常规摘要的简洁概述,本文旨在通过详尽的技术剖析,为读者构建一个系统化的多线程知识框架,辅以生动实例,让抽象概念具体化,复杂问题简单化。 ####
|
3天前
|
存储 分布式计算 Java
存算分离与计算向数据移动:深度解析与Java实现
【11月更文挑战第10天】随着大数据时代的到来,数据量的激增给传统的数据处理架构带来了巨大的挑战。传统的“存算一体”架构,即计算资源与存储资源紧密耦合,在处理海量数据时逐渐显露出其局限性。为了应对这些挑战,存算分离(Disaggregated Storage and Compute Architecture)和计算向数据移动(Compute Moves to Data)两种架构应运而生,成为大数据处理领域的热门技术。
17 2
|
3天前
|
设计模式 安全 Java
Java编程中的单例模式深入解析
【10月更文挑战第31天】在编程世界中,设计模式就像是建筑中的蓝图,它们定义了解决常见问题的最佳实践。本文将通过浅显易懂的语言带你深入了解Java中广泛应用的单例模式,并展示如何实现它。
|
6天前
|
Java API Apache
|
3天前
|
存储 Java 开发者
Java中的集合框架深入解析
【10月更文挑战第32天】本文旨在为读者揭开Java集合框架的神秘面纱,通过深入浅出的方式介绍其内部结构与运作机制。我们将从集合框架的设计哲学出发,探讨其如何影响我们的编程实践,并配以代码示例,展示如何在真实场景中应用这些知识。无论你是Java新手还是资深开发者,这篇文章都将为你提供新的视角和实用技巧。
6 0
|
12天前
|
监控 安全 Java
在 Java 中使用线程池监控以及动态调整线程池时需要注意什么?
【10月更文挑战第22天】在进行线程池的监控和动态调整时,要综合考虑多方面的因素,谨慎操作,以确保线程池能够高效、稳定地运行,满足业务的需求。
91 38
|
9天前
|
安全 Java
java 中 i++ 到底是否线程安全?
本文通过实例探讨了 `i++` 在多线程环境下的线程安全性问题。首先,使用 100 个线程分别执行 10000 次 `i++` 操作,发现最终结果小于预期的 1000000,证明 `i++` 是线程不安全的。接着,介绍了两种解决方法:使用 `synchronized` 关键字加锁和使用 `AtomicInteger` 类。其中,`AtomicInteger` 通过 `CAS` 操作实现了高效的线程安全。最后,通过分析字节码和源码,解释了 `i++` 为何线程不安全以及 `AtomicInteger` 如何保证线程安全。
java 中 i++ 到底是否线程安全?
|
5天前
|
Java 开发者
在Java多线程编程的世界里,Lock接口正逐渐成为高手们的首选,取代了传统的synchronized关键字
在Java多线程编程的世界里,Lock接口正逐渐成为高手们的首选,取代了传统的synchronized关键字
23 4

推荐镜像

更多