【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

Etui۹(・༥・´)و ̑̑ 2024-08-20 13:37:03 阅读 63

同为牛马,点个赞吧!

一、Excel文件样例

image-20240716153916656

二、工具类源码

<code>import org.apache.poi.ss.usermodel.*;

import org.apache.poi.ss.util.CellRangeAddress;

import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory;

import org.springframework.web.multipart.MultipartFile;

import java.io.IOException;

import java.io.InputStream;

import java.util.ArrayList;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

/**

* 读取Excel并解析合并单元格,将结果转为Map集合

*/

public class ReadMergeCellExcelUtil {

/**

* 读取Excel数据

*

* @param file 上传的Excel文件

* @return 解析后的数据列表

*/

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {

List<Map<String, String>> result = new ArrayList<>();

try (InputStream inputStream = file.getInputStream()) {

Workbook workbook = XSSFWorkbookFactory.create(inputStream);

result = readExcel(workbook, 0, 0, 0);

} catch (IOException e) {

e.printStackTrace();

}

return result;

}

/**

* 读取Excel文件

*

* @param workbook 工作簿

* @param sheetIndex sheet页下标:从0开始

* @param startReadLine 开始读取的行:从0开始

* @param tailLine 去除最后读取的行

* @return 解析后的数据列表

*/

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {

Sheet sheet = workbook.getSheetAt(sheetIndex);

FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();

List<Map<String, String>> result = new ArrayList<>();

for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {

Row row = sheet.getRow(i);

Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);

result.add(rowData);

}

return result;

}

/**

* 解析一行数据

*

* @param sheet 工作表

* @param row 行对象

* @param formulaEvaluator 公式评估器

* @return 解析后的行数据

*/

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {

Map<String, String> rowData = new HashMap<>();

if (row != null) {

int cellIndex = 0;

for (Cell cell : row) {

String cellValue = getCellValue(sheet, cell, formulaEvaluator);

rowData.put("field" + cellIndex, cellValue);

cellIndex++;

}

}

return rowData;

}

/**

* 获取单元格的值

*

* @param sheet 工作表

* @param cell 单元格

* @param formulaEvaluator 公式评估器

* @return 单元格值

*/

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {

if (cell == null) return "";

return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())

? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)

: getCellStringValue(cell, formulaEvaluator);

}

/**

* 获取合并单元格的值

*

* @param sheet 工作表

* @param row 行号

* @param column 列号

* @param formulaEvaluator 公式评估器

* @return 合并单元格值

*/

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {

for (CellRangeAddress range : sheet.getMergedRegions()) {

if (range.isInRange(row, column)) {

Row firstRow = sheet.getRow(range.getFirstRow());

Cell firstCell = firstRow.getCell(range.getFirstColumn());

return getCellStringValue(firstCell, formulaEvaluator);

}

}

return "";

}

/**

* 判断单元格是否是合并单元格

*

* @param sheet 工作表

* @param row 行下标

* @param column 列下标

* @return 是否是合并单元格

*/

private static boolean isMergedRegion(Sheet sheet, int row, int column) {

for (CellRangeAddress range : sheet.getMergedRegions()) {

if (range.isInRange(row, column)) {

return true;

}

}

return false;

}

/**

* 获取单元格的字符串值

*

* @param cell 单元格

* @param formulaEvaluator 公式评估器

* @return 单元格字符串值

*/

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {

switch (cell.getCellType()) {

case STRING:

return cell.getStringCellValue();

case BOOLEAN:

return String.valueOf(cell.getBooleanCellValue());

case FORMULA:

return formulaEvaluator.evaluate(cell).formatAsString();

case NUMERIC:

return String.valueOf(cell.getNumericCellValue());

default:

return "";

}

}

}

三、解析结果

image-20240716154343627

以下内容基本为废话,大可直接忽略!

四、工具类详解及使用方法

在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为<code>ReadMergeCellExcelUtil的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。


准备工作

在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。

Maven依赖:

<dependency>

<groupId>org.apache.poi</groupId>

<artifactId>poi-ooxml</artifactId>

<version>5.0.0</version>

</dependency>


工具功能概述

ReadMergeCellExcelUtil工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。


代码详细解读
1. 读取Excel数据

方法:readExcelToObj

该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {

List<Map<String, String>> result = new ArrayList<>();

try (InputStream inputStream = file.getInputStream()) {

Workbook workbook = XSSFWorkbookFactory.create(inputStream);

result = readExcel(workbook, 0, 0, 0);

} catch (IOException e) {

e.printStackTrace();

}

return result;

}

使用try-with-resources确保输入流在使用后正确关闭。

2. 解析Excel文件

方法:readExcel

该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {

Sheet sheet = workbook.getSheetAt(sheetIndex);

FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();

List<Map<String, String>> result = new ArrayList<>();

for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {

Row row = sheet.getRow(i);

Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);

result.add(rowData);

}

return result;

}

3. 解析一行数据

方法:parseRow

该方法遍历行中的单元格,并将其值存储到Map中。

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {

Map<String, String> rowData = new HashMap<>();

if (row != null) {

int cellIndex = 0;

for (Cell cell : row) {

String cellValue = getCellValue(sheet, cell, formulaEvaluator);

rowData.put("field" + cellIndex, cellValue);

cellIndex++;

}

}

return rowData;

}

4. 获取单元格值

方法:getCellValue

该方法根据单元格类型获取其值,并处理合并单元格。

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {

if (cell == null) return "";

return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())

? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)

: getCellStringValue(cell, formulaEvaluator);

}

5. 获取合并单元格值

方法:getMergedRegionValue

该方法查找并获取合并单元格的值。

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {

for (CellRangeAddress range : sheet.getMergedRegions()) {

if (range.isInRange(row, column)) {

Row firstRow = sheet.getRow(range.getFirstRow());

Cell firstCell = firstRow.getCell(range.getFirstColumn());

return getCellStringValue(firstCell, formulaEvaluator);

}

}

return "";

}

6. 判断单元格是否是合并单元格

方法:isMergedRegion

该方法检查指定单元格是否属于合并区域。

private static boolean isMergedRegion(Sheet sheet, int row, int column) {

for (CellRangeAddress range : sheet.getMergedRegions()) {

if (range.isInRange(row, column)) {

return true;

}

}

return false;

}

7. 获取单元格的字符串值

方法:getCellStringValue

该方法根据单元格类型获取字符串值,并评估公式单元格。

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {

switch (cell.getCellType()) {

case STRING:

return cell.getStringCellValue();

case BOOLEAN:

return String.valueOf(cell.getBooleanCellValue());

case FORMULA:

return formulaEvaluator.evaluate(cell).formatAsString();

case NUMERIC:

return String.valueOf(cell.getNumericCellValue());

default:

return "";

}

}


示例代码

以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil工具读取并解析Excel文件:

import org.springframework.web.multipart.MultipartFile;

import java.util.List;

import java.util.Map;

public class ExcelParserExample {

public static void main(String[] args) {

// 假设有一个MultipartFile类型的Excel文件对象file

MultipartFile file = ...;

// 使用工具类解析Excel文件

List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file);

// 打印解析结果

for (Map<String, String> rowData : parsedData) {

System.out.println(rowData);

}

}

}

运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。


常见问题与解决方案

空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。


结论

ReadMergeCellExcelUtil工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。

Over!



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。