17370845950

Java解析XML并生成Excel文件 Apache POI库应用指南
首先引入Apache POI依赖,然后使用DOM解析XML文件提取数据,接着通过XSSFWorkbook创建Excel并写入表头与内容,最后自动调整列宽并输出文件。1. 添加poi-ooxml依赖;2. 解析data.xml获取员工信息列表;3. 创建“员工信息.xlsx”并填充数据;4. 注意大文件用SAX解析、大量数据用SXSSFWorkbook优化内存。整个流程适用于企业级数据导出场景。

在Java开发中,处理XML数据并将其导出为Excel文件是常见的业务需求,比如系统配置导入、报表生成等场景。Apache POI 是一个强大的Java API,用于操作Microsoft Office格式文件,尤其是Excel(.xls 和 .xlsx)。本文将介绍如何使用 Java 解析 XML 文件,并结合 Apache POI 将其内容写入 Excel 文件。

1. 准备工作:引入依赖

要在项目中使用 Apache POI 处理 Excel 文件,需要添加相应的 Maven 依赖。如果你使用的是 XLSX 格式(推荐),需引入以下依赖:


  org.apache.poi
  poi-ooxml
  5.2.4

该依赖包含了处理 XLSX 所需的核心类,如 XSSFWorkbookXSSFSheetXSSFRow 等。

2. 解析XML文件

Java 提供了多种方式解析 XML,这里以标准的 DOM 解析为例,适合中小规模 XML 文件。

假设有如下结构的 XML 文件(data.xml):


  
    张三
    30
    技术部
  

  
    李四
    28
    人事部
  

使用 DOM 解析该文件的代码如下:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(new File("data.xml"));
doc.getDocumentElement().normalize();

NodeList nodeList = doc.getElementsByTagName("employee");
List> dataList = new ArrayList();

for (int i = 0; i   Node node = nodeList.item(i);
  if (node.getNodeType() == Node.ELEMENT_NODE) {
    Element element = (Element) node;
    Map row = new HashMap();
    row.put("id", element.getAttribute("id"));
    row.put("name", element.getElementsByTagName("name").item(0).getTextContent());
    row.put("age", element.getElementsByTagName("age").item(0).getTextContent());
    row.put("department", element.getElementsByTagName("department").item(0).getTextContent());
    dataList.add(row);
  }
}

3. 使用Apache POI生成Excel文件

将解析后的数据写入 Excel 文件:

// 创建工作簿和工作表
XSSFWorkbook workbook = new XSSFWorkbook();
XSSFSheet sheet = workbook.createSheet("员工信息");

// 创建表头
XSSFRow headerRow = sheet.createRow(0);
headerRow.createCell(0).setCellValue("ID");
headerRow.createCell(1).setCellValue("姓名");
headerRow.createCell(2).setCellValue("年龄");
headerRow.createCell(3).setCellValue("部门");

// 填充数据
int rowNum = 1;
for (Map data : dataList) {
  XSSFRow row = sheet.createRow(rowNum++);
  row.createCell(0).setCellValue(data.get("id"));
  row.createCell(1).setCellValue(data.get("name"));
  row.createCell(2).setCellValue(Integer.parseInt(data.get("age")));
  row.createCell(3).setCellValue(data.get("department"));
}

// 自动调整列宽
for (int i = 0; i   sheet.autoSizeColumn(i);
}

// 写入文件
try (FileOutputStream out = new FileOutputStream("员工信息.xlsx")) {
  workbook.write(out);
}

// 关闭资源
workbook.close();

执行后将在项目根目录生成名为“员工信息.xlsx”的文件,包含完整的XML数据。

4. 注意事项与优化建议

  • 大文件XML应考虑使用SAX或StAX解析,避免内存溢出
  • 写入大量数据时可启用POI的SXSSFWorkbook以降低内存占用
  • 注意关闭流资源,推荐使用 try-with-resources
  • 对数字、日期等字段设置合适的单元格格式,提升可读性
  • 路径和文件名建议做参数化处理,增强通用性

基本上就这些。通过结合 Java 内置的 XML 解析能力与 Apache POI 的 Excel 操作功能,可以高效实现数据转换任务。整个过程清晰、稳定,适用于大多数企业级应用。