Golang实现Excel导入导出_Go语言办公项目实战

应选用 github.com/xuri/excelize/v2:纯 Go 实现、无 CGO 依赖、支持流式读写、中文和样式兼容性好;tealeg/xlsx 已停止维护,不推荐新项目使用。

Go 语言本身不内置 Excel 处理能力,encoding/csv 只能处理 CSV,而真实办公场景中要求读写 .xlsx(Office Open XML)格式——必须依赖第三方库,且选型直接影响稳定性、内存占用和中文支持效果。

用 git

hub.com/xuri/excelize/v2 还是 github.com/tealeg/xlsx?

excelize/v2 是当前事实标准:纯 Go 实现、无 CGO 依赖、支持流式写入、对中文和样式兼容性好;tealeg/xlsx 已多年未维护,解析大文件易 OOM,且不支持 .xlsx 新特性(如富文本、条件格式)。新项目不要考虑后者。

  • 导入时,file.GetSheetList() 获取所有表名,再用 file.GetRows(sheet) 拉取数据,注意它返回的是 []string 切片,空单元格为 "",不是 nil
  • 导出时,避免一次性构建整张表再保存:用 file.SetCellValue("Sheet1", "A1", value) 逐单元格写,或更高效地用 file.SetSheetRow("Sheet1", "A1", &row) 批量写入切片
  • 若需合并单元格,必须在设值后调用 file.MergeCell("Sheet1", "A1", "C1"),顺序不能颠倒,否则合并失效

中文乱码、日期错位、数字变科学计数法?

Excel 文件本身不存“类型”,excelize 默认按字符串读取所有单元格。所谓“日期变数字”“数字变 1.23E+10”,是因为 Excel 内部用浮点数存储日期/数值,而库未自动转换类型。

  • 读取前先用 file.GetSheetMap() 查看工作表结构,确认目标列是否被 Excel 识别为数字/日期格式
  • 对疑似日期列,用 file.GetCellValue("Sheet1", "B2") 得到原始字符串(如 "44926"),再手动转:
    if num, err := strconv.ParseFloat(cellValue, 64); err == nil {
        t := time.Date(1900, 1, 1, 0, 0, 0, 0, time.UTC).AddDate(0, 0, int(num)-2).UTC()
        // 注意:Excel 1900 日期系统有 1 天偏差,需 -2
    }
  • 写入中文无需额外设置,但若导出后 Excel 显示方块,检查是否用了非 UTF-8 字体(如 SimSun),这不是 Go 层问题,是客户端渲染行为

大文件导入内存爆掉、导出超时?

excelize 默认将整个 .xlsx 解压到内存,10MB 文件可能占 300MB+ 内存。50MB 以上文件必须启用流式读写。

  • 导入大文件:用 file.ReadFrom(reader io.Reader) 替代 excelize.OpenFile(),配合 file.Rows(sheet) 获取行迭代器,逐行处理
  • 导出大文件:创建新文件后立即调用 file.NewStreamWriter("Sheet1"),用 stream.Write([]string{"a","b"}) 流式写入,最后 stream.Flush(),内存占用可压到 MB 级
  • 禁止在 HTTP handler 中直接 file.Write() 返回文件:应先写入临时 os.Filebytes.Buffer,再用 http.ServeContent 流式响应,否则并发高时磁盘 I/O 成瓶颈

真正难的不是读写 Excel,而是校验业务规则(比如“订单日期不能晚于发货日期”)、处理混合类型列(同一列里有数字、字符串、空值)、以及和数据库事务对齐(导入失败要回滚已插数据)。这些逻辑没法靠库解决,得自己兜底。