「Excel+VBA」 将tsv或者csv格式的数据读入Excel代码

「Excel+VBA」 将tsv或者csv格式的数据读入Excel代码

文本格式表格,常见的格式是csv或者tsv

很多工作场景下,虽说Excel是主力数据处理工具,但很多情况下,从ERP或者其他系统软件中导出或者下载的数据都是csv,或者tsv格式的数据;这两种数据一般都是文本格式,但又有表格的功能,一般我们会使用excel强行打开它处理;但因为格式的固定和文件访问速度快,更多的时候,我们会在一个较大型的VBA项目中“模块化”快速载入文本格式表格到EXCEL中间表的功能;

一、文本格式表格数据文件介绍:TSV\\CSV格式

CSV和TSV是以纯文本形式存储表格数据(数字和文本)的一种文件。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。如果是逗号分隔,文件格式就是CSV,如果是制表符载入,文件格式就是TSV;

经过我反复测试,发现tsv和csv文件的格式如下(因为有一些不可见字符,要反复测试才能摸清):

'【tsv文件格式】

'字段1 vbtab 字段2 vbtab ....字段3 vbcr vblf

'vbtab是制表符

'vbcr是回车符,vblf是换行符,这两个字符可以整合到一起表示vbCrLf

'【csv文件格式】

'和tsv类似,只是分割符变成了逗号

二、自编函数LoadTsvCsv()功能和接口介绍

'本函数访问TSV/CSV格式的文件,默认这个文件的第一行是表头,本函数传递一个一维数组(需要提取文件中的有效字段名称),返回一个二维数组,这个二维数组的第二维和传递的一维数组相同

'参数1:FileFullPath,文件路径

'参数2:需要提取的字段,用一个数组来表示, 如果这个数组是一个成员的数组且为“All”则返回所有字段

'参数3::ErrorInfo:0:无错误 1、文件不存在 2、文件无有效内容、3、文件中无指定读取的字段

Function LoadTsvCsv(FileFullPath As String, Arr() As Variant, ErrorInfo As Integer) As Variant()

用法:

1、将一个csv/tsv格式文件中的所有数据读入内存数组,用vba直接操作这个数据,得到想要的结果(这里只演示到内存数据赋值)

Dim ArrFilter(): ArrFilter = Array("All")

Dim Matrix()

Matrix = LoadTsvCsv(csvPath & "\\" & csvName, ArrFilter, loadErrorInfo)

2、我知道这个TSV\\CSV文件第一行是表头,表头有很多列,但我只想提取部分列

Dim ArrFilter(): ArrFilter = Array("姓名",“年龄”,“ID”)

Dim Matrix()

Matrix = LoadTsvCsv(csvPath & "\\" & csvName, ArrFilter, loadErrorInfo)

举例:

这是一个记录员工信息的csv文件,以上代码运行后,得到的数组如图2

「Excel+VBA」 将tsv或者csv格式的数据读入Excel代码

图一:原始文件内容

「Excel+VBA」 将tsv或者csv格式的数据读入Excel代码

图2:函数读取后的结果

三、自编函数LoadTsvCsv()源代码 (包含详细注释)

这里是我编写的一个函数,可以直接载入CSV或者TSV数据到excel中;

----------------------------------------------------------------------

'本函数访问TSV/CSV格式的文件,默认这个文件的第一行是表头,本函数传递一个一维数组(需要提取文件中的有效字段名称),返回一个二维数组,这个二维数组的第二维和传递的一维数组相同

'参数1:FileFullPath,文件路径

'参数2:需要提取的字段,用一个数组来表示, 如果这个数组是一个成员的数组且为“All”则返回所有字段

'参数3::ErrorInfo:0:无错误 1、文件不存在 2、文件无有效内容、3、文件中无指定读取的字段

Function LoadTsvCsv(FileFullPath As String, Arr() As Variant, ErrorInfo As Integer) As Variant()

Dim Delimiter As String

Dim FileXXX As String

Dim x() As String: x = VBA.Split(FileFullPath, ".")

FileXXX = x(UBound(x))

Select Case FileXXX

Case "csv": Delimiter = ","

Case "tsv": Delimiter = vbTab

End Select

Dim i As Long

Dim j As Long

'以下代码是将TSV文件打开,并计算文件的行数和列数

If Dir(FileFullPath) = "" Then MsgBox FileFullPath & "不存在!": ErrorInfo = 1: Exit Function

Dim Fso As Object

Dim S As String

Set Fso = CreateObject("Scripting.FileSystemObject")

S = Fso.OpenTextFile(FileFullPath).ReadAll

Dim RowCount As Integer '定义两个整数变量存放行数和列数

Dim ColumnCount As Integer

Dim row() As String: row = VBA.Split(S, vbCrLf)

RowCount = UBound(row) - LBound(row) + 1 - 1 '因为最后一行末尾也接了一个vbcrlf,所以数组成员的最后一位是""

If RowCount < 2 Then MsgBox FileFullPath & "无有效内容!": ErrorInfo = 2: Exit Function

Dim S0 As String: S0 = row(LBound(row)) '默认第一行是表头,将第一行的字符串读出来存放在S0中

Dim Col() As String: Col = VBA.Split(S0, Delimiter) '建立一个数组存放表头

'定义一个二维数组把结果返回出去

Dim tmp()

If UBound(Arr) = LBound(Arr) And Arr(LBound(Arr)) = "All" Then

ReDim tmp(LBound(row) To UBound(row) - 1, LBound(Col) To UBound(Col))

For i = LBound(row) To UBound(row) - 1 'row数组最后一项是空白的——因为TSV文件最后结束的vbcrlf,用split一定会有一个空的成员

Erase Col: Col = VBA.Split(row(i), Delimiter)

For j = LBound(Col) To UBound(Col)

tmp(i, j) = Col(j)

Next j

Next i

Else

Dim ArrID() As Integer: ReDim ArrID(LBound(Arr) To UBound(Arr))

'用参数2,规定提取字段的数组,确认col中的需要被提取字段的列号(维度2下标)

For i = LBound(Arr) To UBound(Arr)

If InStr(S0, Arr(i)) = 0 Then MsgBox FileFullPath & "文件中无指定读取的字段(" & Arr(i) & ")!": ErrorInfo = 3: Exit Function

For j = LBound(Col) To UBound(Col)

If Arr(i) = Col(j) Then ArrID(i) = j

Next j

Next i

ReDim tmp(LBound(row) To UBound(row) - 1, LBound(Arr) To UBound(Arr)) 'row数组最后一项是空白的——因为TSV文件最后结束的vbcrlf,用split一定会有一个空的成员

For i = LBound(row) To UBound(row) - 1 'row数组最后一项是空白的——因为TSV文件最后结束的vbcrlf,用split一定会有一个空的成员

Erase Col: Col = VBA.Split(row(i), Delimiter)

For j = LBound(Arr) To UBound(Arr)

tmp(i, j) = Col(ArrID(j))

Next j

Next i

End If

ErrorInfo = 0: LoadTsvCsv = tmp:

End Function


分享到:


相關文章: