Go 如何解析 json 內部結構不確定的情況

Go 如何解析 json 內部結構不確定的情況

文是通過組織曾經梳理過的一篇文章和一個問答而成。主要介紹的是關於 Go 如何解析 json 內部結構不確定的情況。

問題描述

這或許是新手常會遇到的一個問題,無論是在各種微信群、知乎、思否、stackoverflow 上,我常會遇到這樣的提問。

什麼問題呢?直接看一個來自思否上的提問吧。內容如下:

上游傳遞不確定 的json ,如何透傳給下游業務?比如,我解析參數

{
 "test": 1,
 "key": {
 "k1": "1",
 "k2": 2
 }
}

但是key 結構體下面是未知的。可能是K1 K2 K3 ... KN。如何解析傳遞那?

如何處理

對於 json 格式數據的解析,如果其中的某個成員結構不確定,我總結一般有幾種方式處理。

第一種,最容易想到的就是,將那個不確定的成員用 map[string]interface{} 替代。

type Data struct {
 Test int `json:"test"`
 Key map[string]interface{} `json:"test"`
}

但問題是,這種方式太坑,每次從 key 中拿數據,都要做類型檢查,判斷是否 ok。

第二種,既然 map[string]interface{} 的方式太坑,那如果要是能用結構體就好了,雖然其中某個成員的結構不確定,但如果共性字段比較多,比如都是與人相關,那肯定都有名字,年齡之類的字段,但如果是教師和學生,就會有一些不同的字段,把所有的不同字段都包含進來即可。但如果不同字段太多,那也不是很方便。

第三種,終極解決方案,如果能先解析第一層的結構,再根據第一層的結果,確定第二層的結構,那就方便多了。不確定的成員依然用 map[string]interface{} 表示,確定結構後,再將 map[string]interface{} 解析為具體的某個結構。結構體使用起來就方便很多了。

問題最終就變成了如何將 map[string]interface{} 轉化為 struct,這個過程必然會用到反射,可以自己實現。但其他人早造就想到了,一個第三方庫,地址:https://github.com/mitchellh/mapstructure 。

一個實際的案例

看一個實際的案例。

近期工作中,因為要把數據庫數據實時更新到 elasticsearch,在實踐過程中遇到了一些 JSON 數據處理的問題。

什麼樣的數據呢?

實時數據獲取是通過阿里開源的 canal 組件實現的,並通過消息隊列 kafka 傳輸給處理程序。我們將接收到的 JSON 數據類似如下的形式。

{
 "type": "UPDATE",
 "database": "blog",
 "table": "blog",
 "data": [
 {
 "blogId": "100001",
 "title": "title",
 "content": "this is a blog",
 "uid": "1000012",
 "state": "1"
 }
 ]
}

簡單說下數據的邏輯,type 表示數據庫事件是新增、更新還是刪除事件,database 表示對應的數據庫名稱,table 表示相應的表名稱,data 即為數據庫中數據。

怎麼處理這串 JSON 呢?

json 轉化為 map

最先想到的方式就是通過 json.Unmarshal 將 JSON 轉化 map[string]interface{}。

示例代碼:

func main () {
 msg := []byte(`{
 "type": "UPDATE",
 "database": "blog",
 "table": "blog",
 "data": [
 {
 "blogId": "100001",
 "title": "title",
 "content": "this is a blog",
 "uid": "1000012",
 "state": "1"
 }
 ]}`)
 var event map[string]interface{}
 if err := json.Unmarshal(msg, &event); err != nil {
 panic(err)
 }
 fmt.Println(event)
}

打印結果如下:

map[data:[map[title:title content:this is a blog uid:1000012 state:1 blogId:100001]] type:UPDATE database:blog table:blog]

到此,就成功解析出了數據。接下來是使用它,但我覺得 map 通常有幾個不足。

  • 通過 key 獲取數據,可能出現不存在的 key,為了嚴謹,需要檢查 key 是否存在;
  • 相對於結構體的方式,map數據提取不便且不能利用 IDE 補全檢查,key 容易寫錯;

針對這個情況,可以怎麼處理呢?如果能把 JSON 轉化為struct 就好了。

json 轉化為 struct

在 GO 中,json 轉化為 struct 也非常方便,只需提前定義好轉化的 struct 即可。我們先來定義一下轉化的 struct。

type Event struct {
	Type string `json:"type"`
	Database string `json:"database"`
	Table string `json:"table"`
	Data []map[string]string `json:"data"`
}

說明幾點

  • 實際場景中,canal 消息的 data 結構是由表決定的,在 JSON 成功解析前無法提前知道,所以這裡定義為 map[string]string;
  • 轉化的結構體成員必須是可導出的,所以成員變量名都是大寫,而與 JSON 的映射通過 json:"tagName" 的 tagName 完成。

解析代碼非常簡單,如下:

e := Event{}
if err := json.Unmarshal(msg, &e); err != nil {
	panic(err)
}
fmt.Println(e)

打印結果:

{UPDATE blog blog [map[blogId:100001 title:title content:this is a blog uid:1000012 state:1]]}

接下來,數據的使用就方便了不少,比如事件類型獲取,通過 event.Type 即可完成。不過,要潑盆冷水,因為 data 還是 []map[string]string 類型,依然有 map 的那些問題。

能不能把 map 轉化為 struct ?

map 轉化為 struct

據我所知,map 轉為轉化為 struct,GO 是沒有內置的。如果要實現,需要依賴於 GO 的反射機制。

不過,幸運的是,其實已經有人做了這件事,包名稱為 mapstructure,使用也非常簡單,敲一遍它提供的幾個例子就學會了。README 中也說了,該庫主要是遇到必須讀取一部分 JSON 才能知道剩餘數據結構的場景,和我的場景如此契合。

安裝命令如下:

$ go get https://github.com/mitchellh/mapstructure

開始使用前,先定義 map 將轉化的 struct 結構,即 blog 結構體,如下:

type Blog struct {
	BlogId string `mapstructure:"blogId"`
	Title string `mapstructrue:"title"`
	Content string `mapstructure:"content"`
	Uid string `mapstructure:"uid"`
	State string `mapstructure:"state"`
}

因為,接下來要用的是 mapstructure 包,所以 struct tag 標識不再是 json,而是 mapstructure。

示例代碼如下:

e := Event{}
if err := json.Unmarshal(msg, &e); err != nil {
	panic(err)
}
if e.Table == "blog" {
	var blogs []Blog
	if err := mapstructure.Decode(e.Data, &blogs); err != nil {
		panic(err)
	}
	fmt.Println(blogs)
}

event 的解析和前面的一樣,通過 e.Table 判斷是是否來自 blog 表的數據,如果是,使用 Blog 結構體解析。接下來通過 mapstructure 的 Decode 完成解析。

打印結果如下:

[{100001 title this is a blog 1000012 1}]

到此,似乎已經完成了所有工作。非也!

弱類型解析

不知道大家有沒有發現一個問題,那就是 Blog 結構體中的所有成員都是 string,這應該是 canal 做的事情,所有的值類型都是 string。但實際上 blog 表中的 uid 和 state 字段其實都是 int。

理想的結構體定義應該是下面這樣。

type Blog struct {
	BlogId string `mapstructure:"blogId"`
	Title string `mapstructrue:"title"`
	Content string `mapstructure:"content"`
	Uid int32 `mapstructure:"uid"`
	State int32 `mapstructure:"state"`
}

但是當把新的 Blog 類型代入之前的代碼,會如下的錯誤。

panic: 2 error(s) decoding:
* '[0].state' expected type 'int32', got unconvertible type 'string'
* '[0].uid' expected type 'int32', got unconvertible type 'string'

提示類型解析失敗。其實,這種形式的 json 在其他一些軟類型語言中也會出現。

那如何解決這個問題?提兩種解決方案

  • 使用時進行轉化,比如類型為 int 的數據,使用時可以用 strconv.Atoi 轉化。
  • 使用 mapstructure 提供的軟類型 map 轉化 struct 的功能;

顯然,第一種方式太 low,轉化的時候還要多一步錯誤檢查。那第二種方式如何呢?

來看示例代碼,如下:

var blogs []Blog
if err := mapstructure.WeakDecode(e.Data, &blogs); err != nil {
	panic(err)
}
fmt.Println(blogs)

其實只需要把 mapstructure 的 Decode 替換成 WeakDecode 就行了,字如其意,弱解析。如此easy。

到此,才算完成!接下來的數據處理就簡單很多了。如果想學習 mapstructure 的使用,敲敲源碼中例子應該差不多了。

總結

本文由一個問題引出主題,如何處理不確定結構的 json 數據,開頭提出了三種可行的解決方案,三種方案是逐層遞進的。最終的方式需要依賴反射實現,當然同樣的問題別人早就想到了,並開發了一個第三方包,mapstructure。最後,本文通過一個實際的案例演示了 mapstructure 的使用。


分享到:


相關文章: