过去,我曾经使用go来按照以下所示的方式从API端点解码JSON。
client := &http.Client{} req, err := http.NewRequest("GET", "https://some/api/endpoint", nil) res, err := client.Do(req) defer res.Body.Close() buf, _ := ioutil.ReadAll(res.Body) // ... Do some error checking etc ... err = json.Unmarshal(buf, &response)
我将很快在一个端点上工作,该端点可以使用以下格式向我发送几兆字节的JSON数据。
{ "somefield": "value", "items": [ { LARGE OBJECT }, { LARGE OBJECT }, { LARGE OBJECT }, { LARGE OBJECT }, ... ] }
JSON有时会包含一个任意长度的大对象数组。我想将这些对象中的每个对象分别放置到消息队列中。我不需要解码对象本身。
如果我使用普通方法,这将在解码之前将整个响应加载到内存中。
由于响应仍在流中并将其分派到队列中,是否有一种很好的方法可以将每个“大对象”项分开?我这样做是为了避免在内存中保存尽可能多的数据。
谢谢!
使用可以解码JSON流json.Decoder。
json.Decoder
使用Decoder.Decode(),我们可以读取(解组)单个值,而不会消耗和解组整个流。这很酷,但是您的输入是一个“单个” JSON对象,而不是一系列JSON对象,这意味着对的调用Decoder.Decode()将尝试解组所有项目(大对象)的完整JSON对象。
Decoder.Decode()
我们想要的是部分地,即时地处理单个JSON对象。为此,我们可以使用Decoder.Token()哪个仅解析(高级)JSON输入流中的下一个后续令牌并返回它。这称为 事件驱动的 解析。
Decoder.Token()
当然,我们必须“处理”(解释并对其执行操作)令牌,并构建一个“状态机”,以跟踪我们在处理的JSON结构中的位置。
这是解决您问题的实现。
我们将使用以下JSON输入:
{ "somefield": "value", "otherfield": "othervalue", "items": [ { "id": "1", "data": "data1" }, { "id": "2", "data": "data2" }, { "id": "3", "data": "data3" }, { "id": "4", "data": "data4" } ] }
并阅读items,用这种类型建模的“大对象”:
items
type LargeObject struct { Id string `json:"id"` Data string `json:"data"` }
我们还将解析和解释JSON对象中的其他字段,但是我们只会记录/打印它们。
为了简便起见,我们将使用以下辅助错误处理函数:
he := func(err error) { if err != nil { log.Fatal(err) } }
现在让我们看一下操作。为了简洁起见,并在Go Playground上进行了有效的演示,在下面的示例中,我们将从string值中读取。要读取实际的HTTP响应正文,我们只需要更改一行,这就是我们创建方式json.Decoder:
string
dec := json.NewDecoder(res.Body)
因此,演示:
dec := json.NewDecoder(strings.NewReader(jsonStream)) // We expect an object t, err := dec.Token() he(err) if delim, ok := t.(json.Delim); !ok || delim != '{' { log.Fatal("Expected object") } // Read props for dec.More() { t, err = dec.Token() he(err) prop := t.(string) if t != "items" { var v interface{} he(dec.Decode(&v)) log.Printf("Property '%s' = %v", prop, v) continue } // It's the "items". We expect it to be an array t, err := dec.Token() he(err) if delim, ok := t.(json.Delim); !ok || delim != '[' { log.Fatal("Expected array") } // Read items (large objects) for dec.More() { // Read next item (large object) lo := LargeObject{} he(dec.Decode(&lo)) fmt.Printf("Item: %+v\n", lo) } // Array closing delim t, err = dec.Token() he(err) if delim, ok := t.(json.Delim); !ok || delim != ']' { log.Fatal("Expected array closing") } } // Object closing delim t, err = dec.Token() he(err) if delim, ok := t.(json.Delim); !ok || delim != '}' { log.Fatal("Expected object closing") }
这将产生以下输出:
2009/11/10 23:00:00 Property 'somefield' = value 2009/11/10 23:00:00 Property 'otherfield' = othervalue Item: {Id:1 Data:data1} Item: {Id:2 Data:data2} Item: {Id:3 Data:data3} Item: {Id:4 Data:data4}
在Go Playground上尝试完整的工作示例。