小编典典

在.NET中将对象序列化为UTF-8 XML

c#

为了简洁起见,删除了正确的对象处理方法,但是如果这是将对象编码为内存中的UTF-8的最简单方法,我会感到震惊。必须有一种更简单的方法吗?

var serializer = new XmlSerializer(typeof(SomeSerializableObject));

var memoryStream = new MemoryStream();
var streamWriter = new StreamWriter(memoryStream, System.Text.Encoding.UTF8);

serializer.Serialize(streamWriter, entry);

memoryStream.Seek(0, SeekOrigin.Begin);
var streamReader = new StreamReader(memoryStream, System.Text.Encoding.UTF8);
var utf8EncodedXml = streamReader.ReadToEnd();

阅读 626

收藏
2020-05-19

共1个答案

小编典典

当您再次将代码读回字符串时,您的代码不会将UTF-8存入内存,因此它不再存在于UTF-8中,而是返回到UTF-16中(尽管理想情况下,最好考虑使用比字符串更高的级别)任何编码,除非被迫这样做)。

要获取实际的UTF-8八位字节,可以使用:

var serializer = new XmlSerializer(typeof(SomeSerializableObject));

var memoryStream = new MemoryStream();
var streamWriter = new StreamWriter(memoryStream, System.Text.Encoding.UTF8);

serializer.Serialize(streamWriter, entry);

byte[] utf8EncodedXml = memoryStream.ToArray();

我已经没有了你留下的同样的东西。我稍微赞成以下内容(保留常规处理):

var serializer = new XmlSerializer(typeof(SomeSerializableObject));
using(var memStm = new MemoryStream())
using(var  xw = XmlWriter.Create(memStm))
{
  serializer.Serialize(xw, entry);
  var utf8 = memStm.ToArray();
}

复杂度几乎相同,但确实表明在每个阶段都有合理的选择来做其他事情,其中​​最紧迫的是将序列化到内存以外的其他地方,例如文件,TCP /
IP流,数据库等。总而言之,它并不是那么冗长。

2020-05-19