协慌网

登录 贡献 社区

如何将 UTF-8 byte [] 转换为字符串?

我有一个byte[]数组,从我碰巧知道的文件中加载包含UTF-8 。在一些调试代码中,我需要将其转换为字符串。有没有一个班轮可以做到这一点?

在封面下它应该只是一个分配和一个memcopy ,所以即使它没有实现,它应该是可能的。

答案

string result = System.Text.Encoding.UTF8.GetString(byteArray);

这种转换至少有四种不同的方式。

  1. 编码的 GetString
    ,但如果这些字节具有非 ASCII 字符,则无法获得原始字节。

  2. BitConverter.ToString
    输出是一个 “-” 分隔的字符串,但是没有. NET 内置方法将字符串转换回字节数组。

  3. Convert.ToBase64String
    您可以使用Convert.FromBase64String轻松地将输出字符串转换回字节数组。
    注意:输出字符串可以包含 “+”,“/” 和 “=”。如果要在 URL 中使用该字符串,则需要对其进行显式编码。

  4. HttpServerUtility.UrlTokenEncode
    您可以使用HttpServerUtility.UrlTokenDecode轻松地将输出字符串转换回字节数组。输出字符串已经是 URL 友好的!缺点是如果您的项目不是 Web 项目,它需要System.Web程序集。

一个完整的例子:

byte[] bytes = { 130, 200, 234, 23 }; // A byte array contains non-ASCII (or non-readable) characters

string s1 = Encoding.UTF8.GetString(bytes); // ���
byte[] decBytes1 = Encoding.UTF8.GetBytes(s1);  // decBytes1.Length == 10 !!
// decBytes1 not same as bytes
// Using UTF-8 or other Encoding object will get similar results

string s2 = BitConverter.ToString(bytes);   // 82-C8-EA-17
String[] tempAry = s2.Split('-');
byte[] decBytes2 = new byte[tempAry.Length];
for (int i = 0; i < tempAry.Length; i++)
    decBytes2[i] = Convert.ToByte(tempAry[i], 16);
// decBytes2 same as bytes

string s3 = Convert.ToBase64String(bytes);  // gsjqFw==
byte[] decByte3 = Convert.FromBase64String(s3);
// decByte3 same as bytes

string s4 = HttpServerUtility.UrlTokenEncode(bytes);    // gsjqFw2
byte[] decBytes4 = HttpServerUtility.UrlTokenDecode(s4);
// decBytes4 same as bytes

当您不知道编码时,从字节数组转换为字符串的一般解决方案:

static string BytesToStringConverted(byte[] bytes)
{
    using (var stream = new MemoryStream(bytes))
    {
        using (var streamReader = new StreamReader(stream))
        {
            return streamReader.ReadToEnd();
        }
    }
}