python

不是所有的bytes都可以转换为string

byte转为string
b.decode('utf8')

如果报错：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe4 in position 1: invalid continuation byte

说明字节无法字节转为string，

上面的字节是可以正常decode为utf8

而改下字节数据

所以你试下decode下面的字节：

c=b'\x1e\xe4\xd5\x97\x9a#\x99kC\xadD\x7f\x9a\xc2G\x92'

是无法解析的。

这个是没有办法的，如果要硬刚。
可以加入参数errors = ‘replace’

b.decode('utf8',errors='replace')

这样就不会报错。但是这也只是输出的乱码。

正确的姿势是要看看你的字节的最原始编码格式。如果是gbk，那么就应该使用b.decode('gbk')

0

2022-01-14

0 个评论

要回复文章请先登录或注册