Python2 的噩梦:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xxx in position 0: illegal multibyte sequence
字符串
- 从 Python3 的
str
对象中取出的是 Unicode 字符 - 从 Python2 的
unicode
对象中取出的是 Unicode 字符 - 从 Python2 的
str
对象中取出的是 原始字节序列
Unicode
Unicode 对字符的标识,称为 code point,码位。
码位的范围从 \x0 到 \x10FFFF,共 1,114,112 个。前缀 U+
,