Python2 的噩梦:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xxx in position 0: illegal multibyte sequence 字符串 从 Python3 的 str 对象中取出的是 Unicode 字符 从 Python2 的 unicode 对象中取出的是 Unicode 字符 从 Python2 的 str 对象中取出的是 原始字节序列 Unicode Unicode 对字符的标识,称为 code point,码位。 码位的范围从 \x0 到 \x10FFFF,共 1,114,112 个。前缀 U+,