Python直接调用len计算出的是字符个数。如下:
1 2 3 4 5 |
>>> s = '测试' >>> len(s) 2 |
如果要得到字节长度可以编码成utf-8格式:
1 2 3 4 5 |
>>> s = '测试' >>> len(s.encode('utf8')) 6 |
编码成utf-8格式后,一个中文字符占用3个字节,所以长度结果为6。
如下:
1 2 3 4 5 |
>>> s = '测试' >>> s.encode('utf8') b'\xe6\xb5\x8b\xe8\xaf\x95' |