【发布时间】:2011-11-18 05:24:38
【问题描述】:
有一个像这样的 utf-8 编码字符串:
bar = "hello 。◕‿‿◕。"
还有一个字节偏移量,告诉我必须在哪个字节处拆分字符串:
bytes_offset = 9
如何将条形字符串分成两部分导致:
>>first_part
'hello 。' <---- #9 bytes 'hello \xef\xbd\xa1'
>>second_part
'◕‿‿◕。'
简而言之:
给定一个字节偏移量,如何将其转换为 utf-8 编码字符串的实际字符索引位置?
【问题讨论】: