【问题标题】:Find the encoding method of a string查找字符串的编码方式
【发布时间】:2021-02-15 16:21:25
【问题描述】:

我正在处理一个 xml 文件,其中数字使用不同的方法进行编码。 标题说 "xml version="1.0" encoding="utf-8"" ,但我发现不仅使用了 utf8。 以下字符串我相信使用了相同的编码方法。但我无法弄清楚使用的方法。请参阅下面的字符串是相应的小数和括号中的单位。字符串可能包含也可能不包含单位。

40413CA4FCA42AED  5.000 (ksi)
40A2C00000000000  0.15 (kcf)  
40A2200000000000  0.145 (kcf)
40DB627A7915AB7E  4067.135889 (ksi)
3FC999999999999A  0.2 (no unit)
400D99D5D4C224D1  0.5366563 (ksi)

下面是我为解释这些字符串而编写的 python 代码。在 6 个字符串中,我猜对了一个,即 0.2

import struct
# define double_to_hex (or float_to_hex)
def double_to_hex(f):
    return hex(struct.unpack('<Q', struct.pack('<d', f))[0])
print(double_to_hex(0.5366563))

有什么建议吗?

【问题讨论】:

    标签: python hex decode encode


    【解决方案1】:

    我猜是单位不匹配。

    import struct
    import pandas as pd
    import io   
    
    mydata = '''hxstr decval unit
    40413CA4FCA42AED 5.000 (ksi)
    40A2C00000000000 0.15 (kcf)
    40A2200000000000 0.145 (kcf)
    40DB627A7915AB7E 4067.135889 (ksi)
    3FC999999999999A 0.2 (nou)
    400D99D5D4C224D1 0.5366563 (ksi)
    '''
    
    df = pd.read_csv( io.StringIO(mydata), sep=" ")
    for index, row in df.iterrows():
        print( 
          row.hxstr,
          row.unit,
          struct.unpack(
            '>d',
            bytes.fromhex(row.hxstr))[0] / float(row.decval)) 
    

    结果显示相同单位的大致相同比率:

    40413CA4FCA42AED (ksi) 6.894757
    40A2C00000000000 (kcf) 16000.0
    40A2200000000000 (kcf) 16000.000000000002
    40DB627A7915AB7E (ksi) 6.89475699994749
    3FC999999999999A (nou) 1.0
    400D99D5D4C224D1 (ksi) 6.894757187574625
    

    这里

    • 6.894757 ksi 的比率类似于以下转换(假设 ksi 表示 千磅/平方英寸):@ 987654321@,
    • 1.0 no unit 的比率似乎是正确的,但是
    • 16000.0 kcf 的比率我无法识别...

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-02-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多