【问题标题】:pandas to_excel() using float_format parameter --> ValueError: could not convert string to floatpandas to_excel() 使用 float_format 参数 --> ValueError: could not convert string to float
【发布时间】:2014-09-05 16:13:22
【问题描述】:

我有一个包含异构数据的 pandas DataFrame。这意味着有些列是浮点数,有些是字符串,等等。

我首先尝试通过调用 xlsxwriter 工作表级 set_column() 方法来格式化列,但似乎 to_excel() 正在使用它自己的格式对象格式化每个单独的单元格,因此列级格式被覆盖。

我正在尝试将 DataFrame 导出到 Excel 并利用 here 记录的 float_format 参数。

代码:

writer = pd.ExcelWriter(path, engine='xlsxwriter')

ff = '_(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)'

df.to_excel(writer, "sheet_name", index=False, float_format=ff)

我在调用 to_excel 时遇到的异常:

$VE_DIR/lib/python2.7/site-packages/pandas/util/decorators.pyc in wrapper(*args, **kwargs)
     58                 else:
     59                     kwargs[new_arg_name] = old_arg_value
---> 60             return func(*args, **kwargs)
     61         return wrapper
     62     return _deprecate_kwarg

$VE_DIR/lib/python2.7/site-packages/pandas/core/frame.pyc in to_excel(self, excel_writer, sheet_name, na_rep, float_format, columns, header, index, index_label, startrow, startcol, engine, merge_cells, encoding, inf_rep)
   1228         formatted_cells = formatter.get_formatted_cells()
   1229         excel_writer.write_cells(formatted_cells, sheet_name,
-> 1230                                  startrow=startrow, startcol=startcol)
   1231         if need_save:
   1232             excel_writer.save()

$VE_DIR/lib/python2.7/site-packages/pandas/io/excel.pyc in write_cells(self, cells, sheet_name, startrow, startcol)
    785         style_dict = {}
    786 
--> 787         for cell in cells:
    788             num_format_str = None
    789             if isinstance(cell.val, datetime.datetime):

$VE_DIR/lib/python2.7/site-packages/pandas/core/format.pyc in get_formatted_cells(self)
   1729         for cell in itertools.chain(self._format_header(),
   1730                                     self._format_body()):
-> 1731             cell.val = self._format_value(cell.val)
   1732             yield cell
   1733 

$VE_DIR/lib/python2.7/site-packages/pandas/core/format.pyc in _format_value(self, val)
   1510                 val = self.inf_rep
   1511             elif self.float_format is not None:
-> 1512                 val = float(self.float_format % val)
   1513         return val
   1514 

ValueError: could not convert string to float: _(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)

我假设 to_excel() 只会尝试将参数应用于浮点格式的列(甚至特定单元格)而不是每条数据,所以我不确定我错过了什么。如果需要,我将发布重现错误的特定表的清理版本,但我想也许有人会认出我所面临的情况。

谢谢!

【问题讨论】:

    标签: python excel pandas xlsxwriter


    【解决方案1】:

    您的ff 完全无效。看看这个:

    val = float(self.float_format % val)
    

    现在试试这个(在 ipython 中):

    '_(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)' % 7.2
    

    python需要使用float格式,而不是excel

    【讨论】:

    • 谢谢@acushner;这是一个根本性的误解......我正在尝试使用像this 这样的千位分隔符来专门格式化,但它没有得到认可。有什么想法吗?
    • 谢谢,但我想在 pandas 中进行格式化,以便在生成的电子表格中以这种方式格式化浮点数。有办法吗?
    猜你喜欢
    • 1970-01-01
    • 2019-12-18
    • 2018-02-13
    • 1970-01-01
    • 2019-05-22
    • 1970-01-01
    • 2021-07-21
    • 2021-11-19
    • 2020-12-11
    相关资源
    最近更新 更多