【发布时间】:2021-05-04 08:16:31
【问题描述】:
我有一个数据集,其中包含美国每个县的医疗保健信息。我只是想从每个县提取一个值,即人均实际医疗成本 (AB27)。
我遇到的问题是数据集使用下拉列表来提取每个县的信息。当我尝试创建一个熊猫数据框时,它只获取下拉列表。
理想情况下,我可以遍历数据集并将每个县的名称和人均实际医疗成本 (AB27) 提取到 pandas 数据框中。
有什么想法吗?
【问题讨论】:
-
我猜有一些 VBA 代码或类似的东西可以从数据库中提取数据并将其显示在 excel 中。你有没有看过excel的宏?
-
@GeneBurinsky 我在这里绝对是我的头,我对 VBA 和 excel 宏的主题完全一无所知。我确实认为您是对的,当我检查单元格 AB27 的内容时,它显示为: =VLOOKUP($P$7,'State_county 2019'!$1:$1048576,MATCH(Report!A28,'State_county 2019'!$2:$2, 0),0)
-
感谢您的代码。 vlookup 和 match 函数通常用于在 excel 中执行连接或数据合并,因此它没有我想象的那么复杂。据推测,所有的数据都已经在 excel 文件中了。作为以下答案的替代方案,只需阅读整个报告表,然后使用 pandas 或其他 python 工具在数据行中查找“人均实际健康成本”可能是明智的。
-
啊好吧,这更简单。我会四处寻找有关如何扩展报告表的指南,但如果您有任何建议会很好