【发布时间】:2021-04-05 16:17:03
【问题描述】:
我从一个公共网站上抓取了这个过敏数据字符串:
Cedar 679 gr/m3 High, Grass 20 gr/m3 Medium, Trees 80 gr/m3 Medium, Molds Low.
有时项目的数量较少,但树木和草的一般格式总是这样,用逗号分隔每种类型的过敏原:
TYPE AMOUNT g/m3 LEVEL
模具是个例外;假设它总是一串文本。假设我们根本不需要模具数据。
您会使用什么库或技术将其解析为简洁的 JSON 对象,例如:
{
"Cedar": "679",
"Grass": "20",
"Trees": "80"
}
【问题讨论】:
-
你理想的数据集最终会是什么样子?
-
我想我可以使用 csv-parser 将每个项目切成自己的字符串,删除模具,然后在空间上拆分每个字符串以获得树/草和数量...
标签: javascript node.js json csv