【发布时间】:2015-10-24 02:49:44
【问题描述】:
有没有办法让 R 在读取 csv 文件时读取每个单元格中的列/变量名?
我的 csv 文件格式错误。并非每一行都有每个变量,也不是每一行都具有相同的长度。但是,每一行都有一个变量名,例如"id": "37189", "city": "Phoenix", "type": "business"。当我告诉 R 读取 csv 时,我可以指示它在数据中查找变量名并进行相应排序吗?
为您提供方便的数据示例:
business_id:vcNAWiLM4dR7D2nwwJ7nCA,full_address:4840 E Indian School Rd\nSte 101\nPhoenix, AZ 85018,关闭:17:00,打开:08:00,打开:true,类别:[医生, Health & Medical],城市:Phoenix,review_count:9,姓名:Eric Goldberg, MD,社区:[],经度:-111.98375799999999,州:AZ,星星:3.5,纬度:33.499313000000001,属性:预约仅:真,类型:商务,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,
business_id:UsFtqoBl7naz8AVUBZMjQQ,完整地址:202 McClure St\nDravosburg, PA 15034,营业时间:true,类别:[夜生活],城市:Dravosburg,review_count:4,名称:Clancy's Pub,街区:[],经度:-79.886930000000007 ,州:PA,星数:3.5,纬度:40.350518999999998,属性:欢乐时光:真,接受信用卡:真,适合团体:真,户外座位:假,价格范围:1,类型: 商业,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,
business_id: cE27W9VPgO88Qxe4ol6y_g,{ full_address: 1530 Hamilton Rd\nBethel Park, PA 15234}, open: false, 类别: [Active Life, Mini Golf, Golf], 城市: Bethel Park, review_count: 5, name: Cool Springs高尔夫中心,街区:[],经度:-80.015910000000005,州:PA,星数:2.5,纬度:40.356896200000001,属性:适合儿童:true,类型:商业,,,,,,,,,,,,,, ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, ,,,,,,,,,,,
粗体字是一些没有出现在其他条目中的变量。
【问题讨论】:
-
你确定是csv格式吗?它看起来像 json 或类似的东西。
-
我同意 hfty。一些邪恶的人拿走了 JSON,删除了括号并将其推入 CSV 文件的字段 1。有没有办法回到这个文件的来源并要求创建者只给你JSON?处理(99% 最有可能)
attributes没有 括号中的嵌套结构将涉及一些有趣的解析/处理。 -
我知道我认出了这一点。您是如何将完美的 Yelp API JSON 转换为这种格式的?
-
@hrbrmstr 哦,这很有道理——我对 JSON 一无所知,但这个文件太乱了,它不应该是 cvs 是有道理的。谢谢。