【发布时间】:2023-03-12 00:50:01
【问题描述】:
我有一个 csv 文件,例如:
"B/G/213","B/C/208","WW_cis",,
"B/U/215","B/A/206","WW_cis",,
"B/C/214","B/G/207","WW_cis",,
"B/G/217","B/C/204","WW_cis",,
"B/A/216","B/U/205","WW_cis",,
"B/C/219","B/G/202","WW_cis",,
"B/U/218","B/A/203","WW_cis",,
"B/G/201","B/C/220","WW_cis",,
"B/A/203","B/U/218","WW_cis",,
我想将它读入数组或数据框之类的东西,这样我就可以将一列中的元素与另一列中的选定元素进行比较。起初,我使用numpy.genfromtxt 将它直接读入了一个数组,但我在'"B/A/203"' 之类的地方到处都带有额外的引号"。我在某处读到,pandas 允许剥离额外的 " 字符串,所以我尝试了:
class StructureReader(object):
def __init__(self, filename):
self.filename=filename
def read(self):
self.data=pd.read_csv(StringIO(str("RNA/"+self.filename)), header=None, sep = ",")
self.data
但我得到了类似的东西:
<class 'pandas.core.frame.DataFrame'> 0
0 RNA/4v6p.csv
如何将我的 CSV 文件转换为某种允许我搜索列和行的数据类型?
【问题讨论】:
-
No such thing as a stupid question。忍不住了,哈哈。
-
我的评论现在似乎很刻薄......原来的问题在叙述中有所体现。我的意思是鼓励 OP 对知识的追求。
标签: python arrays csv pandas dataframe