【问题标题】:Python - changing the output when querying my CSV filePython - 查询我的 CSV 文件时更改输出
【发布时间】:2013-05-03 01:41:39
【问题描述】:

我的任务是在 Python 中创建一个搜索 CSV 文件的程序;学术论文列表(作者、年份、标题、期刊——实际上是 TSV)。

使用我当前的代码,我可以实现正确的输出(因为信息是正确的),但它的格式不正确。

我得到的是;

['Albers;Bergman', '1995', '听得见的网络', 'Proc. ACM CHI']

我需要的是这种格式;

作者/s。 (年)。标题。杂志。

因此逗号更改为句号(句点)。 如果有两个作者,作者之间的 ; 也应该改为 & 符号,或者应该有一个 逗号后跟一个 &三位或更多作者。 即

格伦和弗雷格。 (1995 年)。很酷的书名。史诗般的期刊名称。

佩里,史密斯@琼斯。 (1998 年)。更酷的书名。无聊的期刊名。

我不完全确定如何执行此操作。我已经在 Stackoverflow 上搜索了 python 参考资料、google 和 here,但找不到任何东西(至少我理解)。这里有很多关于完全删除标点符号的内容,但这不是我想要的。

我最初认为替换功能会起作用,但它给了我这个错误。 (我将保留代码以显示我正在尝试的内容,但已注释掉)

str.replace(',', '.')
TypeError: replace() takes at least 2 arguments (1 given)

它并不能完全解决我的问题,但我认为这是可以改变的。我假设 str.replace() 不会使用标点符号?

无论如何,下面是我的代码。有人有其他想法吗?

import csv


def TitleSearch():
    titleSearch = input("Please enter the Title (or part of the title). \n")
    for row in everything:
        title = row[2]
        if title.find(titleSearch) != -1:
            print (row)


def AuthorSearch():
    authorSearch = input("Please type Author name (or part of the author name). \n")
    for row in everything:
        author = row[0]
        if author.find(authorSearch) != -1:
          #str.replace(',', '.')
        print (row)


def JournalSearch():
    journalSearch = input("Please type in a Journal (or part of the journal name). \n")
    for row in everything:
        journal = row[3]
        if journal.find(journalSearch) != -1:
            print (row)

def YearSearch():
    yearSearch = input("Please type in the Year you wish to search. If you wish to search a decade, simply enter the first three numbers of the decade; i.e entering '199' will search for papers released in the 1990's.\n")
    for row in everything:
        year = row[1]
        if year.find(yearSearch) != -1:
            print (row)




data = csv.reader (open('List.txt', 'rt'), delimiter='\t')
everything = []
for row in data:
    everything.append(row)



while True:
    searchOption = input("Enter A to search by Author. \nEnter J to search by Journal name.\nEnter T to search by Title name.\nEnter Y to search by Year.\nOr enter any other letter to exit.\nIf there are no matches, or you made a mistake at any point, you will simply be prompted to search again. \n" )

    if searchOption == 'A' or searchOption =='a':
        AuthorSearch()
        print('\n')

    elif searchOption == 'J' or searchOption =='j':
        JournalSearch()
        print('\n')

    elif searchOption == 'T' or searchOption =='t':
        TitleSearch()
        print('\n')
    elif searchOption == 'Y' or searchOption =='y':
        YearSearch()
        print('\n')
    else:
        exit()

提前感谢任何可以提供帮助的人,非常感谢!

【问题讨论】:

    标签: python csv output


    【解决方案1】:

    到目前为止,您已经有了一个很好的开始;你只需要进一步处理它。将print(row)替换为PrettyPrintCitation(row),并在下面添加函数。

    基本上,您似乎需要使用开关来格式化作者,最好将其实现为一个函数。然后,您可以只用一个漂亮的格式字符串来处理其余部分。假设您的参考 rows 如下所示:

    references = [
        ['Albers', '1994', 'The audible Internet', 'Proc. ACM CHI'],
        ['Albers;Bergman', '1995', 'The audible Web', 'Proc. ACM CHI'],
        ['Glenn;Freg', '1995', 'Cool book title', 'Epic journal title'],
        ['Perry;Smith;Jones', '1998', 'Cooler book title', 'Boring journal name']
    ]
    

    那么以下内容将为您提供我相信您正在寻找的内容:

    def PrettyPrintCitation(row) :
        def adjustauthors(s):
            authorlist = s[0].split(';')
            if(len(authorlist)<2) :
                s[0] = authorlist[0]
            elif(len(authorlist)==2) :
                s[0] = '{0} & {1}'.format(*authorlist)
            else :
                s[0] = ', '.join(authorlist[:-1]) + ', & ' + authorlist[-1]
            return s
    
        print('{0}. ({1}). {2}. {3}.'.format(*adjustauthors(row)))
    

    适用于上面的引文,这给了你

    Albers. (1994). The audible Internet. Proc. ACM CHI.
    Albers & Bergman. (1995). The audible Web. Proc. ACM CHI.
    Glenn & Freg. (1995). Cool book title. Epic journal title.
    Perry, Smith, & Jones. (1998). Cooler book title. Boring journal name.
    

    (我假设您建议的输出中的“@”是一个错误......)

    【讨论】:

      【解决方案2】:

      您需要处理您的 Python 语法。

      尝试以下方法:

      authorlist=row[0].split(';') # split the multiple authors on semicolon
      authors=" & ".join(ahthorlist) # now join them together with ampersand
      print"""%s. (%s) %s.""" % (authorlist,row[1],row[2]) # print with pretty brackets etc.
      

      【讨论】:

        猜你喜欢
        • 2020-09-26
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-09-03
        • 2021-09-12
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多