【问题标题】:How to get information from text and safe it in variable with python如何从文本中获取信息并使用python将其保存在变量中
【发布时间】:2020-07-25 01:51:28
【问题描述】:

所以我正在尝试制作一个离线词典并作为单词的来源,我使用的是 .txt 文件。我有一些与此相关的问题。如何在我的文本文件中找到特定单词并将其保存在变量中?我的文件长度也很重要,它会影响速度吗?这只是我的 .txt 文件的一部分:

Abendhimmel m вечерно небе.|-| Abendkasse f Theat вечерна каса.|-| Abendkleid n вечерна рокля.|-| Abendland n o.Pl. geh Западът.|-|

我想要的是保存麦芽汁,例如,Abendkasse 和其他所有东西,直到这个符号 |-|在一个变量中。感谢您的帮助!

【问题讨论】:

    标签: python-3.x text python-textprocessing


    【解决方案1】:

    我建议您查看名为 realines() 和 read() 的 Python 标准库函数(在打开的文件上)。我不知道您的文件有多大,但您通常可以将整个内容读入 ram(使用 read 或 readlines),然后搜索您获得的字符串。 Searchin 可以通过正则表达式或简单的循环来完成。

    文件的长度很重要,因为打开较大的文件需要稍长的时间。尽管通常这仍然很快,即使对于大型文本文件也是如此。事实上,我认为在很多情况下,首先读取整个文件会更快,因为一旦将其读入 ram,对其进行的所有操作都会更快。

    一个例子:

    
    with open("yourlargetextfile.txt", f):
        contents = f.readlines()
        for line in contents:
            # split every line into parts from |-| to the next |-|
            parts = line.split("|-|")
    
    

    【讨论】:

    • 这应该是什么正则表达式模式:-Abendkasse f Theat вечерна каса.|-|,我想在哪里获取“-”和“|-|”之间的信息?另外,什么你的意思是循环吗?
    猜你喜欢
    • 2021-04-17
    • 2021-01-12
    • 1970-01-01
    • 2013-09-27
    • 1970-01-01
    • 1970-01-01
    • 2015-05-22
    • 2013-10-19
    • 1970-01-01
    相关资源
    最近更新 更多