【发布时间】:2019-08-12 15:08:22
【问题描述】:
我正在使用 docx 库从 word doc 中读取文件,我正在尝试使用正则表达式搜索和匹配仅提取问题。我找到了无限的方法,但我不断收到“TypeError”。
我要提取的数据是这样的:
我的经济援助会支付住房费用吗?
校外住宿 - 经济援助适用于您的学费和
费用后,任何剩余资金将作为退款发送给您,该退款将
直接存入(可以通过您的
帐户设置)或作为纸质支票邮寄给您。然后,您可以使用
退款来支付租金。重要的是要注意,当租金到期时,可能
无法获得经济援助,因此请确保在
地方制定支付租金的计划。我的经济援助会支付住房费用吗?
“财务”“帮助”“房子”
资金“大学橡树”
"钱" "chisho"
“支付”“小伙子”
“授予”“月桂树”
获得房间和补助金的要求是什么?
我如何支付我的住房费用?
我如何支付住房费用?
如果还有一种更简单的方法可以将单词 doc 导出到不同类型的文件中,那么很高兴知道反馈。谢谢
我正在使用正则表达式 101,我尝试了以下正则表达式来仅匹配以问号结尾的句子
".*[?=?]$"
"^(W|w).*[?=?]$"
"^[A-Za-z].*[?=?]$"
import re
import sys
from docx import Document
wordDoc = Document('botDoc.docx')
result = re.search('.*[?=?]$', wordDoc)
print(result)
if result:
print(result.group(0))
for table in wordDoc.tables:
for row in table.rows:
for cell in row.cells:
print("test")
我希望将匹配的模式保存到目录中,以便将数据导出到 csv 文件
【问题讨论】:
标签: python regex ms-word python-3.7