【发布时间】:2020-06-12 09:55:31
【问题描述】:
好的,所以我正在尝试从 pdf 中提取文本并从提取的文本中显示 wordcloud。
接收类型错误:“模块”对象不可调用 在行
cloud = wordcloud(mask=rsMask).generate(pageObj.extractText())
这是我正在运行的代码,提前感谢,干杯:
> #Extracting text from a pdf
import wordcloud
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
import PyPDF4
pdfFileObj = open('Test-Resume-Doc.pdf', 'rb')
pdfReader = PyPDF4.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(0)
pageText = (pageObj.extractText())
pdfFileObj.close()
rsMask = np.array(Image.open('Resume_WordCloud.png'))
print(rsMask)
#
cloud = wordcloud(mask=rsMask).generate(pageObj.extractText())
print(cloud)
plt.imshow(cloud, interpolation="bilinear")
plt.axis('off')
plt.show()
【问题讨论】:
-
您从
plt模块调用imshow函数作为plt.imshow和来自np模块的array函数,两者都正确。您必须对wordcloud模块中的函数执行相同操作:wordcloud.somefunction(mask=rsMask).generate... -
非常感谢!!问题解决了。改为:
cloud = wordcloud.WordCloud(mask = rsMask).generate(pageObj.extractText())
标签: python-3.x object word-cloud