【发布时间】:2017-05-19 11:56:59
【问题描述】:
我如何上传 MS 文档(扩展名为 .docx..xls 等)/.pdf 并使用 Java API 从这些文件中搜索单词。
我已经尝试在下面上传 docx 文件
InputStream docStream = Example.class.getClassLoader().getResourceAsStream(
"data"+File.separator+"Resume.docx");
GenericDocumentManager manager = client.newDocumentManager();
DocumentMetadataHandle handleMetaData = new DocumentMetadataHandle();
// create a handle on the content
InputStreamHandle handle = new InputStreamHandle(docStream);
// write the document content
manager.write("/example/resume.docx", handleMetaData, handle);
要搜索我在下面尝试过,
GenericDocumentManager manager = client.newDocumentManager();
StringQueryDefinition query =
queryMgr.newStringDefinition().withCriteria("pavan");
DocumentPage documents = manager.search(query, 1);
while (documents.hasNext()) {
DocumentRecord document = documents.next();
System.out.println("document" + document.getContent(new StringHandle()));
}
请帮助我处理逻辑和代码。
【问题讨论】:
标签: marklogic marklogic-8