【问题标题】:jSoup extract Text out of DIV tag to StringjSoup从DIV标签中提取文本到字符串
【发布时间】:2014-01-31 09:31:49
【问题描述】:

我想从网站中提取一些文本并存储在字符串中。

<div class="textclass" id="textid" itemprop="itemtext">I want to get this Text</div>

问号是什么意思?

protected Void doInBackground(Void... params) {
            try {
                Document document = Jsoup.connect(url).get();

                Elements text = document.select("???");

                desc = text.attr("???");
            } catch (IOException e) {
                e.printStackTrace();
            }
            return null;
        }

【问题讨论】:

    标签: java android text jsoup


    【解决方案1】:

    使用下面的

    Elements text = document.select("div");
    String desc = text.text();
    Log.i(".........",+desc);
    

    我尝试后的日志

    01-31 04:45:15.272: I/.........(1233): I want to get this Text
    

    编辑:

    你可以使用

    Elements text = document.select("div[class=textclass]");
    

    或者使用id

    Elements text = document.select("div[id=textid]");
    

    Elements text = document.select("div[itemprop=itemtext]");
    

    【讨论】:

    • 哦,对不起,我应该说,网站中有一些 div 标签。我认为您的代码找不到正确的..您知道如何识别正确的 div 吗?
    • @thankyou 那么您应该编辑您的问题并发布 html 并确定您需要的内容,否则没有人可以正确回答
    • @thankyou 使用 Elements text = document.select("div.textclass"); 会找到正确的 onw
    • 元素 text = document.select("div.textclass"); == 应用程序崩溃元素 text = document.select("div[id=textid]"); == 应用成功了,谢谢 :) @Raghunandan
    • @thankyou 在这里尝试try.jsoup.org 通过粘贴您的 html 并尝试您的查询。所有三个作品。崩溃可能是由于不同的原因
    【解决方案2】:

    你可以试试这个:

        Document doc1 = Jsoup.connect(url).get();
        Element contentDiv = doc1.select("div[id=textid]").first();
        String text=contentDiv.getElementsByTag("div").text();
    
        System.out.println(text); // The result
    

    因此,获取 id 为“textid”的 div 中的文本保存在变量“text”中。

    【讨论】:

    • 合乎逻辑,但应用程序崩溃:/
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-12-28
    • 2021-01-29
    • 2018-04-24
    • 1970-01-01
    • 2019-07-11
    相关资源
    最近更新 更多