【发布时间】:2018-05-25 02:38:49
【问题描述】:
请求的 HTTP GET 响应如下所示
<html>
<head> <script type="text/javascript">----</script> <script type="text/javascript">---</script> <title>Detailed Notes</title>
</head>
<body style="background-color: #FFFFFF; border-width: 0px; font-family: sans-serif; font-size: 13; color: #000000"> <p>this is one note </p> </body> </html>
我将其作为字符串获取,我必须从中读取正文部分。
我尝试了 HtmlAgility 包,但由于 html 内容中的一些特殊情况,HTML 解析失败(我认为注释脚本中的某些内容会导致此问题)。
所以要读取标签内容,我正在考虑 SubString 操作。
Like SubString 从<body tag 开始。
我们如何从文本中的一个单词的开头做 SubString?
【问题讨论】:
-
那么,您是否要编辑您的问题以包含一个问题?请阅读How to Ask。
-
您只需要 Body 的内容吗?或者我们也应该包括“”吗?你想过正则表达式吗?
-
只是正文内容。是的,我想 Regx 很有用。但是我猜body标签的CSS样式可能会引起一些麻烦