我必须像这样解析html代码:
<td><b>Dont need it</b>I need this!!<br><b>Dont need it too:</b> I need
this too!!<br> <b>Text:</b> I need this<br></td>
我试过这样的事情:
td.select("< b />< br >)")但是它抛出了异常。
我能够在b标签中获取文本,但是如何在b和br标签之间获取文本。
分析解答
您希望获取<td/>
下的所有文本节点,但不能获取任何命名节点。 JSoup有一个名为textNodes()
的方法,它返回以下内容:
Element td = ...;
StringBuilder sb = new StringBuilder();
for (TextNode textNode : td.textNodes()) {
sb.append(textNode.text());
}
return sb.toString();