DOMCrawler查找具有内部HTML文本的标记


DOMCrawler find Tag with Inner HTML text

我正在尝试使用Goutte来抓取网页,但找不到DOMCrawler方法来搜索实际文本。假设有一个td,但它没有类或ID。所以,我需要搜索"标题",然后得到td的下一个同级。

首先,我想让您参考DomCrawlers关于节点筛选的文档,特别是DomCrawler::reduce()方法和访问节点值

如果你对访问这些不满意,那么你可以随时下拉并使用DOMNode属性

当然,您可能会更幸运地使用XPath查询,因为XPath查询功能非常强大。