XPath
XPath é usado para navegar por elementos e atributos em um documento XML. Todas as páginas da web são documentos HTML por natureza. Octoparse fornece um mecanismo XPath para documentos HTML para que possamos usar o XPath para localizar dados na página da web com precisão.
XPath usa expressões de caminho para selecionar nós. O nó é selecionado seguindo um caminho ou etapas.
Abaixo, está a lista das expressões de caminho mais úteis
Expressão Descrição
nodename Seleciona todos os nós com o nome “nodename”
/ Seleciona do nó raiz
// Seleciona os nós no documento do nó atual que fazem a seleção, independentemente de onde estejam
. Seleciona o nó atual
.. Seleciona o pai do nó atual
@ Seleciona atributos
* Corresponde a qualquer nó de elemento
@ * Corresponde a qualquer nó de atributo
nó () Corresponde a qualquer nó de qualquer tipo
Existem alguns predicados em expressões XPath que são usados para localizar um nó específico ou um nó que contém um valor específico e sempre integrado entre colchetes. Abaixo está uma lista sobre algumas expressões de caminho com predicados e os resultados correspondentes:
Resultados da expressão do caminho X
/ bookstore / book [last ()] Seleciona o último elemento book que é filho do elemento bookstore
/ bookstore / book [position () <3] Seleciona os primeiros dois elementos de livro que são filhos do elemento de livraria
// title [@ lang = ‘en’] Seleciona todos os elementos de título que têm um atributo “lang” com um valor de “en”
/bookstore/book[price>35.00]/title Seleciona todos os elementos de título dos elementos de livro do elemento de livraria que têm um elemento de preço com um valor maior que 35,00
fonte de: octoparse.com