Select text from a div and ignore any other tag using Xpath

Asked

Viewed 24 times

1

I have the following situation where I want to get the text from a div and ignore the contents of the daughters Divs and get only the text from the parent div below follows the html structure.

<div class="text-description">
    <div>
        <div class="ad text">
           conteudo a ser ignorado
        </div>
    </div>
    é um texto modelo da indústria tipográfica e de impressão. O Lorem Ipsum tem vindo a ser o texto padrão usado por estas indústrias desde o ano de 1500
    <br>
    é um texto modelo da indústria tipográfica e de impressão. O Lorem Ipsum tem vindo a ser o texto padrão usado por estas indústrias desde o ano de 1500
    <br>
    é um texto modelo da indústria tipográfica e de impressão. O Lorem Ipsum tem vindo a ser o texto padrão usado por estas indústrias desde o ano de 1500
    <br>
</div>

I am using the following expression xpath to get this text

$xpath = new DOMXPath($dom);
$nodes= $xpath->query("/html/body//div[@class='text-description']");

foreach ($nodes as $node) {
    $text = $node->textContent;
}

logo the remade I have and the capture of all the text including all the text of the daughter div where I want to get only the text of the father div including the tags br

No answers

Browser other questions tagged

You are not signed in. Login or sign up in order to post.