1
I need to extract the first paragraph of an HTML code using Regular Expressions.
The Goal: To get only the content highlighted in green:
HTML code
<div class="text"> <p><span style="font-size:16px">As notas do Exame Nacional do Ensino Médio (Enem) 2017 foram divulgadas nesta quinta-feira (18). O resultado deve ser consultado individualmente: para isso, os candidatos devem acessar a Página do Participante (https://enem.inep.gov.br/participante/) e incluir CPF e a senha cadastrada. </span></p> <p><span style="font-size:16px">O resultado dos treineiros só será divulgado em 19 de março. Na mesma data, o Ministério da Educação também vai disponibilizar os chamados "espelhos da redação", que são a cópia digitalizada dos textos e as justificativas para as notas. </span></p> <p><span style="font-size:16px">Nesta quinta, o Ministério da Educação (MEC) divulgou o balanço sobre o desempenho dos candidatos na edição de 2017 do exame. Apenas 53 alunos tiraram nota mil na redação, porém a nota média subiu de 541,9 para 558. Neste ano, os candidatos escreveram sobre o tema "Desafios para a formação educacional de surdos no Brasil".</span></p> <p><span style="font-size:16px">Com a nota do Enem 2017, os estudantes podem concorrer a uma vaga em uma universidade pública que tenha aderido ao Sistema de Seleção Unificada (Sisu) 2018. As vagas já podem ser consultadas. Serão 130 instituições no Brasil - 30 estaduais e 100 federais -, que ofertarão 239.601 vagas na graduação.</span></p>
I’m trying to filter in PHP with preg_match_all
$filtroregex = "/<p><span style=\"font\-size:16px\">(.*?)<\/span><\/p>/s";
preg_match_all($filtroregex, $htmlcode, $resultado);
echo $resultado[1][0];
But it’s always returning every paragraph.
Has used
var_dump($resultado);
to get answers? Have you thought about usingXPath
orDOMDocument
?– Valdeir Psr
var_dump Yes, then I have this last filter that is to take the first paragraph. Analyze the Regex here
– klebrr