Between: Función PHP para extraer texto de documentos html

Hace varios años utilizo esta función para extraer textos o contenidos automaticamente de un documento html o similares.


function between($beg, $end, $str) {
$a = explode($beg, $str, 2);
$b = explode($end, $a[1]);
return $beg . $b[0] . $end;
}

El modo de uso es sencillo, teniendo la función incluida en el archivo PHP, la usamos de la siguiente manera:

$url = file_get_contents("http://www.google.com/");
$extract_string = between('<span id="perfil">', '</span>', $url);

Donde $url es la variable que trae el html (bien podría ser un texto plano o un archivo txt, cualquier texto al que necesites extraerle una porción definida). Y $extract_string es la llamada a nuestra función Between, donde como parametros indicamos el string a buscar como inicio, el string final y la variable a la que debe aplicar la acción.

Cabe aclarar que esta función trae el texto que se encuentra entre esos dos parametros, junto con los parametros, es decir que si estamos buscando un texto que esta entre <strong> y </strong> el resultado será: <strong>El texto que esta dentro</strong>.

Si necesitas que el texto no tenga esos dos parametros incluidos puedes reemplazarlo con la función de PHP eregi_replace, o cambiar en la función between la línea:
return $beg . $b[0] . $end;

Por:
return $b[0];

Comentarios

comentarios

Related Posts

3 Comments

Add Comment