logo-antoiba

Antonio Ibáñez Programming

Usando casperjs con php para web scraping

Casperjs PHP

Para hacer web scraping con PHP normalmente se utiliza la librería de cURL, pero en ocasiones, existen páginas donde cURL no puede llegar como páginas generadas por Angular o mediante Ajax. Para ello, la herramienta mejor posicionada para conseguir lo que queremos es usar Casperjs. En artículos anteriores ya hablamos de como instalar Casperjs y el wrapper para PHP. Casperjs es una herramienta que nos da una versatilidad y opciones para realizar web scraping que permite con facilidad conseguir el contenido de las páginas que queramos. Para empezar a usar Casperjs lo primero que debemos de hacer es llamar al archivo autoload y luego debemos escribir use Browser\Casper para que podamos usar Casperjs



require_once "../../vendors/autoload.php";
use Browser\Casper;

Una vez que se carga el archivo autoload y llamamos a Casperjs debemos de escribir nuestro script para conseguir la imagen del logo de Google.



$casper = new Casper();
$casper->setOptions([
'ignore-ssl-errors' => 'yes'
]);

$casper->start('http://www.google.com');

// make a screenshot of the google logo
$casper->captureSelector('#hplogo', '../webroot/img/logo.png');

// or take a screenshot of a custom area
$casper->capture(
array(
'top' => 0,
'left' => 0,
'width' => 800,
'height' => 600
),
'/tmp/custom-capture.png'
);
//run the casper script
$casper->run();

Con este scripts conseguiremos tener el logo de Google en el directorio que especifiquemos. Se pueden hacer muchas más cosas, esta es una pequeña muestra para abrir boca.


Escribe un comentario

Anterior Instalar casperjs y usarlo en php

Está web utiliza cookies para asegurarse de una mejor experiencia de nuestra página webMás información sobre las cookies