[I Parte]Armando un Crawler en Python

No Comments
Bueno ahora ando haciendo un pequeño Crawler para recuperar datos de una página web en python así que, me puse a recordar en realidad todo el dia :'( eso de andar pensando en otras vainas como dicen por ahi quien no practica no llega a nada o era algo por el estilo otra de mis chispoteadas, este sera la primera parte de como armar un Crawler = Araña en Python, solo veremos teoría  el otro sera ya con un ejemplo simple para hacer una araña que nos saque el Hash de un MD5 de x pagina web como ejemplo, asi que sin mas comenzamos. 

1.- Introducción

Una araña web, también es conocida como crawler, spider es un pequeño software, programa, script que recorre toda la red de internet, de manera automatica.

Actualmente es usado por varias paginas web, o buscadores que tiene como objetivo o función multipropósito es decir puede ir y buscar todos los sitios que tengan la palabra Hacker mas de 100 veces, buscar dentro de mi pagina web solo links que sean referentes a la biblioteca y que lo guarde en un archivo de texto. (Estos ejemplos que doy son básicos y pequeños)

Honestamente veo que todos podemos llegar a programar un crawler pero pocos llegariamos a realizar uno de verdad y conocer la verdadera funcionalidad de uno, sabiendo explotar de manera correcta la ventaja que nos da la realización de uno.

Información Adicional





0 comentarios

Publicar un comentario en la entrada