Archivo del sitio

Grafos con networkx Python II

Originalmente publicado en La Shell del Bit Pegajoso:
En la pasada entrada toque un poco el tema de grafos en python con NetworkX aunque a mi parecer NetworkX es solo una librería con la que podemos crear grafos como cualquier…

Publicado en python

NetworkX y Python [Grafos en Python]

Originalmente publicado en La Shell del Bit Pegajoso:
La teoría de grafos también llamado el grafo de las gráficas es un campo de las matemáticas y de las ciencias de la computación, que estudia las propiedades de las gráficas estructuras…

Publicado en python

crawl clases para la ayuda

Bueno para celebrar mi cumpleaños y celebrarlo en grande les libero este código que esta muy padre es un modulo para crawling mediante proxys https y conexiones https cuando se tienen problemas para crawlear sitios esta lógica te puede ayudar

Tagged with:
Publicado en python

Limpiando el codigo html en mongo desde python

#!/usr/bin/python2.6 import pymongo import re def parseador(firma): mongo = pymongo.Connection(‘localhost’) mongo_db = mongo[‘crawler’] mongo_collection = mongo_db[‘job’] cadena = mongo_collection.find_one({‘firma’:str(firma)}) #print cadena[‘descripcion’] \s\s+ y =cadena[‘descripcion’] y =re.sub(‘[\t\r\n\f\v]’,”,y) y =re.sub(‘\s\s+’,”,y) y =re.sub(‘<script[^>]*?>.*?</script>’,”,y) y =re.sub(‘<[^>]*?>’,”,y) #y =re.sub(‘function.*’,”,y) mongo_document = mongo_collection.update({‘firma’:firma} , {‘$set’ :

Publicado en python

mongodb y python

Python and MongoDB: A Quick Reference to PyMongo A constant frustration of mine is working with a library which is poorly documented and doesn’t contain useful examples. As such, I have put together the following quick reference working with the

Tagged with: , , , ,
Publicado en python