logotipo

img_google
Mediterrania
Informática, inteligencia artificial, web, diseño, programación...
Tira ECOL
Sindicación
Directorios de Bitácoras
Contador de visitas

Site Counter
 
Compartiendo mi spam (II)
Tras el anterior post sobre el spam he seguido investigando un poco sobre el SpamAssassin y cómo compartir las bases de datos bayesianas de otras personas para mejorar más aún el filtrado.

Mirando entrre la lista de opciones de sa-learn hay dos que nos sirven para esto: una es la exportar la base de datos, y otra es la de indicar un PATH del que leer la base de datos importada.

Para exportar la base de datos basta con teclear:
sa-learn --dump all > fichero

El tamaño de fichero puede ser bastante grande por lo que recomiendo comprimirlo, pues al ser texto se reducirá mucho (a mí me ha pasado de 15M a 2,3M):
comprimir: bzip2 -z -9 fichero
descomprimir: bunzip2 fichero.bz2

Con esto tendremos en el archivo fichero.bz2 nuestra base de datos.

Si lo que queremos es importar una base de datos bastará con teclear:
sa-learn --dbpath path_al_fichero

Por último indicaros que aquí dejo colgada mi base de datos bayesiana comprimida con el bzip2. Si os la vais a decargar tened en cuenta que son 2,3M y que eso es mi portátil y no lo tengo siempre enchufado. Si tenéis mucho interés os la puedo enviar por e-mail.
No