Compartiendo mi spam (II)
Tras el anterior post sobre el spam he seguido investigando un poco sobre el SpamAssassin y cómo compartir las bases de datos bayesianas de otras personas para mejorar más aún el filtrado.
Mirando entrre la lista de opciones de sa-learn hay dos que nos sirven para esto: una es la exportar la base de datos, y otra es la de indicar un PATH del que leer la base de datos importada.
Para exportar la base de datos basta con teclear:
El tamaño de fichero puede ser bastante grande por lo que recomiendo comprimirlo, pues al ser texto se reducirá mucho (a mí me ha pasado de 15M a 2,3M):
Con esto tendremos en el archivo fichero.bz2 nuestra base de datos.
Si lo que queremos es importar una base de datos bastará con teclear:
Por último indicaros que aquí dejo colgada mi base de datos bayesiana comprimida con el bzip2. Si os la vais a decargar tened en cuenta que son 2,3M y que eso es mi portátil y no lo tengo siempre enchufado. Si tenéis mucho interés os la puedo enviar por e-mail.
Mirando entrre la lista de opciones de sa-learn hay dos que nos sirven para esto: una es la exportar la base de datos, y otra es la de indicar un PATH del que leer la base de datos importada.
Para exportar la base de datos basta con teclear:
sa-learn --dump all > fichero
El tamaño de fichero puede ser bastante grande por lo que recomiendo comprimirlo, pues al ser texto se reducirá mucho (a mí me ha pasado de 15M a 2,3M):
comprimir: bzip2 -z -9 fichero
descomprimir: bunzip2 fichero.bz2
descomprimir: bunzip2 fichero.bz2
Con esto tendremos en el archivo fichero.bz2 nuestra base de datos.
Si lo que queremos es importar una base de datos bastará con teclear:
sa-learn --dbpath path_al_fichero
Por último indicaros que aquí dejo colgada mi base de datos bayesiana comprimida con el bzip2. Si os la vais a decargar tened en cuenta que son 2,3M y que eso es mi portátil y no lo tengo siempre enchufado. Si tenéis mucho interés os la puedo enviar por e-mail.





