Desmontando mitos

by javi

Según los últimos estudios, el 95% del email a nivel mundial es SPAM. Es una cantidad brutal, que lejos de reducirse, va en aumento año tras año. Personalmente, como informático profesional, creo que entre todos debemos contribuir a que esta cantidad se reduzca, porque los inconvenientes del SPAM son claros: aumento exponencial del tiempo necesario para supervisar el correo, gasto desorbitado de ancho de banda, consumo energético, deterioro de material, etc, etc.

Normalmente tendemos a pensar que SPAM es el típico correito en el que se nos invita a comprar tal o cual medicamento, o se nos indica que el tamaño de cierto miembro puede aumentarse casi hasta el infinito, pero estamos muy alejados de la realidad. También son claramente SPAM los correos que se reciben pidiendo que sigas una cadena (reenviar), para tener una vida sexual próspera, para demostrar amistad o amor eternos, reenvío de documentos powerpoint/pdf/imágenes de tamaño XXL ( un correo de más 1 MB no debería ser enviado NUNCA salvo que fuera estrictamente necesario), petición de donación de sangre o transplantes de órganos para tal o cual niño, envío a una marca comercial específica con el fin de entrar en el sorteo de algún producto último modelo, …

Gracias a diferentes técnicas de control social y engaños varios, el incauto usuario reenvía toda una patraña de emails sin valor a sus contactos ¿Qué se obtiene de todo ello? En muchos casos, la diversión por parte de los creadores de los correos está asegurada. Lamentablemente, en otros existen redes dedicadas a la obtención de datos personales que les puedan servir como bases de datos (para venderlos a empresas terceras y utilizar dicha información para publicitar algún producto), realizar ataques phishing, etc. ¿Cómo es posible que esto pase? Con un gesto tan sencillo como darle a ‘reenviar’ a un correo, poniendo la dirección de correo de 7 de nuestros contactos en el campo ‘Para:’, y mandando estos correos estamos provocando un torrente de información que en muy poco tiempo llegará a las manos inadecuadas, además de estar vulnerando la Ley de Protección de Datos (en España) si no borramos las cabeceras, y, según la cual, no puedes utilizar el dato personal de un tercero (dirreción de correo de tus amigos, que todos las venentre ellos) sin su consentimiento explícito, pudiendo estar penado con hasta 600 euros de multa.

no_spam_matas_gatos

Veamos con un poco más de detalle este asunto:

Siguiendo con el ejemplo, supongamos que hemos enviado un email a 7  de nuestros contactos. Una vez que ese correo esté mandado y recibido, 7 direcciones de correo están visibles en los emails (en realidad serían 8, pero por simplificar los cálculos). Si  tus 7 amigos lo envían a su vez a otros 7 amigos, la cantidad aumenta de forma espectacular. En un sólo paso, tendremos 7 direcciones + 7*7 = 49+7 = 56. Es decir, en cuestión de horas, 56 direcciones de correo estarán perdidas por ahí. Si esperamos un día, y suponemos que este proceso se repite 5 veces, al pasar 24 horas, la cantidad de email’s enviados asciende a 7+49+343+2401+16807 = 19607. Si pasan 48 horas, esta cantidad aumenta hasta los 329554456 email’s. Es decir, en sólo dos días, y siendo cautos con el número de contactos y de reenvíos 300 millones de personas habrán recibido el email. 300 millones de direcciones de correo electrónico estarán perdidas por ahí también, esperando que en uno de los procesos de reenvío algún incauto incluya la dirección del remitente original, y con ello la gran base de datos de los contactos acumulados.

En realidad, este cálculo se complica bastante, porque normalmente, cuando se envía un correo, el correo vuelvo a tí en unos pocos pasos, porque un tercer o cuarto amigo se encarga de volver a enviártelo, además de que no todos los amigos reenviarán el correo, no todos incluirán las cabeceras, etc., pero es una aproximación estimada de la velocidad con la que estos mensajes se propagan.

La lista de los diferentes tipos de correos SPAM es interminable (y además están claramente identificados: http://es.wikipedia.org/wiki/Correo_no_deseado ), aunque, en lo que a mí respecta, hay uno que me hace tal gracia que no puedo parar de reir: “Somos Andy y John y debido al uso desmedido, sólo quedan 578 direcciones libres de msn…”. El correo continúa y hay dos versiones, o bien msn se cierra si no se reenvía a Z contactos, o, si no se envía a Z contactos, el servicio pasará a ser de pago.

A poco que echemos un poco de cuentas descubrimos el motivo de mis risas:

Si tomamos los caracteres válidos a la hora de escoger un nombre de usuario, simplificando podemos sumar letras de la a-z (26), números 0-9 (10) y símbolos de puntuacion (+ – _ . ). En total, 40 caracteres válidos. Si tomamos una longitud de nick de 6, bastante corta para lo que suele ser, el resultado es que tenemos 40 símbolos diferentes que pueden ser tomados de 6 en 6, con repetición, es decir variaciones con repetición.

Por tanto, aplicando las formulillas apropiadas, 40^6 = 4096000000 nombres de usuario diferentes.

Es decir, existen unas 4000 millones de direcciones de msn válidas. Según datos de 2008, existen 270 millones de usuarios de Hotmail a nivel mundial (http://en.wikipedia.org/wiki/Hotmail), por lo que haciendo una simple resta, podemos averiguar que debería haber unas 3700 millones de direcciones libres.

calculadora

Evidentemente, estos datos no son determinantes (ni verdaderos), porque estoy asumiendo que todos los nick tienen exactamente 6 caracteres de longitud, lo que no es cierto. Si hubiera direcciones válidas desde los 1 hasta los 6 caracteres, la cantidad total de nombres válidos sería 40^1 + 40^2 + 40^3 + 40^4 + 40^5 + 40^6 = 4201025640.

Vayamos un poco más allá. Supongamos que Microsoft sigue las especificaciones de la RFC5322 (normativa que regula el correo electrónico a nivel mundial) y que el número máximo de caracteres permitidos es de 64 caracteres. Si despreciamos con respecto al total el hecho de que las direcciones puedan tener longitud menor que 64 (como de hecho tienen), la cantidad total de posibles nombres de usuario es de:

3,402823669 * 10^102 => 10^102

Si pudieras escribir un billón de nombres de usuario (10^12) en un papel, y tardaras exactamente una milésima de segundo (10^-3 segundos) por cada billón (algo absolutamente-absolutamente-absolutamente imposible), tardarías más de un quintillón de años en escribirlos todos. Es decir, un 1 y 48 ceros detrás de años (recuerdo que he estado simplificando desde el principio):

1000000000000000000000000000000000000000000000000 años

Teniendo en cuenta de la antigüedad del universo se estima en unos 14000 millones de años:

14000000000 años

¿Te atreves a vivir tanto?

Obviamente, ni hay gente suficiente en el planeta (ni nunca la habrá), ni existe sistema informático que resista esa cantidad de información, por lo que la limitación llegará muchísimo antes por otros motivos que porque se agoten los nombres de usuario.

Creo que estos datos son suficientemente concluyentes como para hacernos una idea de cuánto de verdad y de mentira hay en una inmensa mayoría de los mensajes que se reciben. La próxima vez que recibas un email en una cadena y tengas la tentación de reenviarlo, detente a pensar si estás dispuesto a que el creador original se descojene de tí y de varios millones más de personas, a que tus datos pasen a formar parte de una base de datos que se venderá al mejor postor (si no se ha vendido ya), a que la mitad de tus contactos te odien por ello y a que puedas ser sancionado económicamente.

Después de todo, si haces lo correcto, el planeta te lo agradecerá :)

Related Posts Plugin for WordPress, Blogger...

Previous post:

Next post: