Javier Muñoz

Voy a salir a caminar solito…

salvador-dali-the-persistence-of-memory-15500

Si hay algo en estos días que me rodea e incluso me afecta, es la tan manida astenia primaveral. Bien es cierto que odio el encasillamiento en general, sobre todo proviniente de los medios de comunicación -a pesar de que virtualmente no los sigo- y esa manía por darle nombre a todo: astenia primaveral, síndrome post-vacacional, etc. El caso es que la gente sea capaz de creerse que tiene algo. Como digo, desde hace un par de semanas, mire donde mire, veo gente abatida, cansada, con pocas ganas de moverse, trabajar,…

Yo mismo no escapo de ello. Me cuesta horrores levantarme, pierdo las ganas de ponerme a comer -que no el hambre-, y las tardes se hacen interminables en la oficina. En donde lo noto especialmente es en mi sistema gtd. Realmente no tengo una cantidad de tareas que no pueda gestionar más o menos bien de memoria, pero abrir el moleskine se me hace pesadísimo.

Es un estado desagradable del que se hace complicado escapar, salvo dejando que pasen los días. A fin de cuentas, todos los años es lo mismo.

¿Os encontráis igual de desganad@s?

Desde hace un tiempo vengo pensando en lo que ha supuesto la llegada de la Web 2.0, como se pensó originalmente, desde el punto de vista de la globalidad y la participación activa del usuario.

Se ha conseguido que una gran masa de usuarios dirijan su atención hacia algunos puntos de interés (que llamaremos web’s :) ), o más bien hacia algunos tipos de puntos de interés. Específicamente, podríamos hablar de blogs y redes sociales, aunque bien es verdad que la línea divisoria cada vez es más fina y tienden hacia una unificación, por lo que creo que, genéricamente, podríamos hablar de web social.

En otros ámbitos de la sociedad (arte, economía, etc.), el porcentaje de personal productor es mucho menor que el consumidor (Principio de Pareto o regla del 80-20), y en este caso no es menos. Una parte comparativamente mínima genera la mayor parte de la información. Es decir, un subgrupo de usuarios escriben, mientras que el resto leen.

Pensad por un momento en vuestros contactos de cualquier red social (Facebook, por ejemplo). Una parte de ellos se pasan la mayor parte del tiempo subiendo fotos, escribiendo comentarios, ejecutando aplicaciones…. Otra parte más numerosa que la anterior tiene un comportamiento más pasivo.

Simplificando mucho, una parte en minoría, decide lo que hace la mayoría (ja, bienvenida, democracia…). Es decir, la mayor parte del contenido en internet no es original. Algo, que por otra parte, supongo que no sorprenderá a nadie a estas alturas.

Sería magnífico poder visualizar los flujos de información en la red. Seguramente veríamos  que una gran masa de usuarios (¿quizá el 80%?) dirigiendo sus ratones hacia algunos puntos-origen muy concretos.

pareto

Pensad ahora en una conversación cualquiera con alguno de tus amigos (seguramente será ese 20% de tus amigos a los que dedicas el 80% del tiempo). Probablemente, en algún punto de la conversación, ocurrirá que uno de los dos dirá algo que el otro haya pensado/comentado/leído ese mismo día, en días anteriores o en los días siguientes. Y seguramente diréis, ¡vaya casualidad!

Pero, ¿estáis seguros que fue casualidad?

Según los últimos estudios, el 95% del email a nivel mundial es SPAM. Es una cantidad brutal, que lejos de reducirse, va en aumento año tras año. Personalmente, como informático profesional, creo que entre todos debemos contribuir a que esta cantidad se reduzca, porque los inconvenientes del SPAM son claros: aumento exponencial del tiempo necesario para supervisar el correo, gasto desorbitado de ancho de banda, consumo energético, deterioro de material, etc, etc.

Normalmente tendemos a pensar que SPAM es el típico correito en el que se nos invita a comprar tal o cual medicamento, o se nos indica que el tamaño de cierto miembro puede aumentarse casi hasta el infinito, pero estamos muy alejados de la realidad. También son claramente SPAM los correos que se reciben pidiendo que sigas una cadena (reenviar), para tener una vida sexual próspera, para demostrar amistad o amor eternos, reenvío de documentos powerpoint/pdf/imágenes de tamaño XXL ( un correo de más 1 MB no debería ser enviado NUNCA salvo que fuera estrictamente necesario), petición de donación de sangre o transplantes de órganos para tal o cual niño, envío a una marca comercial específica con el fin de entrar en el sorteo de algún producto último modelo, …

Gracias a diferentes técnicas de control social y engaños varios, el incauto usuario reenvía toda una patraña de emails sin valor a sus contactos ¿Qué se obtiene de todo ello? En muchos casos, la diversión por parte de los creadores de los correos está asegurada. Lamentablemente, en otros existen redes dedicadas a la obtención de datos personales que les puedan servir como bases de datos (para venderlos a empresas terceras y utilizar dicha información para publicitar algún producto), realizar ataques phishing, etc. ¿Cómo es posible que esto pase? Con un gesto tan sencillo como darle a ‘reenviar’ a un correo, poniendo la dirección de correo de 7 de nuestros contactos en el campo ‘Para:’, y mandando estos correos estamos provocando un torrente de información que en muy poco tiempo llegará a las manos inadecuadas, además de estar vulnerando la Ley de Protección de Datos (en España) si no borramos las cabeceras, y, según la cual, no puedes utilizar el dato personal de un tercero (dirreción de correo de tus amigos, que todos las venentre ellos) sin su consentimiento explícito, pudiendo estar penado con hasta 600 euros de multa.

no_spam_matas_gatos

Veamos con un poco más de detalle este asunto:

Siguiendo con el ejemplo, supongamos que hemos enviado un email a 7  de nuestros contactos. Una vez que ese correo esté mandado y recibido, 7 direcciones de correo están visibles en los emails (en realidad serían 8, pero por simplificar los cálculos). Si  tus 7 amigos lo envían a su vez a otros 7 amigos, la cantidad aumenta de forma espectacular. En un sólo paso, tendremos 7 direcciones + 7*7 = 49+7 = 56. Es decir, en cuestión de horas, 56 direcciones de correo estarán perdidas por ahí. Si esperamos un día, y suponemos que este proceso se repite 5 veces, al pasar 24 horas, la cantidad de email’s enviados asciende a 7+49+343+2401+16807 = 19607. Si pasan 48 horas, esta cantidad aumenta hasta los 329554456 email’s. Es decir, en sólo dos días, y siendo cautos con el número de contactos y de reenvíos 300 millones de personas habrán recibido el email. 300 millones de direcciones de correo electrónico estarán perdidas por ahí también, esperando que en uno de los procesos de reenvío algún incauto incluya la dirección del remitente original, y con ello la gran base de datos de los contactos acumulados.

En realidad, este cálculo se complica bastante, porque normalmente, cuando se envía un correo, el correo vuelvo a tí en unos pocos pasos, porque un tercer o cuarto amigo se encarga de volver a enviártelo, además de que no todos los amigos reenviarán el correo, no todos incluirán las cabeceras, etc., pero es una aproximación estimada de la velocidad con la que estos mensajes se propagan.

La lista de los diferentes tipos de correos SPAM es interminable (y además están claramente identificados: http://es.wikipedia.org/wiki/Correo_no_deseado ), aunque, en lo que a mí respecta, hay uno que me hace tal gracia que no puedo parar de reir: “Somos Andy y John y debido al uso desmedido, sólo quedan 578 direcciones libres de msn…”. El correo continúa y hay dos versiones, o bien msn se cierra si no se reenvía a Z contactos, o, si no se envía a Z contactos, el servicio pasará a ser de pago.

A poco que echemos un poco de cuentas descubrimos el motivo de mis risas:

Si tomamos los caracteres válidos a la hora de escoger un nombre de usuario, simplificando podemos sumar letras de la a-z (26), números 0-9 (10) y símbolos de puntuacion (+ – _ . ). En total, 40 caracteres válidos. Si tomamos una longitud de nick de 6, bastante corta para lo que suele ser, el resultado es que tenemos 40 símbolos diferentes que pueden ser tomados de 6 en 6, con repetición, es decir variaciones con repetición.

Por tanto, aplicando las formulillas apropiadas, 40^6 = 4096000000 nombres de usuario diferentes.

Es decir, existen unas 4000 millones de direcciones de msn válidas. Según datos de 2008, existen 270 millones de usuarios de Hotmail a nivel mundial (http://en.wikipedia.org/wiki/Hotmail), por lo que haciendo una simple resta, podemos averiguar que debería haber unas 3700 millones de direcciones libres.

calculadora

Evidentemente, estos datos no son determinantes (ni verdaderos), porque estoy asumiendo que todos los nick tienen exactamente 6 caracteres de longitud, lo que no es cierto. Si hubiera direcciones válidas desde los 1 hasta los 6 caracteres, la cantidad total de nombres válidos sería 40^1 + 40^2 + 40^3 + 40^4 + 40^5 + 40^6 = 4201025640.

Vayamos un poco más allá. Supongamos que Microsoft sigue las especificaciones de la RFC5322 (normativa que regula el correo electrónico a nivel mundial) y que el número máximo de caracteres permitidos es de 64 caracteres. Si despreciamos con respecto al total el hecho de que las direcciones puedan tener longitud menor que 64 (como de hecho tienen), la cantidad total de posibles nombres de usuario es de:

3,402823669 * 10^102 => 10^102

Si pudieras escribir un billón de nombres de usuario (10^12) en un papel, y tardaras exactamente una milésima de segundo (10^-3 segundos) por cada billón (algo absolutamente-absolutamente-absolutamente imposible), tardarías más de un quintillón de años en escribirlos todos. Es decir, un 1 y 48 ceros detrás de años (recuerdo que he estado simplificando desde el principio):

1000000000000000000000000000000000000000000000000 años

Teniendo en cuenta de la antigüedad del universo se estima en unos 14000 millones de años:

14000000000 años

¿Te atreves a vivir tanto?

Obviamente, ni hay gente suficiente en el planeta (ni nunca la habrá), ni existe sistema informático que resista esa cantidad de información, por lo que la limitación llegará muchísimo antes por otros motivos que porque se agoten los nombres de usuario.

Creo que estos datos son suficientemente concluyentes como para hacernos una idea de cuánto de verdad y de mentira hay en una inmensa mayoría de los mensajes que se reciben. La próxima vez que recibas un email en una cadena y tengas la tentación de reenviarlo, detente a pensar si estás dispuesto a que el creador original se descojene de tí y de varios millones más de personas, a que tus datos pasen a formar parte de una base de datos que se venderá al mejor postor (si no se ha vendido ya), a que la mitad de tus contactos te odien por ello y a que puedas ser sancionado económicamente.

Después de todo, si haces lo correcto, el planeta te lo agradecerá :)