Recomiendo:
0

Qué es la computación distribuida?

Todas las manos todas

Fuentes: Revista Debate

Desde descubrir palabras en un formulario hasta instalar un protector de pantallas, todo sirve a la hora de contribuir al bien común, y formar parte de la mayor supercomputadora jamás inventada.

El hombre se paró frente a la gente y dijo: «900 millones de personas nos ayudan a digitalizar libros antiguos sin saberlo». Las caras mutaron de sorpresa a incredulidad, y enseguida a curiosidad ante ese extraño personaje que hablaba con la seguridad de quien sabe cómo seducir a una audiencia. La revelación se dio en el marco del TEDx Río de la Plata, y quien habló fue el científico guatemalteco Luis von Ahn. Con su ejemplo, que detallaremos a partir del próximo párrafo, von Ahn no habla de otra cosa que del proceso conocido como «computación distribuida».

Para explicarlo sencillamente, pero sin alejarnos demasiado de la definición de manual, la computación distribuida consiste en un grupo indefinido de equipos conectados entre sí que funcionan en conjunto por un mismo objetivo. Es un modo de aprovechar mejor la capacidad de procesamiento de cada estación, como parte de un sistema más complejo. Los equipos pueden estar conectados dentro de una red local, o a través de Internet. Para ser todavía más claros volvamos al ejemplo de von Ahn: «¿Quién alguna vez no llenó un formulario en Internet que pedía introducir unas palabras distorsionadas?¿Cuántos odian hacer eso? Bueno, eso lo inventé yo».

 A lo que se refiere el experto, y que cada vez es más común en el mundo de Internet, es a los captcha. Este código que puede aparecer en sitios tan disímiles como un foro local, una web de descarga o nuestra cuenta de Gmail, nació para poder detectar que quien está completando la información no es una máquina sino un ser humano. Generalmente se trata de dos palabras, una de ellas es conocida por el sitio y la otra no. Luego, mediante un sistema de estadísticas, el sistema analiza cuál es la palabra desconocida en base a la cantidad de usuarios que la escribieron. ¿Y qué tiene que ver esto con la computación distribuida? Sigamos escuchando al creador de los captcha, que luego vendió su idea a Google. «Cerca de 200 millones de captcha son completados en un día. Pero me empecé a sentir mal porque no sólo son odiosos, sino que cada vez que alguien escribe un captcha, pierde alrededor de 10 segundos de su vida. En suma, se pierden alrededor de 500 mil horas diarias. Todo ese tiempo podría usarse para hacerle un bien a la humanidad. Por eso, hoy en día, si alguien ingresa un captcha, no sólo está demostrando que es humano, sino que además nos está ayudando a digitalizar libros», aseguró Luis von Ahn ante el aplauso de una concurrencia que pedía más. Y el bonus llegó, con una detallada explicación del proceso.

De acuerdo a lo expuesto, el deterioro de los libros antiguos convierte en engorroso (cuando no imposible) escanear sus páginas y digitalizarlos. Entonces, todas aquellas palabras (hasta el 30 por ciento de un texto en algunos de los casos) que los modernos equipos no son capaces de reconocer se convierten en captchas para ser sometidos a la opinión popular. De ahí que muchas veces se encuentren palabras en desuso en la actualidad, como así también en diferentes idiomas. «Estamos digitalizando alrededor de 100 millones de palabras diarias, lo que equivale a dos millones de libros al año». Todo gracias a un mínimo esfuerzo y totalmente gratis. Pero esto no termina acá: el especialista asegura que quiere ir por más: «Quiero que la gente pueda aprender un nuevo idioma totalmente gratis y que al mismo tiempo traduzca Internet. Es decir, aprenden traduciendo. Cada oración la traducen varios estudiantes y los resultados son tan buenos como los de un equipo profesional». La base de este nuevo proyecto ya tiene nombre y lugar, se llama Duolingo (www.duolingo.com), ya acepta inscripciones y calcula su apertura para los últimos días de este mes.

LA VERDAD ESTÁ AFUERA Hablamos de Internet colaborativa, un proyecto que ha marcado tendencia en todo el mundo, el proyecto SETI. SETI (siglas que en ingles referencian a «Búsqueda de inteligencia extraterrestre») es una organización sin fines de lucro creada en 1984. Desde entonces, impulsa muchos proyectos científicos y educativos a través del «estudio de la naturaleza, distribución y prevalencia de la vida en el Universo». Por la enorme capacidad de procesamiento que necesitan cada uno de estos proyectos es que SETI se ha convertido en un ejemplo de computación distribuida. Aunque hoy la institución cuenta con una gran cantidad de planificaciones, una de las más conocidas es el SETI@home, cuyo propósito es analizar señales de radio buscando pruebas de inteligencia extraterrestre. SETI@home se dio a conocer el 17 de mayo de 1999, pidiendo la colaboración de los usuarios de Internet en todo el mundo. Pero no económica, ni siquiera en tiempo. Lo único que debía (y debe, porque el proyecto continúa activo) hacer aquel que quiere colaborar es descargar un protector de pantalla en su computadora que, durante los momentos en que la máquina está ociosa, utiliza el procesador para analizar los datos que capta una gran antena parabólica de la organización situada en Puerto Rico.

De este modo, con la ayuda de internautas en todo el mundo, se obtiene un nivel de trabajo superior a la mejor y más costosa supercomputadora. Salvando las distancias, el algoritmo Visual Rank que usa Google en su buscador de imágenes también tiene mucho de computación colaborativa, ya que se basa en el accionar de los usuarios ante una determinada búsqueda. Es decir, si ponemos en la barra de búsqueda la palabra «monitor», la imagen que elegimos de la lista de resultados queda asociada a la palabra buscada. De esta manera se pueden reducir y mejorar notablemente los resultados con el paso del tiempo. Podríamos decir que el usuario le está «enseñando» a la máquina. Un concepto que, al igual que la simbiosis entre equipos que detallamos más arriba, era hasta hace poco un argumento excelente para una novela de ciencia ficción. Como siempre, la realidad la ha superado.

http://www.revistadebate.com.ar//2011/11/11/4672.php