Ya se ha mencionado el código abierto u open source como un elemento capital en el desarrollo del software libre, y ha quedado claro que se trata de aquel con el que se elabora, se modifica y se distribuye tecnología libremente, centrándose su teoría en las ventajas prácticas de esta dinámica en vez de en […]
Ya se ha mencionado el código abierto u open source como un elemento capital en el desarrollo del software libre, y ha quedado claro que se trata de aquel con el que se elabora, se modifica y se distribuye tecnología libremente, centrándose su teoría en las ventajas prácticas de esta dinámica en vez de en la ética de la libertad. No obstante, es el concepto de «big data» o de «datos masivos» el que complementa al código abierto, no sólo para la expansión acelerada del desarrollo tecnológico, sino también para la libertad de acceso a la información que, entre otras cosas, propicia dicho desarrollo.
Ambos elementos forman parte de la innovación abierta, una noción acuñada por el profesor estadounidense Henry Chesbrough, teórico organizacional, en su libro Open Innovation: The New Imperative for Creating and Profiting from Technology, que fue publiado en 2003 y cuyas ideas acerca de cómo la tecnología debe ser gestionada y económica y cada limitación solo consigue poner un palo en esa rueda»
explotada han sido muy influyentes, aumentando el impacto público del software libre y el código abierto. Chesbrough aclara que no hay que confundir innovación con invención: la segunda es la creación de algo nuevo sin necesidad de que ello conlleve un beneficio económico; en cambio, la innovación es la aplicación de las invenciones, de los inventos, precisamente para generar ese beneficio, es decir, contempla su introducción en el mercado. Y en el caso de la innovación abierta, es aquella que las empresas buscan nuevas tecnologías sobrepasando el ámbito de su propia organización y colaboran con socios externos, lo que conlleva la conjunción del conocimiento interno y externo que sirve para consumar proyectos estratégicos de investigación y desarrollo o I+D y mejorar su eficacia. Esta dinámica que espolea el flujo de conocimiento, por otra parte, permite un mejor reparto de riesgos y beneficios con socios externos, y en las propias empresas, una mayor participación de todos los empleados; y si tenemos en cuenta la sensatez del influyente publicista Lluís Bassat al decir que «la creatividad empresarial es la que hace girar la rueda de la economía y cada limitación a la creatividad lo único que consigue es poner un palo en esa rueda», la innovación abierta es un claro empuje a la creatividad empresarial y, así, del propio desarrollo.
Sin embargo, en honor a la verdad, es importante advertir que el uso del conocimiento externo de «los porteros tecnológicos» ya fue teorizado por Thomas Allen, profesor del MIT, en los años sesenta del siglo pasado, igual que Eric von Hippel, también docente en el MIT, identificó en los ochenta a los usuarios avanzados como un recurso clave para las innovaciones rompedoras.
La innovación con código abierto
El mundo tecnológico actual ha evolucionado de tal manera y tan rápido que su complejidad hace prácticamente imposible que una sola organización, de forma individual, sea capaz de monopolizar el talento, la innovación y los resultados. Hay que olvidarse de los modelos de desarrollo en que una compañía llevar a cabo todos los aspectos de sus productos tecnológicos; ya no son óptimos ni mucho menos viables; están obsoletos. El presente y el futuro de la tecnología se encuentran en la colaboración, precisamente aquello en lo que se basa el software libre, que es el mejor ejemplo de innovación abierta que se puede conseguir, si bien la práctica de la obtención y concesión de licencias para patentes de software, que de libre no tiene nada, también cuadra con la tesis de innovación abierta de Chesbrough, pues sus muestras de intercambio tecnológico también se asientan en gran medida en métodos patentables y las licencias relacionadas que se pagan a organizaciones externas.
En cualquier caso, los hackatones, o sea, encuentros multitudinarios de programadores que se organizan para el desarrollo de software libre como AngelHack, que es el más importante a nivel mundial, sirven de ejemplo de la tendencia colaborativa en la producción tecnológica. Por otro lado, el open source está jugando un papel fundamental en la nube y en el entorno de los dispositivos móviles, convirtiéndose en fuente de soluciones innovadoras para las necesidades de los usuarios. Son los miles de desarrolladores que participan en montones de proyectos distintos de código abierto los que están acelerando la innovación tecnológica, y no sólo numerosas compañías que durante mucho tiempo habían protegido sus códigos con tanto empeño de las miradas ajenas están ahora pasándose al abierto, sino que además están interviniendo en el proceso de desarrollo de una manera muy activa. Los responsables de dichas compañías, comoNoSQL Couchbase, Cloudera Inc. o la gran Red Hat, coinciden en que lo que se acumula con el procedimiento colaborativo acelera la consecución de las características primordiales de los ecosistemas que necesitan para innovar y, así, el código abierto generalmente entrega mejores productos que las alternativas propietarias, y con mayor rapidez; y en que ninguna infraestructura destacada de software como plataforma ha surgido en la última década con la dinámica del código privativo, la cual es una enorme desventaja competitiva que mata la innovación empresarial.
Compañías como Google, que se basa casi por completo en el código abierto,Facebook, que creó la base de datos NoSL Cassandra, o Netflix se percataron de que los proveedores de software ya no podían satisfacer sus necesidades, así que empezaron a elaborar el suyo propio, y los clientes de los proveedores se proveyeron a sí mismos. Siguiendo la idea de que con la apertura de sus invenciones al resto del mundo tienen mucho más que ganar, los usuarios de la tecnología de código abierto son los que están impulsando su desarrollo: la necesidad de que el software sea muy especializado según los propósitos de cada empresa las empuja hacia el código abierto, porque así cuentan con una cantidad más abundante de expertos capaces de solucionar sus problemas.
El nuevo mundo del Big Data
El concepto de «big data» describe de manera algo imprecisa un conjunto valioso y peliagudo de prácticas, técnicas, cuestiones éticas y resultados referentes al acopio de información masiva, los sistemas informáticos que acumulan datos a gran escala y las fórmulas que se utilizan para hallar patrones recurrentes en la inmensidad de esos datos. Estos sistemas, por supuesto, forman parte de las tecnologías de la información y la comunicación,las TIC, que tanta resonancia tienen en la actualidad porque el procesamiento de datos sobre campos grandes y complejos era impensable hasta hace poco tiempo. Se suele mentar en esta cuestión un informe del analista Doug Laney para Gartner de 2001, en el que se habla de características del big data como el volumen (la gran cantidad de datos disponibles para ser analizados), lavelocidad (con la que se produce la recolección de datos) y la variedad (por los distintos formatos de las fuentes de los mismos datos).
La necesidad de las plataformas abiertas de big data se sustenta en el mantenimiento de la innovación que tenga como base la recogida ininterrumpida de información fiable, para lo que se requiere, no sólo la tecnología de procesamiento precisa, sino también un acceso rápido y sencillo a los instrumentos para explorar de forma intuitiva nuevas propuestas de análisis sin barrera alguna: recordemos lo malas que son las limitaciones para la creatividad empresarial. Así que dichas plataformas han de ser transparentes, integradoras, colaborativas, flexibles y veloces, y las más usadas a día de hoy cumplen en general con tales requisitos: Data Analytics, Hadoop & NoSQL, Data Science, Data & the Cloud, Machine Learning, Data Architecture…
No cabe duda de que una de las grandes fuentes de información para el análisis de big data son las redes sociales, pero únicamente acerca del comportamiento y los intereses de los usuarios, algo que anhelan conocer todas las empresas que pretenden venderles sus productos. Para ello existe el social media mining (SMM), es decir, «el proceso de extraer, almacenar, representar, visualizar y analizar datos masivos generados por los usuarios con el objetivo de descubrir patrones significativos a partir de las interacciones sociales en internet», según lo define un reciente estudio de la Universidad Autónoma de Barcelona de 2015. Este proceso cuenta con una herramienta fundamental, las API, interfaces de programación de aplicaciones, que establecen conexión con estas, mediante un mecanismo de autenticación y autorización de permisos en el que se implementa el protocolo oAuth (open Authentication), con el cual un usuario le concede a un tercero, proveedor de un servicio o de la misma aplicación, que acceda a sus datos, presumiblemente para utilizarlos según sus intereses comerciales.
Las API de redes sociales más populares son las de Twitter, YouTube, Facebook e Instagram. La más flexible de ellas es la de Twitter, tanto para obtener información gracias a lo pública que resulta como porque permite realizar gran cantidad de acciones propias de la red social, y se sirve de los operadores lógicos OR, AND y NOT en sus búsquedas, que además se incluyen en cuentas concretas. Facebook, pese a que atesora mucha más información de sus usuarios que no es pública, le resulta muy útil para su propia API de anuncios publicitarios, y no lleva a cabo una búsqueda con operadores lógicos ni en cuentas específicas. Youtube es bastante restrictiva en el número de vídeos que proporcionan sus búsquedas, cuyos operadores lógicos, AND y OR, no se encuentran optimizados, y se debe renovar el token de acceso de vez en cuando. E Instagram es la más restringida de todas, pues no permite publicar nuevas imágenes ni comentar, sólo ver la información, sin búsqueda con operadores lógicos y únicamente mediante etiquetas válidas para conseguir resultados eficaces. Así que parece que todavía hay mucho que mejorar en este ámbito.
Fuente: http://hipertextual.com/2015/09/big-data-y-open-source