TOO BIG TO IGNORE
FICHA
Foto Título:            TOO BIG TO IGNORE: THE BUSINESS CASE FOR BIG DATA
Autor:            Phil Simon
Editorial:       Wiley (eBook)
Idioma:         Inglés
Páginas:        256
Publicación:  2013
Lectura:         2014
COMENTARIO EDITORIAL
(Fuente: Traducción y adaptación propia de reseña en Amazon)

Los residentes en Boston, Massachusetts reportan automáticamente baches y accidentes a través de sus smartphones. Progressive Insurance monitoriza en tiempo real los patrones de conducción y usa esa información para ofrecer unas tarifas realmente adaptadas a la seguridad de cada individuo. Google predice con acierto los brotes de gripe locales basándose en miles de consultas de usuarios. Amazon proporciona recomendaciones perspicaces, relevantes y oportunas a sus cientos de millones de clientes. Quancast permite a las empresas elegir como objetivos audiencias precisas y demografías clave a través de la web. La NASA lleva a cabo concursos a través del site de gamificación TopCoder, concediendo premios a aquellos que proporciones las soluciones más innovadores y efectivas en coste a sus problemas. Explorys proporciona agudos conocimientos y deducciones antes desconocidos acerca del comportamiento en atención sanitaria.

¿Cómo lo consiguen todas estas empresas y administraciones? La tecnología, ciertamente, juega un gran papel, pero en cada caso la respuesta va más allá de eso. Los individuos en esas organizaciones han comprendido que no tienen que ser Nate Silver para cosechar beneficios masivos del uso de los nuevos y emergentes tipos de datos. Y cada una de esas organizaciones ha adoptado Big Data, consiguiendo hacer astutas y de otra forma imposibles observaciones, acciones y predicciones.
COMENTARIO PERSONAL

'Too big to ignore' es una panorámica general sobre el fenómeno Big Data, una panorámica que no es completamente de negocio (a pesar del subtítulo 'The business case for Big Data' que lo acompaña) ni tampoco completamente tecnológica. No debe sin embargo entenderse esto como un defecto sino, a mi parecer, todo lo contrario: es un buen punto de partida para saber de qué estamos hablando cuando empleamos el tan manido, y tan poco explicado término 'Big Data'.

El libro se estructura en ocho capítulos:

El primer capítulo, 'Data 101 and the Data Deluge' actúa como introducción pero sobre todo presenta la distinción entre datos estructurados, desestructurados y semi-estructurados. Argumenta el crecimiento e importancia de los no estructurados y semi-estructurados y cómo eso influye en las empresas.

'Demystiying Big Data' es un relativamente largo recorrido por las principales características e ideas a tener en cuenta en lo relativo a Big Data e introduce el interesante concepto de 'Deep web', aquella parte de la web a la que no se puede acceder a través de buscadores.

'The elements of Persuasion: Big data techniques' es uno de los capítulos más teóricos y repasa las técnicas que se aplican en Big Data, algunas de las cuales ya tienen una larga historia antes de que se acuñase el término Big Data. Así se habla de métodos estadísticos como regresión o tests A/B; de visualización de datos con técnicas como mapas de calor o análisis de series temporales; automatización incluyendo inteligencia artificial, sensores o NFC; técnicas semánticas como procesamiento de lenguaje natural o análisis de sentimiento; y finalmente análisis predictivo. Se complementa el capítulo repasando el uso que de Big Data hacen los gigantes tecnológicos y de Internet: Amazon, Apple, Facebook y Google.

'Big Data solutions' es el capítulo de carácter más tecnológico y en él se pasa revista a las principales tecnologías y soluciones existentes hoy día, entre las cuales goza de una enorme preponderancia Hadoop y sus derivados. Se habla de Hadoop, Cloudera, de bases de datos NoSQL, bases de datos columnares o newSQL y también se mencionan algunas startups como Kaggle.

En el quinto capítulo, 'Case studies: the big rewards of Big Data', se presentan, como el título anuncia, tres casos reales de aplicación de Big Data. En concreto se presenta el caso de Quancast (selección de público para campañas de publicidad), Explorys (atención sanitaria) y la propia NASA.

'Taking the big plunge' proporciona una serie de precauciones y consejos para la implantación de una iniciativa de Big Data.

'Big Data: big issues and big problems' continúa, en cierto sentido, la temática iniciada en el capítulo anterior pero centrándose ahora en advertir de los problemas que se pueden presentar como, por ejemplo, los relativos a privacidad y seguridad.

Finalmente, 'Looking forward: the future of Big Data' intenta avistar el futuro que espera a este fenómeno de Big Data, siendo dos los principales argumentos: Big Data está aquí para quedarse pero, también, Big Data evolucionará, no permanecerá como lo conocemos hoy día.

Debe considerarse 'Too big to ignore' como un libro introductorio o de divulgación sobre Big Data (aunque de más profundidad que una divulgación habitual), una guía para entender los aspectos más relevantes de este fenómeno. En ese sentido cumple muy bien su cometido. Sin embargo, debe advertirse, por lo mismo, que no se trata ni de un libro plenamente tecnológico ni plenamente de negocio, por lo que quien desee profundizar en alguna de esas dos facetas, deberá emplear fuentes adicionales.