EXECUTIVE DATA SCIENCE
FICHA
Foto Título:            EXECUTIVE DATA SCIENCE. A GUIDE TO TRAINNING AND MANAGING THE BEST DATA SCIENTISTS
Autor:            Brian Caffo, , Roger D. Peng y Jeffrey T. Leek
Editorial:       Autoeditado en Leanpub
Idioma:         Inglés
Páginas:        151
Publicación:  2016
Lectura:         2016
COMENTARIO EDITORIAL
(Fuente: Traducción y adaptación propia de ficha en Leanpub)

En este conciso libro Vd. aprenderá lo que necesita saber para conformar un equipo de ciencia de datos, incluso si Vd. nunca a trabajado en el campo de la Ciencia de los Datos anteriormente. Obtendrá un curso de choque en ciencia de los datos de forma que estará versado en la materia y entenderá su rol como líder. También aprenderá cómo reclutar, ensamblar, evaluar y desarrollar un equipo con habilidades y roles complementarios. Aprenderá la estructura del proceso de la ciencia de datos, los objetivos de cada etapa, y cómo mantener el equipo enfocado. Finalmente, aprenderá algunas habilidades prácticas que le ayudarán a superar los retos habituales que frecuentemente hacen descarrilar los proyectos de ciencia de datos.

COMENTARIO PERSONAL

'Executive Data Science' es un libro que entiendo está hecho expresamente como libro de texto para el programa de especialización del mismo nombre que sus autores, profesores de la Johns Hopkins University,  ofrecen sobre la plataforma Coursera y esa es, precisamente, la vía por la que llegué a esta obra y la leí, como apoyo a la realización del curso.

El libro, y el curso, son una introducción a la disciplina de la ciencia de datos pero con una cierta orientación hacia los gestores de equipos y proyectos de análisis de datos.

El libro se estructura en cuatro capítulos que conciden con los cuatro cursos que componen el programa:
  • 'A crash course on data science' centra el significado de la disciplina de Ciencia de los Datos y cómo se relaciona con la estadística, el 'machine learning' o la ingeniería de software. También habla de cómo se estructura un proyecto de Cienca de Datos, qué resultados se obtienen y cómo identificar si el proyecto ha sido exitoso o no. Además proporciona algunas sugerencias sobre herramientas que se pueden utilizar.

  • 'Building the Data Science Team' Se centra en la constitución y gestión de los equipos humanos, identificando los diferentes roles, y cómo gestionar tanto las relaciones dentro del equipo como de éste con otros actores.

  • 'Managing Data Analysis' Se centra en el proceso de trabajo, con sus fases y la mejor forma de ejecutarlas. Concede mucha importancia a la formulación de la pregunta que se desea contestar con el análisis e identifica la tipología de preguntas posibles. Se detiene también bastante en el análisis exploratorio inicial y en la diferenciación entre análisis asociacionales y análisis predictivos.

  • 'Data Science in real Life' contrariamente a lo que el título sugiere, es probablemente el capítulo más tecnico y complejo. La idea es comparar el proyecto de análisis de datos ideal con lo que se suelen encontrar los científicos de datos en la práctica pero, en esa comparativa, se identifican muchas técnicas, algunas complejas, para ayudar a gestionar esas 'imperfecciones'.

'Executive Data Science' es, como se ha dicho más arriba, casi un libro de texto y, en ese sentido, no busca especialmente el ser ameno ni motivador. A cambio es ordenado y riguroso y, son esas dos características, unidas a una cierta brevedad, las que creo que le confieren valor