Qué se necesita para ser Científico de Datos

Hemos oído hablar mucho sobre la Ciencia de Datos, una profesión muy demandada y a la que cada vez se unen más profesionales de otras ramas. En este post veremos qué se necesita para ser un Data Scientist y que deberías estudiar si aún no has elegido carrera, o bien, si te estás planteando un cambio profesional.
¿Qué es un Data Scientist?
Una de las definiciones que más me gustan es la del Director de Ingeniería de Datos en Slack:
El Data Scientist es aquel que es mejor en Estadística que cualquier ingeniero informático y mejor en Ingeniería Informática que cualquier estadístico. > > Josh Wills
Es una profesión multidisciplinar que combina diferentes habilidades, desde el análisis de datos hasta la comunicación, y sus principales objetivos son recopilar, analizar e interpretar conjuntos de datos.
¿Qué se necesita estudiar para ser Científico de Datos?
Tanto los grados de Estadística o Matemáticas, como los de Ingeniería Informática son buenos puntos de partida para iniciar esta andadura. Ahora, cada vez existen más títulos especializados en Ciencia de Datos que tratan de aunar las materias relacionadas con esta profesión. Éstos también resultan una opción muy interesante. Sin embargo, cuidado con los cursos prometedores que nos “aseguran” convertirnos en Data Scientists en un mes, ¡o en 10 días! Suena bastante imposible, pues una de las principales razones es que la mayor parte del trabajo se va construyendo con la experiencia y con una base académica sólida, que no se adquiere en dos días.
¿Esto quiere decir que si hemos estudiado otra carrera no podremos dedicarnos nunca a la Ciencia de Datos?
Por supuesto esto no es así. De hecho uno de los puntos clave en esta profesión es entender la materia a la que se dedica. Si por ejemplo has estudiado Meteorología y trabajas como Científico de Datos en la AEMET, tendrás una gran ventaja sobre aquellos procedentes de las ramas STEM. O bien, si trabajamos en un departamento de negocio, y nuestra base es ADE, los casos de uso serán mucho más fáciles de entender para nosotros.
Por tanto, no importa tanto los estudios universitarios en sí, si no todo el conjunto de conocimientos y habilidades que vamos adquiriendo por el camino. Pero, ¿cuáles son estas habilidades?
¿Qué conocimientos son necesarios para ser Data Scientist?
Como decíamos, los conocimientos en modelos estadísticos son fundamentales. Para ello, es necesario entender la Teoría de la Probabilidad y el Álgebra como mínimo. Por otro lado, la Inferencia Estadística, Diseño de Experimentos o Procesos Estocásticos, también son fundamentales. Todo depende del proyecto en que nos encontremos y sus objetivos.
La Inteligencia Artificial está cada vez más presente en los proyectos de Data Science. Por ello, es crucial entender cómo funcionan las redes neuronales profundas, el Deep Learning, o el Aprendizaje por Refuerzo, el Reinforcement Learning. Estas son algunas de las técnicas de aprendizaje de máquinas avanzado, Machine Learning que existen hoy en día.
Tengamos en cuenta que para poder aplicar un modelo sobre un conjunto de datos, es necesario programarlo antes. La programación entonces es otro requisito esencial. R y Python son los lenguajes más conocidos en materia de analítica de datos, pero también deberíamos tener presentes Scala, Java, y Javascript. ya que como decíamos, dependiendo del proyecto, pueden tomar más o menos protagonismo. Para poder hacer consultas sobre bases de datos, SQL es uno de los lenguajes estrella, aunque también nos podemos encontrar con otros tipos de bases de datos que requieren lenguajes de consulta específicos. En entornos de Big Data, Hadoop y Spark son frameworks especializados que sin duda conviene conocer.
¿Qué skills son necesarias para ser Data Scientist?
En cuanto a habilidades, no podrían faltar en este blog la comunicación y la visualización. Suelen ser las grandes olvidadas en los proyecto de datos, pero sin duda, constituyen un papel fundamental a la hora de poner en valor todo el trabajo anterior.
Otra de las características más importantes, como en cualquier trabajo, es la actitud, la disposición a aprender, el ser curioso en el área de trabajo. También el estar al tanto de los últimos lenguajes o frameworks emergentes, aprender de los compañeros, escuchar y ser productivo y colaborativo.
Ser Científica/o de Datos es un reto.
El Data Scientist se construye día a día, hablando con gente de diferentes sectores, explorando proyectos nuevos, siendo curioso. Ser Científica/o de Datos es un reto. Y por eso, los que nos dedicamos a ello nos apasiona tanto. Cada proyecto es un nuevo desafío al que enfrentarse, además de todo lo que aporta nuestro trabajo a la sociedad.