Científico de datos. Descubre en qué consiste y habilidades que se necesitan
¿Qué tanto conoces sobre una de las profesiones más demandas del futuro? Aquí aprenderás lo esencial sobre un data science

¿Qué se necesita para ser científico de datos?
- Tener habilidades para las matemáticas, la programación, la estadística, el análisis, el procesamiento y la lectura de datos.
- Pensamiento crítico, comunicación efectiva, resolución proactiva de problemas y otras tantas llamadas habilidades blandas.
¿Tú cuál crees que es la respuesta? ¿Crees que un científico de datos debe ser bueno para los números y ya está?
No es raro si te inclinas un poco más por la respuesta número 1. Esto sucede porque aún no hay un conocimiento muy profundo de esta profesión, pero como ahora se está poniendo muy de moda, tenemos que aclarar muchas cosas. La verdad es que un data science o científico de datos necesita de habilidades técnicas y no técnicas, así como todas las profesiones.
La demanda de talento en esta área está creciendo y con ello la necesidad de más científicos de datos. Si eres alguien que se está iniciando su camino por esta ciencia, debes saber que así como la educación es importante, fuera del currículo técnico hay habilidades que trascienden como en cualquier disciplina y que desarrollarlas te hace ser más competitivo en el mercado.
Empecemos explicando
¿Qué es un científico de datos y qué hace?
Un científico de datos es un profesional dedicado a analizar e interpretar grandes volúmenes de datos. Actualmente es uno de los profesionales más importantes en las empresas que día a día están creando grandes cantidades de datos y que han aprendido del valor que tienen para su crecimiento.
Miremos la definición de José Antonio Guerrero, uno de los mejores científicos de datos y el cual en 2013 fue considerado el mejor científico de datos del mundo por la red social de científicos de datos, debido a sus brillantes modelos predictivos. Él dice que:
«El data science es una persona con fundamentos en matemáticas, estadística, métodos de optimización y con conocimiento en lenguajes de programación. Además, tiene una experiencia práctica en el análisis de datos reales y la elaboración de modelos predictivos».
Esta definición nos habla de los conocimientos que se necesitan para ser un científico de datos. Por otro lado, también podemos ver la definición de Josh Wills: “Científico de datos (n): Persona que sabe más de estadística que cualquier programador y que a la vez sabe más de programación que cualquier estadístico”.
Como ya lo notaste, ambas definiciones nos permiten distinguir las capacidades y habilidades que debe tener un científico de datos, que hasta hace poco la profesión en esta área era un problema, ya que se empezaba a tener mucha demanda y pocos profesionales.
Habilidades que debe tener un científico de datos
Estas son las habilidades más requeridas y las que llamamos técnicas, ya que están relacionadas con los conocimientos que se desarrollan por medio de la educación.
1. Matemáticas
La premisa es que un científico de datos debe conocer los fundamentos de las matemáticas, no ser un matemático. Esto por dos razones. Por un lado porque hay conceptos que se necesitan saber para poder trabajar, se usan de forma puntual, pero se puede apoyar en información de internet. Por otro lado, hay cosas que realmente se necesitan saber porque se deben aplicar en el día a día con criterio y fluidez. Veamos los conocimiento más importantes dentro de esta área.
- Álgebra lineal: especialmente saber sobre fundamentos de factorización, matrices, proyecciones y vectores porque se aplican en Machine Learning.
- Estadística y probabilidad: el científico de datos debe tener la capacidad de trabajar en axiomas y leyes de probabilidad, variables aleatorias, distribuciones, varianza y otros.
- Cálculo: es necesario tener nociones sobre derivadas, diferenciales, integrales, funciones vectoriales.
- Algoritmos: es importante para optimizar la eficiencia computacional y la escalabilidad de los proyectos. Aquí se debe tener conocimientos sobre estructuras de datos, grafos, métodos estocásticos.
2. Análisis de datos
Es quizás la habilidad más esencial que debe tener el profesional porque esto no lo podrá hacer ningún software o herramienta. La preparación y la visualización de los datos es el 80% del trabajo y lo debe hacer un científico de datos, por ello habilidades como la exploración, la limpieza, la construcción de modelos y la presentación de resultados deben ser muy sólidas en el profesional.
3. Lenguajes de programación y herramientas
Existen una gran variedad de frameworks y herramientas dentro del Big Data y el Machine Learning. Así que entre más tecnologías se manejen mejor será el desempeño del profesional y la calidad de los proyectos. Algunas de ellas son:
-
R: lenguaje de programación con enfoque en análisis estadístico. Ejecuta las instrucciones directamente, sin una previa compilación del programa a instrucciones en lenguaje máquina.
-
Dockers: tecnología de creación de contenedores que permite la creación y el uso de contenedores de Linux®.
-
Python: lenguaje de escritura rápido, escalable, robusto y de código abierto. Permite plasmar ideas complejas con unas pocas líneas de código, lo que no es posible con otros lenguajes.
-
AWS: plataforma en la nube más adoptada y completa. Ofrece más de 200 servicios integrales de centros de datos a nivel global.
-
Tableau: herramienta de visualización de datos potente utilizada en el área del Business Intelligence. Ayuda a las personas y las empresas a ver y comprender todos sus datos.
-
My SQL: sistema de gestión de bases de datos que cuenta con una doble licencia. Por una parte es de código abierto, y por la otra, cuenta con una versión comercial gestionada por la compañía Oracle.
4. Inteligencia de negocios o Business Intelligence
No se puede dejar por fuera que un científico de datos debe tener la capacidad de comprender la visión del negocio, de interpretar y detectar tendencias en su área y de traducir esos descubrimientos en acciones que lo impacten. Esto es importante porque no sirve de nada aplicar algoritmos complejos a objetivos que no tienen valor.
Un científico de datos debe utilizar todos sus conocimientos para impactar en los resultados de una empresa y jugar un papel importante en la comunicación de lo que puede adoptar en materia de innovación.
A continuación veremos algunas habilidades que se denominan como no técnicas, puesto que no requieren una capacitación técnica o certificación como tal, pero sí son muy importantes que cualquier profesional trabaje en ellas.
1. Pensamiento crítico
El pensamiento crítico es la habilidad que permite obtener información, pero también de formular preguntas de manera adecuada y comprender cómo se relaciona con el negocio para saber cómo dirigir los próximos pasos.
También te permite:
- Analizar objetivamente preguntas, hipótesis y resultados.
- Comprender cuáles son los recursos importantes para resolver un problema
- Ver los problemas con diferentes puntos de vista y perspectivas para encontrar mejores soluciones.
2. Comunicación efectiva
Relacionarse con otras personas es vital, más teniendo en cuenta que luego de hacer un proyecto hay que presentarlo con claridad y fluidez ante las audiencias, que en la mayoría de los casos no entenderá los conceptos de manera técnica.
También podrás:
- Comunicar resultados o información relevante de manera que resalte el valor del trabajo desarrollado.
- Transmitir de manera idónea el proceso de investigación y los supuestos que llevaron a las conclusiones.
3. Resolución proactiva de problemas
La Ciencia de Datos se trata de resolver hipótesis o problemas planteados, por eso un científico de datos debe tener esa habilidad y curiosidad para hacerlo. Debe pararse frente al problema y tratar de solucionarlo de manera eficaz y de raíz.
Con esta habilidad también podrás:
- Identificar oportunidades para explicar problemas y sus soluciones.
- Tener el conocimiento y la capacidad de identificar supuestos y recursos existentes para resolver un problema.
- Reconocer métodos efectivos para obtener respuestas correctas a los problemas planteados
Recuerda que también puedes seguirnos en nuestras redes sociales y aprender cada día de lo que compartimos sobre desarrollo a la medida, Ciencia de Datos y transformación digital: Facebook - Instagram - LinkedIn

7 causas por las que fracasa un proyecto de datos

Todo lo que debes saber sobre el análisis de datos

Importancia de tener una política de tratamiento de datos personales en tu empresa

Importancia del análisis de los datos de marketing y ventas

¿Cómo proteger los datos personales de tus clientes?
