Hombre aprender lenguajes como escala, hacer buenas etl, trabajar con millones datos... facil no es...ademas esos modelos que dices que los ha hecho otro no siempre sirven y a veces hay que meterse en el modelo y modificarlo. Luego esta el tema de que hay que tener conocimientos de estadistica y matematicas...Quiza has tenido la suerte de encontrarte a gente que solo aplicaba 4 modelos y pista, pero vamos, hay mucho trabajo. Ademas de todo lo relacionado con el reporting.
Y ya ni te hablo de aplicaciones enteras hechas con SAS por ejemplo. Un tio con conocimientos que se dedica esto puede saber programar SAS, Python, scala, PL/SQL, R...ademas de saber modelar datos en spark o oracle e incluso saber usar aplicaciones de BI como Microstrategy o SAP, que si que hay alguno que solo sabe algo de R y 4 chorradas mas, pero hay gente con muchisima experiencia tambien. Incluso puede hacerte una aplicacion sin necesitar un informatico usando SAS, django o D3.
Se ha colado un poco de mensaje en tu demagogia...
1. A veces hay que modificar una librería que implementa un modelo? Pon ejemplos. Que sea posible, no quiere decir que sea necesario, y mucho menos habitual. Es algo residual que la mayor parte de data scientists no van a hacer durante su carrera. Precisamente las librerías son algo genérico, usado por millones de usuarios y que se pueden aplicar a un buen número. Sino, no serían librerías. Como ya he dicho, los casos en los que verás a un data scientist modificar una librería, son residuales. Y los casos en los que los verás hacerlo con tests automáticos y manteniendo la fiabilidad de la librería lo suficiente como para que miles de usuarios sigan usándola, es 0.
2. Trabajar con millones de datos no es fácil? ETL? Un nombre más apropiado sería “ñapa”. Eso es lo que hacen los data scientists con los datos. Por eso acaban contratando a Data Engineers que les monten data pipelines que les dejen los datos limpios y organizados para que puedan trabajar cómodamente.
3. Estadística y matemáticas? Que seas mecánico, no quiere decir que tengas conocimientos de física. Y que utilices fórmulas matemáticas que existen desde hace 100 años, que ya vienen encapsuladas y que están listas para que les metas los datos, no hace que necesites saber mucho. Las matemáticas y la estadística que se utilizan son básicas, igual que nadie se dedica a inventar la rueda cuando tiene que construir un coche. La rueda ya está inventada.
4 y 5. Quieres decir que un tío que se dedica a esto puede saber hacer ñapas en SAS, python, Scala y R? Llamar programar a lo que hacen, es como llamar arte a lo que hacen los niños en preescolar. Cogen un montón de código que “funciona”, lo tiran ahí, y eah. No entienden una cosa, pero eso corre. Y “hacer una aplicación”? Son capaces de sacar una cosa que han probado a mano, y que debes rezar para que nadie tenga que modificar nunca más si quieres que siga corriendo. Cosa que no va a pasar, porque hoy en día el software tiene que adaptarse al mercado, y los despliegues con cambios son diarios. Luego peta producción y “jiji, a mi no me mires, yo sólo soy un data scientist jijijiji”
Anda a la cosa. Un lenguaje de programación se aprende en un día otra cosa son las herramientas que hay en cada lenguaje y las prácticas necesarias para poder seguir tocando ese código durante años sin que se convierta en una bomba de cosa al segundo mes.
jorobar, y se creerán que merecen cobrar algo por saber 4 lenguajes, 2 de los cuales solo usan ellos y existen porque los otros eran demasiado complicados para ellos, y otro es de bases de datos... Tiene bemoles. Cual será el punto 6? Decir que es un gran logro ser un ingeniero de machine learning por saber usar google cloud platform para que te reconozca la diferencia entre un perro y un gato en fotos, usando sus herramientas?
Mira, yo no te digo que no hagan nada. Te digo que son unos “lisensiados”, y que la carrera de matemáticas, mezclada con su trabajo, solo sirve para hackear lineas de cosa una detrás de la otra. Por eso todo lo que hacen es procedural. No les pidas testing, estructura, ni orden.