Ingeniero de MLOps

Fecha: 22 abr 2024

Ubicación: Cuauhtemoc, Distrito Federal, 277435, 06500

Empresa: AT&T Services, Inc.

Objetivo de la posicion

Administración, monitoreo y puesta en producción de modelos desarrollados por el equipo de ciencia de datos.

Principales Responsabilidades

Monitoreo del desempeño de modelos de ciencia de datos en producción. Esto lo logra a través de revisar que las ejecuciones periódicas de los modelos corran con éxito y en caso de no ser exitosas implementa los pasos para asegurar que corran bien los modelos. Adicionalmente se asegura de que los modelos estén dentro de las métricas deseadas de desempeño, previniendo y actuando ante el data drift y el concept drift. 20%

Asegura que todo el código productivo cubra un mínimo de testeo (60%), que el código esté formateado apropiadamente y que haya pasado por un proceso de liniting donde se corrigen errores de programación y de estilo. Esto lo logra a través de revisar y aprobar los cambios que suban los científicos de datos, así como asegurando que la plataforma en la que se trabaja tenga integración continúa estableciendo los procedimientos necesarios para que se realice esta revisión de código automatizada. 20%

Busca realizar el monitoreo del ciclo de vida de los modelos su alcance, los datos usados, el modelado que fue usado y su liberación a producción. Esto lo logra a través del uso de herramientas como MLFlow.              20%

Asegurar continuos delivery (CD) a través de que cada push dispare actividades de compilado, revisión de códigos y liberación (si aplica) en la plataforma en la que se liberen los códigos productivos de los modelos. 20      %

Soporte del desarrollo de modelos a través de la realización y mejoramiento de un feature store para poder guardar las características más útiles para modelos de ciencia de datos. 20%

Educación (mínima y deseada)

Educación mínima: Licenciatura en ciencias de la computación, ingeniería en sistemas y afín    

Educación deseada:  Maestría en ciencias de la computación, ciencia de datos y afines

Experiencia (mínima y deseada)

Experiencia mínima: 3 años       

Experiencia deseada: 5 años

Licencias/Certificaciones Requeridas

Python 90%      

Pyspark 80%                     

Nube 80%                         

Git 90%               

SQL 90%

Idiomas (Habla, Escribe, Lee)

Ingles 90%

Paquetes De Computo Requeridos

Python                    

Spark                                      

Git         

AWS (CodeCommit, CodePipeline, CodeBuild, …)              

Azure                       

SQL   

Airflow              

Docker