Ingeniero de MLOps
Fecha: 31 ago 2024
Ubicación: Cuauhtemoc, Distrito Federal, 277436, 06500
Empresa: AT&T Services, Inc.
Objetivo de la posicion
Administración, monitoreo y puesta en producción de modelos desarrollados por el equipo de ciencia de datos.
Principales Responsabilidades
Monitoreo del desempeño de modelos de ciencia de datos en producción. Esto lo logra a través de revisar que las ejecuciones periódicas de los modelos corran con éxito y en caso de no ser exitosas implementa los pasos para asegurar que corran bien los modelos. Adicionalmente se asegura de que los modelos estén dentro de las métricas deseadas de desempeño, previniendo y actuando ante el data drift y el concept drift. 20%
Asegura que todo el código productivo cubra un mínimo de testeo (60%), que el código esté formateado apropiadamente y que haya pasado por un proceso de liniting donde se corrigen errores de programación y de estilo. Esto lo logra a través de revisar y aprobar los cambios que suban los científicos de datos, así como asegurando que la plataforma en la que se trabaja tenga integración continúa estableciendo los procedimientos necesarios para que se realice esta revisión de código automatizada. 20%
Busca realizar el monitoreo del ciclo de vida de los modelos su alcance, los datos usados, el modelado que fue usado y su liberación a producción. Esto lo logra a través del uso de herramientas como MLFlow. 20%
Asegurar continuos delivery (CD) a través de que cada push dispare actividades de compilado, revisión de códigos y liberación (si aplica) en la plataforma en la que se liberen los códigos productivos de los modelos. 20 %
Soporte del desarrollo de modelos a través de la realización y mejoramiento de un feature store para poder guardar las características más útiles para modelos de ciencia de datos. 20%
Educación (mínima y deseada)
Educación mínima: Licenciatura en ciencias de la computación, ingeniería en sistemas y afín
Educación deseada: Maestría en ciencias de la computación, ciencia de datos y afines
Experiencia (mínima y deseada)
Experiencia mínima: 3 años
Experiencia deseada: 5 años
Licencias/Certificaciones Requeridas
Python 90%
Pyspark 80%
Nube 80%
Git 90%
SQL 90%
Idiomas (Habla, Escribe, Lee)
Ingles 90%
Paquetes De Computo Requeridos
Python
Spark
Git
AWS (CodeCommit, CodePipeline, CodeBuild, …)
Azure
SQL
Airflow
Docker