Cinco técnicas de aprendizaje no supervisado — Isolation Forest, LOF, Benford, clustering, análisis temporal — sobre 2.35M contratos federales y estatales. No hay etiquetas de “fraude”; lo que sí hay son patrones estadísticos que convergen en proveedores y contratos específicos.
Cada técnica produce ruido por separado. La intersección de varias técnicas independientes apunta a algo. Esta página agrupa los hallazgos más robustos del análisis.
Contratos detectados por al menos 2 técnicas independientes (Isolation Forest + LOF + MAD + DBSCAN + EFOS). La intersección reduce ruido: cuantas más señales convergen, mayor el indicio.
Pipeline ampliado al histórico 2010-2024: 2.35M contratos con 8 señales independientes (incluye cruce EFOS por nombre y patrones post-presunción). 13 contratos con todas las banderas encendidas.
31 con contratos individuales >$1,000M. $354.9 mil M MXN agregados. 1.53× más probable que terminen en lista negra del SAT vs proveedores persistentes.
Combina %AD, HHI de proveedores, concentración en top-1, calidad de datos. Tlaxcala lidera (índice 1.000): 91% Adjudicación Directa, un solo proveedor concentra 48% del gasto estatal.
Empresas que el SAT marcó como EFOS y, aún así, siguieron firmando contratos públicos. Monto bajo pero documenta el gap del sistema: no hay bloqueo automático.
Tres clases naturales: persistentes (oligopolios que sobreviven gobiernos), transitorios (1 solo sexenio), y los que aparecen solo en años electorales. Hallazgo contraintuitivo: %AD baja 10pp en electorales.