En ciberseguridad no existe un único modelo de ML ideal para todo. Para logs y telemetría suelen rendir mejor modelos clásicos como XGBoost o LightGBM; para anomalías, Isolation Forest o Random Cut Forest; para texto técnico y threat intelligence, modelos especializados como SecureBERT 2.0; y para copilotos internos, L
una base de datos vectorial sirve para guardar embeddings y recuperar información por similitud semántica; el etiquetado de datos sirve para enseñar al modelo qué significa cada ejemplo y qué decisión debe tomar. Cuando juntas ambas piezas, puedes construir buscadores inteligentes, asistentes internos, clasificadores d