


Comprensión de las funciones excesivamente completas del aprendizaje automático
Sobrecompleto se refiere a una situación en la que un modelo o un conjunto de características es demasiado complejo y captura más variación en los datos de lo necesario. En otras palabras, el modelo o las características pueden ajustarse al ruido de los datos en lugar de a los patrones subyacentes. Esto puede conducir a un rendimiento deficiente de la generalización de datos nuevos, ya que el modelo se especializa demasiado en los datos de entrenamiento. En el contexto de la selección de características, sobrecompleto se refiere a una situación en la que hay más características de las necesarias para capturar las variaciones importantes en los datos. . Por ejemplo, si un modelo tiene 100 características pero sólo 20 de ellas son realmente relevantes para el problema, entonces las otras 80 características se consideran sobrecompletas.



