Memahami Ciri Terlalu Lengkap dalam Pembelajaran Mesin
Overcomplete merujuk kepada situasi di mana model atau set ciri terlalu kompleks dan menangkap lebih banyak variasi dalam data daripada yang diperlukan. Dalam erti kata lain, model atau ciri dapat menyesuaikan bunyi dalam data dan bukannya corak asas. Ini boleh membawa kepada prestasi generalisasi yang lemah pada data baharu, kerana model menjadi terlalu khusus untuk data latihan.
Dalam konteks pemilihan ciri, overcomplete merujuk kepada situasi di mana terdapat lebih banyak ciri daripada yang diperlukan untuk menangkap variasi penting dalam data . Sebagai contoh, jika model mempunyai 100 ciri tetapi hanya 20 daripadanya yang benar-benar relevan dengan masalah tersebut, maka 80 ciri lain dianggap terlalu lengkap.



