Învăţare automată
Laboratorul 7
TEMA
- kNN: Exetciţiul de la laboratorul 5:
- rularea unei implementări kNN (proprii sau disponibile pe internet) pentru baza de date breastCancerData; de constatat care este eroarea pe datele de antrenare şi eroarea medie la cross-validare
- implementarea algoritmului de feature selection propus în documentul tasks.pdf (pagina 2 sus) şi obţinerea unei noi baze de date unde instanţele sunt descrise doar de atributele selectate
- rularea algoritmului kNN pe noua bază de date; observaţii asupra eventualei îmbunătăţiri a rezultatelor
- SVM: Se dă baza de date SpamBase. Rulaţi o implementare SVM pentru această bază de date (recomandat: SVMlight). Experimentaţi diverse funcţii kernel şi întocmiţi un scurt raport al rezultatelor. Ce funcţie kernel, dintre cele experimentate, exprimă cel mai bine gradul de similaritate dintre instanţe?
Resurse:
Instrumente: