Învăţare automată
Laboratorul 10
Clustering
- Subiecte examen - a se vedea problema legate de clustering
TEMĂ: La alegere, una din următoarele probleme:
- Implementare EM pentru k-means. Alegeţi un număr k şi parametrii μ şi σ pentru k gausiene. Generaţi puncte în spaţiul 1- sau 2-dimensional, dupa o distribuţie corespunzatoare parametrilor aleşi. Pe punctele astfel generate aplicaţi algoritmul EM pentru k-means, pentru obţinerea a k clustere. Comparaţi gausienele obţinute cu cele utilizate iniţial pentru generarea punctelor. [termen limită: 12.12.2006 (L11)]
- La căutarea unui nume de persoană cu ajutorul unui motor de cautare se obţin mai multe documente despre mai multe persoane cu acel nume. Dezvoltaţi un instrument care grupează aceste documente, astfel încâ fiecare grup să conţină documentele care se referă la una din aceste persoane. [termen limită: 19.12.2006 (L12)]
- Clustering ierarhic, versioning. Aveţi la dispoziţie n documente (care pot fi texte in limbaj natural, imagini, cod sursa, etc). Dintre acestea, unul este documentul original, iar celelalte sunt versiuni (ale unor versiuni ale unor versiuni...) ale sale. Dezvoltaţi un instrument cu ajutorul căruia să se poată stabili ierarhia acestor versiuni. [termen limită: 19.12.2006 (L12)]
Resurse: