Corso di Laurea Magistrale in Scienze Statistiche ed Economiche, Università degli Studi di Milano-Bicocca, A.A. 2022/23.
Lunedì inizio 15:30
Mercoledì inizio 14:45
Giovedì inizio 11:30
ARGOMENTI | MATERIALE | DIDATTICO | LIBRO DI TESTO | ESERCIZI |
Introduction. | SLIDES. | |||
A simple problem. | SLIDES. | R CODE | AS §3.2 | Vedi slide. |
Bias-variance tradeoff. | SLIDES. | R CODE | AS §3.3, §4.1, HTF §2.3, §2.9, §7.2, §7.3 | AS Exercises 3.1, 3.2, 3.3. |
Optimism. | SLIDES. | R CODE | AS §3.4, §3.5.1, §3.5.2, §3.5.3 HTF §7.4, §7.5 | AS Exercise 3.4. |
Computational aspects. | SLIDES. | R CODE | AS §2.2.1, §2.2.2, §2.2.3 HTF §3.2.3, LKA §2.3, §2.5, §2.6 | HTF ex. 3.4 |
Modelling Process. | SLIDES. | |||
Auto dataset. | SLIDES. | R CODE | AS §1.2.1, §1.2.2 | Not mtcars AGAIN |
Titanic dataset. | SLIDES. | R CODE | ||
Netflix dataset. | SLIDES. | R CODE | AS §2.1.3, ISL §12.3 | Vedi slide. |
Orange dataset. | SLIDES. | R CODE | KJ §5.4, §8.4 | Vedi slide. |
Regression splines. | SLIDES. | R CODE | AS §4.4.1, §4.4.2, LKA §4.5, §4.7, HTF § 5.1, §5.2 §A.B | HTF Ex. 5.5 |
Additive models. | SLIDES. | R CODE | AS § 4.5, LKA § 6.3, HTF § 9.1.1, 9.1.2 | GAMs in R |
Best subset selection. | SLIDES. | R CODE | AS § 3.6.1, HTF § 3.3, § 7.10.2 | Vedi slide. |
Ensemble of models. | SLIDES. | R CODE | HTF § 8.8 | Vedi slide. |
Comparing models | SLIDES. | R CODE | TMWR § 11.1, § 11.2, § 11.3 |
La modalità di verifica consiste nell’analisi di un dataset e in una prova orale. L’analisi dei dati ha come obiettivo la verifica delle abilità di modellizzazione dei dati a fini previsivi. La prova orale riguarderà sia l’esposizione dell’analisi dei dati sia la verifica dello studio degli argomenti trattati a lezione.
Per l’analisi dei dati, oltre alle previsioni, bisognerà produrre una relazione contenete la descrizione dell’analisi e il codice utilizzato. Bisogna consegnare l’analisi dei dati sulla pagina moodle del corso almeno una settimana prima dell’appello d’esame. E’ possibile consegnare l’analisi dei dati una volta sola per A.A.
Esempio di consegna (da caricare nell’apposito spazio sulla pagina MOODLE, rispettando il formato [numero di matricola]_previsione.txt, [numero di matricola]_codice.pdf e [numero di matricola]_relazione.pdf): 2575_previsione.txt ; 2575_codice.pdf ; 2575_relazione.pdf .
Calendario degli esami.
Sessione | Data | Luogo | Orario | ||||||
---|---|---|---|---|---|---|---|---|---|
Invernale | 9 Febbraio 2023 | U7-13 | 14:00 | ||||||
Invernale | 1 Marzo 2023 | U7-13 | 14:00 | ||||||
Primaverile | - | - | - | ||||||
Estiva | - | - | - | ||||||
Estiva | - | - | - | ||||||
Estiva | - | - | - |
Azzalini, Scarpa (2012). Data analysis and data mining: an introduction. Oxford University Press. [AS].
Hastie, Tibshirani, Friedman (2009). The Elements of Statistical Learning. Springer. [HTF].
Azzalini, Scarpa (2004). Analisi dei dati e data mining, Springer-Verlag Italia.
Lewis, Kane, Arnold (2019). A Computational Approach to Statistical Learning. Chapman And Hall/Crc. [LKA].
Kuhn, Johnson (2019). Feature Engineering and Selection. Chapman and Hall/CRC. [KJ].
Kuhn, Silge (2022). Tidy Modeling with R. O’Reilly Media, Inc. [KS].