UniversitÓ degli Studi di Pavia - FacoltÓ di Scienze MMFFNN

Le informazioni di questo sito non sono pi¨ aggiornate. Consultare il nuovo link
Home

HomeDidatticaCorsi › Rappresentazione ed analisi dei dati

Rappresentazione ed analisi dei dati

Corsi di laurea:
Scienze della natura
Docenti:
Sacchi Roberto
Anno accademico:
2009/2010
Codice corso:
82400
Crediti formativi:
5
Ambiti:
SECS-S/02
Decreto Ministeriale:
509/99
Ore di lezione:
40
Lingua di insegnamento:
Italiano

ModalitÓ

esame scritto con una parte di teoria e una di pratica

Prerequisiti

Il corso di Rappresentazioni ed analisi dati Ŕ stato progettato per gli studenti che frequentano il primo anno corso di laurea specialistica e si rivolge a studenti con una conoscenza base di probabilitÓ e statistica.

Programma

1. Introduzione a R. Piuttosto che definire R come un software statistico, esso deve essere definito come un ambiente, ovvero un insieme di macro, librerie, oggetti che possono essere utilizzati per la gestione, l’analisi dei dati e la produzione di grafici.
2. ProbabilitÓ e distribuzioni. I concetti di campionamento casuale e probabilitÓ sono alla base della analisi statistica. Gli esperimenti non sono mai perfettamente riproducibili e il grado di non riproducibilitÓ pu˛ variare grandemente da caso a caso. Le distribuzioni di probabilitÓ sono uno strumento essenziale per valutare questa ripetibilitÓ delle misurazioni e degli esperimenti. Saranno quindi presentati i concetti basi della probabilitÓ e le funzioni implementate in R per l’estrazione di campioni casuali e l’utilizzo delle principali distribuzioni di probabilitÓ.
3. Statistica descrittiva e rappresentazione grafica dei dati. Saranno analizzate le funzioni statistiche che permettono di estrarre da un set di dati informazioni di riepilogo quali la media, la varianza o i quartili. Sono poi illustrati alcuni metodi grafici (mono e bidimensionali) con cui Ŕ possibile ispezionare le caratteristiche del campione in esame.
4. Statistica classica: test per uno e due campioni. Saranno presentati i test statistici pi¨ frequentemente utilizzati per confrontare tra loro due variabili continue o per confrontare una variabile continua con un valore stabilito a priori. Saranno introdotte le due funzioni base di R per il t-test e il test di Wilcocox nel caso di singoli campioni, di due campioni indipendenti e di due campioni appaiati
5. Analisi delle frequenze. Si introducono una serie di test designate per l’analisi di dati tabulari implementati in R nelle funzioni prop.test, binom.test, chisq.test e fisher.test
6. Regressione e correlazione. Saranno introdotte le tecniche base per effettuare una analisi di regressione lineare, le procedure grafiche per la valutazione della bontÓ del modello (goodness of fit) e le procedure per il calcolo e la rappresentazione grafica degli intervalli di confidenza e di previsione. SarÓ inoltre introdotto il concetto di correlazione parametrica e non-parametrica e saranno illustrate le procedure in R per il calcolo dei coefficienti di correlazione di Pearson e di Spearman
7. Analisi della Varianza e Kruskal-Wallis. L’obiettivo Ŕ quello di illustrare le tecniche statistiche per confrontare tra loro pi¨ di due variabili continue. SarÓ introdotta l’Analisi della Varianza a una via (ANOVA one-way) e a due vie nel caso di una singola osservazione per cella. Saranno infine introdotte le istruzioni base in R per l’analisi di Kruskall-Wallis nel caso di variabili nono parametriche.
8. Regressione multipla e modelli lineari. La maggior parte dei set di dati sono troppo complicati per essere analizzati con semplici regressioni lineari e richiedono la formulazione di modelli complessi ad-hoc. L’obiettivo Ŕ quello di introdurre tramite i comandi disponibili in R le procedure per la realizzazione di analisi di regressione multipla e la formulazione di modelli lineari complessi.
9. Regressione logistica. Saranno introdotte le tecniche per analizzare variabili binarie, ossia quelle che possono assumere con due soli valori alternativi come presente/assente, malato/sano e cosý via
10. Principali tecniche di analisi multivariata. Con il termine analisi multivariata ci si riferisce a un insieme di tecniche con le quali Ŕ possibile studiare un insieme di pi¨ variabili misurate sullo stesso soggetto. Il tentativo Ŕ quello di descrivere in modo conciso la natura e la struttura dei dati. In questo contesto i test d’ipotesi hanno meno importanza, a vantaggio di metodologie di statistica descrittiva, spesso di natura grafica. Saranno trattate l’analisi delle componenti principali, l’analisi dei cluster e l’analisi discriminante.

Bibliografia

Peter Dalgaard, 2002. Introductory statistics with R, Springer.
Matteo dell’Omodarme, 2008. Esercitazioni di statistica biomedica. Alcune note su R.


Elenco appelli e prove

Nessuna prova presente

Credits: apnetwork.it