Descrizione del corso:
-
Sistemi informativi: definizione ed esempi. Sistema informatico e concetto di database. Tipologie di sorgenti dati. Evoluzione storica della “database technology”. Definizione e proprietà di un DBMS. Concetto di data models e classificazione (gerarchico, relazionale, object oriented, reticolare). Primitive di strutturazione per i vari data models.
-
Sistemi informativi orientati alla gestione di informazioni strutturate. Informazione e dato. Basi di dati relazionali, sistemi OLTP, algebra relazionale (operatori di selezione, proiezione, join, etc.). SQL. Database gerarchici e documenti XML. Esempi.
-
Cenni su sistemi informativi orientati alla gestione di informazioni non-strutturate. Documenti HTML e confronto tra HTML ed XML.
-
Sistemi informativi per il supporto alle decisioni (data warehouse). Definizione di datawarehouse, data model multidimensionale, sistemi OLAP, confronto OLTP/OLAP, primitive OLAP (slicing/dicing, roll-up/drill-down, pivoting).
-
Elementi di progettazione di un sistema informativo. Progettazione di sistemi strutturati sia di tipo gerarchico che relazionale. Modello Entità/Relazioni. DTD per documenti XML.
-
Data management nei contesti eScience: introduzione e problematiche generali. Gestione dei dati scientifici. Data access e data browsing. Formato NetCDF, librerie a supporto per gli sviluppatori, clients e CDL. Gestione dei metadati. Search & discovery (metadata service). Esempi di standard dei metadati (ISO19115 e ISO19139).
-
Servizi per il data management. Classificazione di tipo general purpose e domain-based. Concetto di client, server e protocolli di comunicazione. Servizi OPeNDAP, THREDDS, FTP, HTTP.
-
Tools per il processing, l’analisi e la visualizzazione di dati scientifici. Breve cenno ai tools forniti da UNIDATA per la comunità geoscience.
-
Esercitazioni con SQL, NetCDF (utilities), OPeNDAP, THREDDS. Comandi linux da terminale. Compilazione dei sorgenti del pacchetto NetCDF C library. Installazione e gestione del container Apache Tomcat per applicazioni web.
Prerequisiti:
Nessuno
Libri di testo di riferimento:
Slides presentate a lezione e dispense aggiuntive fornite dal docente, tratte dai seguenti testi:
-
R. Elmasri and S. Navathe, “Fundamentals of Database Systems”, Sixth Edition, 2010
-
M. Golfarelli, S. Rizzi, “Data Warehouse – Teoria e pratica della progettazione”, McGraw Hill, 2005
-
J. Han, M. Kamber, “Data Mining: Concepts and Techniques”, Morgan Kaufmann Publishers, 2006
Regole del corso:
E’ richiesta la frequenza.
L’esame si svolgerà alla fine del corso in modalità test con domande a risposta aperta.