Il grande volume di dati che viene attualmente collezionato nei vari campi di applicazione non può essere gestito usando le tecniche standard di data mining. L’obiettivo principale del presente lavoro di tesi è quello di trovare le soluzioni più ragionevoli per problemi di data mining legati alla gestione di dati ad alta dimensionalità. In particolare in questo lavoro di tesi sono stati considerate due applicazioni di data mining per dati multidimensionali. Il primo riguarda la cloud detection, ovvero un problema di classificazione di immagini multispettrali telerilevate da satellite, che dimostra l’alta affidabilità delle tecniche statistiche di analisi discriminante nel classificare questo tipo di immagini. Tali tecniche di classificazione sono state confrontate con tecniche standard basate su principi fisici per testare i costi di processo e il tasso pass/fail. La seconda applicazione riguarda la necessità di gestire dati multidimensionali per i quali è necessario fare assunzioni piuttosto che avere conferme (come nella precedente applicazione). Questo porta in modo naturale al problema del clustering di dati permettendo di trovare strutture significative all’interno degli stessi. Invece di scegliere l’una o l’altra tecnica di clustering, noi abbiamo scelto di approcciare il problema in modo più generale mediante il cosiddetto “consensus clustering”: piuttosto che cercare una singola soluzione al problema, l’obiettivo è trovare tutte le possibili soluzioni equivalentemente valide. A questo scopo è stata sviluppata una procedura automatica basata sul Least Squares Consensus Clustering. Le applicazioni sono state testate usando sia data-sets sintetici che reali,dimostrando la validità delle procedure. Grande enfasi è stata data anche alla validazione dei risultati attraverso l’uso di indicatori di performance per dimostrare l’affidabilità delle tecniche sviluppate. [a cura dell'Autore]

Discovering hidden structures in high dimensional data space / Loredana Murino , 2011 Mar 01., Anno Accademico 2009 - 2010.

Discovering hidden structures in high dimensional data space

Murino, Loredana
2011

Abstract

Il grande volume di dati che viene attualmente collezionato nei vari campi di applicazione non può essere gestito usando le tecniche standard di data mining. L’obiettivo principale del presente lavoro di tesi è quello di trovare le soluzioni più ragionevoli per problemi di data mining legati alla gestione di dati ad alta dimensionalità. In particolare in questo lavoro di tesi sono stati considerate due applicazioni di data mining per dati multidimensionali. Il primo riguarda la cloud detection, ovvero un problema di classificazione di immagini multispettrali telerilevate da satellite, che dimostra l’alta affidabilità delle tecniche statistiche di analisi discriminante nel classificare questo tipo di immagini. Tali tecniche di classificazione sono state confrontate con tecniche standard basate su principi fisici per testare i costi di processo e il tasso pass/fail. La seconda applicazione riguarda la necessità di gestire dati multidimensionali per i quali è necessario fare assunzioni piuttosto che avere conferme (come nella precedente applicazione). Questo porta in modo naturale al problema del clustering di dati permettendo di trovare strutture significative all’interno degli stessi. Invece di scegliere l’una o l’altra tecnica di clustering, noi abbiamo scelto di approcciare il problema in modo più generale mediante il cosiddetto “consensus clustering”: piuttosto che cercare una singola soluzione al problema, l’obiettivo è trovare tutte le possibili soluzioni equivalentemente valide. A questo scopo è stata sviluppata una procedura automatica basata sul Least Squares Consensus Clustering. Le applicazioni sono state testate usando sia data-sets sintetici che reali,dimostrando la validità delle procedure. Grande enfasi è stata data anche alla validazione dei risultati attraverso l’uso di indicatori di performance per dimostrare l’affidabilità delle tecniche sviluppate. [a cura dell'Autore]
1-mar-2011
Informatica
Clustering
Consensus Clustering
Cloud Detection
Tagliaferri, Roberto
Napoli, Margherita
File in questo prodotto:
File Dimensione Formato  
9265212678055346642473995357484414989.pdf

accesso aperto

Tipologia: Tesi di dottorato
Dimensione 68.97 kB
Formato Unknown
68.97 kB Unknown Visualizza/Apri
99560980738188146253313316611848255824.pdf

accesso aperto

Tipologia: Tesi di dottorato
Dimensione 1.37 MB
Formato Unknown
1.37 MB Unknown Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11386/4926821
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact