Il presente studio descrive l’analisi testuale automatica effettuata su un corpus relativo al dominio specialistico dell’Informazione Comunitaria Europea, ed in relazione alle opportunità di cofinanziamento con Fondi Strutturali. L’analisi effettuata ha riguardato le Frequently-Asked (da qui in poi, FAQ) estratte da siti Web dedicati a questo specifico settore informativo. Per la realizzazione dell’analisi testuale automatica è stato utilizzato il pacchetto software NOOJ 2, principalmente basato sull’uso di dizionari elettronici, grammatiche locali e automi e trasduttori a stati finiti (da qui in poi FST). Nel corso delle applicazioni del software, sono stati utilizzati i dizionari elettronici sviluppati dal Dipartimento di Scienze della Comunicazione dell’Università di Salerno, ovvero cinque dizionari del sistema DELA (dizionari elettronici di parole semplici e composte) ai quali è stato affiancato un dizionario elettronico specialistico del settore dell’Informazione Comunitaria Europea. Infine, grazie alla creazione ed all’applicazione di specifici FST, è stato possibile effettuare la lettura automatica del corpus prescelto per poi riconoscere, etichettare e formalizzare gli specifici pattern testuali contenuti dalle FAQ. Il procedimento di formalizzazione effettuato sarà utile, nelle ricerche future, a verificare l’esistenza di modelli linguistici ricorsivi nella produzione di FAQ online, quindi a produrre un sistema di risposta semi-automatico di cui potranno dotarsi i siti Web di Enti Locali e Amministrazioni Pubbliche. La metodologia linguistica descrittiva di riferimento per lo studio da noi effettuato è il Lessico-Grammatica, originariamente introdotto nella comunità scientifica europea da Maurice Gross all’Università Parigi 7 dopo il 1960. Scopo principale del Lessico-Grammatica è descrivere dettagliatamente tutti i meccanismi combinatori indissolubilmente legati alle concrete entrate lessicali. Uno dei risultati più recenti ed importanti della descrizione lessico-grammaticale è proprio la costruzione di tre software e lingware orientati all’analisi testuale automatica, ovvero UNITEX 3 e INTEX 4, oltre il già citato NOOJ.

Grammatiche locali per il riconoscimento automatico e la classificazione delle FAQ sull'Informazione Comunitaria Europea

ELIA, Annibale;MONTELEONE, Mario;VELLUTINO, Daniela;
2010-01-01

Abstract

Il presente studio descrive l’analisi testuale automatica effettuata su un corpus relativo al dominio specialistico dell’Informazione Comunitaria Europea, ed in relazione alle opportunità di cofinanziamento con Fondi Strutturali. L’analisi effettuata ha riguardato le Frequently-Asked (da qui in poi, FAQ) estratte da siti Web dedicati a questo specifico settore informativo. Per la realizzazione dell’analisi testuale automatica è stato utilizzato il pacchetto software NOOJ 2, principalmente basato sull’uso di dizionari elettronici, grammatiche locali e automi e trasduttori a stati finiti (da qui in poi FST). Nel corso delle applicazioni del software, sono stati utilizzati i dizionari elettronici sviluppati dal Dipartimento di Scienze della Comunicazione dell’Università di Salerno, ovvero cinque dizionari del sistema DELA (dizionari elettronici di parole semplici e composte) ai quali è stato affiancato un dizionario elettronico specialistico del settore dell’Informazione Comunitaria Europea. Infine, grazie alla creazione ed all’applicazione di specifici FST, è stato possibile effettuare la lettura automatica del corpus prescelto per poi riconoscere, etichettare e formalizzare gli specifici pattern testuali contenuti dalle FAQ. Il procedimento di formalizzazione effettuato sarà utile, nelle ricerche future, a verificare l’esistenza di modelli linguistici ricorsivi nella produzione di FAQ online, quindi a produrre un sistema di risposta semi-automatico di cui potranno dotarsi i siti Web di Enti Locali e Amministrazioni Pubbliche. La metodologia linguistica descrittiva di riferimento per lo studio da noi effettuato è il Lessico-Grammatica, originariamente introdotto nella comunità scientifica europea da Maurice Gross all’Università Parigi 7 dopo il 1960. Scopo principale del Lessico-Grammatica è descrivere dettagliatamente tutti i meccanismi combinatori indissolubilmente legati alle concrete entrate lessicali. Uno dei risultati più recenti ed importanti della descrizione lessico-grammaticale è proprio la costruzione di tre software e lingware orientati all’analisi testuale automatica, ovvero UNITEX 3 e INTEX 4, oltre il già citato NOOJ.
2010
9788879164504
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11386/3001001
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact