L’articolo presenta uno studio che s’inquadra all’intersezione della sociolinguistica con la lessicografia delle lingue tecnico-speciali e la linguistica computazionale. Con i metodi della corpus linguistics, sono analizzati gli usi lessicali dei testi scritti relativi ai processi d’informazione e comunicazione pubblica degli organismi comunitari. L’informazione comunitaria è veicolata attraverso parole terminologiche tecnico-specialistiche, spesso elencate in glossari istituzionali. Dal punto di vista morfo grammaticale, tali parole si presentano come repertori di termini registrati in virtù della loro maggiore frequenza nei testi e non in rapporto ai tratti distintivi delle loro realizzazioni lessicografiche e delle diverse tipologie testuali. Lo studio riguarda la descrizione delle strutture compositive delle polirematiche, unità lessicali superiori rilevate come fisse nei glossari istituzionali comunitari e, successivamente, l’etichettatura morfo-grammaticale per la costruzione di dizionari elettronici di dominio. I domini indagati riguardano rilevanti politiche comunitarie: “Società dell’Informazione”, “Pari Opportunità”, “Fondi strutturali”. Le entrate lessicali dei dizionari elettronici di dominio sono state testate attraverso corpora testuali, costruiti seguendo l’approccio variazionista, dunque, distinti per processi comunicativi pertinenti l’informazione comunitaria. Attraverso l’uso di applicativi di Natural Language Processing sono state tratte indicazioni sulle distribuzioni di frequenza utili per indagare i processi di polirematicizzazione, di terminologizzazione ed i processi di variazione linguistica tra le differenti tipologie testuali delle attività comunicative istituzionali.
Strutture lessicali delle informazioni comunitarie all’interno di domini specialistici
ELIA, Annibale;MONTELEONE, Mario;VELLUTINO, Daniela;MARANO, FEDERICA;
2010-01-01
Abstract
L’articolo presenta uno studio che s’inquadra all’intersezione della sociolinguistica con la lessicografia delle lingue tecnico-speciali e la linguistica computazionale. Con i metodi della corpus linguistics, sono analizzati gli usi lessicali dei testi scritti relativi ai processi d’informazione e comunicazione pubblica degli organismi comunitari. L’informazione comunitaria è veicolata attraverso parole terminologiche tecnico-specialistiche, spesso elencate in glossari istituzionali. Dal punto di vista morfo grammaticale, tali parole si presentano come repertori di termini registrati in virtù della loro maggiore frequenza nei testi e non in rapporto ai tratti distintivi delle loro realizzazioni lessicografiche e delle diverse tipologie testuali. Lo studio riguarda la descrizione delle strutture compositive delle polirematiche, unità lessicali superiori rilevate come fisse nei glossari istituzionali comunitari e, successivamente, l’etichettatura morfo-grammaticale per la costruzione di dizionari elettronici di dominio. I domini indagati riguardano rilevanti politiche comunitarie: “Società dell’Informazione”, “Pari Opportunità”, “Fondi strutturali”. Le entrate lessicali dei dizionari elettronici di dominio sono state testate attraverso corpora testuali, costruiti seguendo l’approccio variazionista, dunque, distinti per processi comunicativi pertinenti l’informazione comunitaria. Attraverso l’uso di applicativi di Natural Language Processing sono state tratte indicazioni sulle distribuzioni di frequenza utili per indagare i processi di polirematicizzazione, di terminologizzazione ed i processi di variazione linguistica tra le differenti tipologie testuali delle attività comunicative istituzionali.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.