Knowledge Base Construction Methods for Neuro-Symbolic IA Exploitation

Rincón Yáñez, Diego Alberto

Knowledge representation has long been considered a key task in the information sciences. Nowadays, with AI's broad scope in all aspects of daily life, understanding how to represent, display, and analyze human knowledge has become increasingly vital. This thesis relies on computational systems' inherent ability to deliver comprehensive and accurate responses using a combination of inductive learning, commonly known as Deep Learning, and logic learning; the topic is Neuro-Symbolic AI (NeSyAI). To fully use the NeSyAI system-like characteristics, Knowledge Bases must be built, which are a collection of statements ordered to form a Graph type network structure, also known as a Knowledge Graph (KGs) in the semantic community. Knowledge Graphs can offer background information on one or more domains, adding extra context to the task at hand. This thesis offers numerous methods for integrating contextual knowledge into Neuro-Symbolic AI systems by producing semantically enhanced knowledge bases for later exploitation. Initially, the Internet of Things (IoT) real was explored, where sensor network characteristics are mapped into a traditional OWL-type ontology using and building a knowledge base of the sensor, events and observations with the aim of predicting events and places. For this, a state-of-the-art ontology was created for IoT event recognition purposes, followed by the implementation of a convolutional Neuron Network, which is able to take the KG and discover new wave information. These two tasks combined in a single flow produce and validate a new architectural pattern for Neuro-Symbolic AI. To validate the proposed approach, two use cases were implemented: a volcano discovering seismic events and a cleanroom monitoring environment for discovering pollution events. In the second part, knowledge graph embeddings (KGE) were exploited to push the boundaries of the knowledge base construction task in several alleys, such as knowledge validation, question answering, and link prediction from the Neuro-symbolic AI perspective. These tasks were used along with well-known metrics to test the construction approaches from prosaic text leveraged by the external knowledge of one of the biggest Open KG available, such as DBpedia and transformers-type models, arriving at a compelling results compared to the current SOTA, allowing to test also new and improved NeSy AI architecture patterns. On the other hand, the need to explore synthetic data generation was raised considering the need for continuous experimentation and automation to test the experimentation scenarios. Finally, an initial explainability approach for KGE was conceptualized and applied to the commodities tradeflow prediction use case.

La rappresentazione della conoscenza è stata a lungo considerata un compito chiave nelle scienze dell'informazione. Al giorno d'oggi, con l'ampia portata dell'intelligenza artificiale in tutti gli aspetti della vita quotidiana, capire come rappresentare, visualizzare e analizzare la conoscenza umana è diventato sempre più vitale. Questa tesi si basa sulla capacità intrinseca dei sistemi computazionali di fornire risposte complete e accurate utilizzando una combinazione di apprendimento induttivo, comunemente noto come deep learning, e apprendimento logico; l'argomento è l'IA neuro-simbolica (NeSyAI). Per utilizzare appieno le caratteristiche del sistema NeSyAI, è necessario costruire basi di conoscenza, che sono una raccolta di istruzioni ordinate per formare una struttura di rete di tipo grafo, nota anche come knowledge graph (KG) nella comunità semantica. I knowledge graph possono offrire informazioni di base su uno o più domini, aggiungendo ulteriore contesto all'attività da svolgere. Questa tesi offre numerosi metodi per integrare la conoscenza contestuale nei sistemi di intelligenza artificiale neuro-simbolica producendo basi di conoscenza semanticamente migliorate per un successivo sfruttamento. Inizialmente è stato esplorato l'Internet of Things (IoT) reale, dove le caratteristiche della rete di sensori sono state mappate in un'ontologia tradizionale di tipo OWL utilizzando e costruendo una base di conoscenza del sensore, degli eventi e delle osservazioni con l'obiettivo di prevedere eventi e luoghi. A questo scopo, è stata creata un'ontologia all'avanguardia per scopi di riconoscimento degli eventi IoT, seguita dall'implementazione di una rete di neuroni convoluzionali, in grado di prendere il KG e scoprire nuove informazioni sulle onde. Questi due compiti, combinati in un unico flusso, producono e convalidano un nuovo modello architettonico per l'IA neuro-simbolica. Per convalidare l'approccio proposto, sono stati implementati due casi d'uso: un vulcano che scopre eventi sismici e un ambiente di monitoraggio di una camera bianca per scoprire eventi di inquinamento. Nella seconda parte, gli incorporamenti dei grafici della conoscenza (KGE) sono stati sfruttati per ampliare i confini del compito di costruzione della base di conoscenza in diversi percorsi, come la convalida della conoscenza, la risposta alle domande e la previsione dei collegamenti dalla prospettiva dell'IA neurosimbolica. Questi compiti sono stati utilizzati insieme a metriche ben note per testare gli approcci di costruzione di testi prosaici sfruttati dalla conoscenza esterna di uno dei più grandi open KG disponibili, come DBpedia e modelli di tipo trasformatore, arrivando a risultati convincenti rispetto all'attuale SOTA, consentendo di testare anche modelli di architettura AI NeSy nuovi e migliorati. D'altro canto, è stata sollevata la necessità di esplorare la generazione di dati sintetici considerando la necessità di sperimentazione continua e di automazione per testare gli scenari di sperimentazione. Infine, è stato concepito un approccio iniziale di spiegabilità per KGE e applicato al caso d'uso della previsione dei flussi commerciali di materie prime.

Knowledge Base Construction Methods for Neuro-Symbolic IA Exploitation / Diego Alberto Rincón Yáñez - Università degli Studi di Salerno. , 2024 Feb 01. XXXV ciclo. ciclo, Anno Accademico 2021-2022.