Propostes de Projectes Obertes

Coses o idees que em venen de gust fer, però la vida em passa per sobre i no tinc temps. Contacta'ns si penses que pots fer encaixar una de les propostes en el teu expedient acadèmic.

Heràldica: Anàlisi Automàtic d'Escuts d'Armes en Art Medieval

Dificultat: Grau, màster

Orientat a: Visió per Computador, Intel·ligència Artificial, Anàlisi de Grafs, Scrapping.

Els escuts d'armes europeus no són només dissenys decoratius; representen la unió dinàstica d'una família reial i, per tant, contenen una rica sintaxi visual que ens permet reconstruir la genealogia d'un regne.
En aquest projecte, proposem que els estudiants s'endinsin en l'anàlisi de la presència d'escuts d'armes en les pintures medievals. L'objectiu és que puguin establir connexions entre aquests escuts i les dinasties a les quals pertanyen. A través d'aquesta exploració, no només aprendran sobre història i heràldica, sinó que també descobriran les fascinants narratives que s'amaguen darrere de cada imatge.

Localització Multi-Modal Automàtica de Fotografia Històrica

Dificultat: Màster

Orientat a: Visió per Computador, Intel·ligència Artificial, Scrapping.

Quan podem realment confiar en el text? Val més una imatge que mil paraules? En aquest projecte, ens proposem explorar la fascinant interacció entre text i visió en el context de la localització de fotografies. La nostra missió és desenvolupar models capaços de determinar quina quantitat de text és necessària per a interpretar escenes naturals i, alhora, identificar quan és possible ignorar el paisatge. A través d’aquesta investigació, busquem aprofundir en la relació entre imatges i paraules, i descobrir com aquestes dues dimensions poden treballar juntes per millorar la comprensió visual i textual del món que ens envolta.


Projects d'Estudiants

Descripció de Fotografia Històrica en Català

Alumne: È. Sànchez

La tasca de generació de descripcions d'imatges o image captioning ha tingut un creixent interés des del món de la recerca, però la major part d'aportacions estan orientades a les dades amb més recursos com l'anglès i el castellà, a més de ser temporalment contemporànies, el que dificulta la creació de models destinats a dades històriques en català de la Xarxa d'Arxius Comarcals. En aquest treball es comparen diferents tècniques d'adaptació del domini històric i lingüístic per cercar els millors mètodes per la creació d'un model capaç de descriure imatges d'arxiu en català traslladant el coneixement de models preentrenats sobre conjunts de dades més abundants i de qualitat en altres idiomes i èpoques històriques.

Sistema de 'Question Answering' en Documentació Legislativa Moderna

Alumne: A. Fernandez

La capacitat de recuperar informació legislativa de manera eficient a partir de documents oficials, com el Butlletí Oficial de l'Estat, és crucial. Aquests documents contenen informació essencial per a les pràctiques legals, polítiques i administratives. Tanmateix, el volum i la complexitat d'aquests textos dificulten l'accés a informació específica i rellevant. Aquest estudi pretén desenvolupar un sistema de Question Answering que extregui informació precisa del BOE. Es va ajustar el model Bidirectional Encoder Representations from Transformers per comprendre millor el llenguatge legal, i es va integrar amb el Large Language Model Meta AI en un marc de Retrieval-Augmented Generation

Sistema de Word Spotting per Documentació Legislativa Històrica

Alumne: M. Serra

Aquest projecte té com a objectiu desenvolupar un sistema automàtic per a la recuperació d'informació de documents històrics, facilitant l'estudi i la comprensió dels esdeveniments documentats, així com la classificació dels documents segons els seus temes. El sistema desenvolupat és capaç de trobar paraules en documents amb errors d'OCR i ofereix la capacitat de cercar documents relacionats amb la consulta, ampliant així l'abast de la cerca. Els resultats obtinguts mostren una millora significativa en la identificació de paraules similars en comparació amb els mètodes tradicionals de cerca exacta, a més de ser capaç de retornar documents rellevants en la majoria dels casos.

TerritoCAT: Un joc per anotar fotografies històriques de Catalunya

Alumne: A. Fernandez-Rascón

Aquest treball presenta el desenvolupament d’una aplicació mòbil anomenada TerritoCAT, dissenyada per fomentar la descoberta del patrimoni històric de Catalunya mitjançant la gamificació. Els usuaris poden localitzar punts històrics, visitar-los, fer-hi fotografies i conquerir-los, contribuint així a crear una xarxa visual col·laborativa. El sistema registra i visualitza l'activitat de l’usuari, permet la consulta de progressos i inclou una interfície intuïtiva. El projecte combina geolocalització, gestió de dades en temps real i una experiència d’usuari cuidada. La proposta es fonamenta en una arquitectura client-servidor, fa ús de tecnologies modernes com Flutter i MongoDB, i ha estat validada mitjançant proves pràctiques i iteracions incrementals.

Conversational Retrieval and Knowledge Modeling from Historical Documents

Alumne: P. Font

Historical documents hold invaluable memory, yet their contents are often difficult to access. This thesis presents a system designed to bridge this gap. We start with high-accuracy transcription to convert images into machine-readable text. This corpus powers a conversational chatbot using Retrieval-Augmented Generation (RAG) to deliver precise, context-aware answers. Meanwhile, a Knowledge Graph is gradually built through user interactions, capturing complex relationships and organizing knowledge over time. Overall, our system models historical knowledge in an accessible, user-friendly way.

Una perspectiva agèntica per a RAG basat en grafs

Alumne: J. C. Montero

La gestió eficient d'informació i la generació de respostes precises continua sent un repte, especialment quan cal integrar coneixements complexos de diferents fonts. Les arquitectures RAG (Retrieval-Augmented Generation) combinen recuperació d'informació amb generació de text, però presenten limitacions en la gestió de relacions complexes entre entitats. Aquest treball proposa una arquitectura agèntica basada en grafs de coneixement, que incorpora agents intel·ligents per optimitzar la recuperació i la generació de respostes en contextos amb altes interrelacions. La proposta s'ha aplicat a l'orientació acadèmica de Treballs de Fi de Grau, modelant les relacions entre investigadors, publicacions i àrees d'estudi. Els resultats mostren que l'ús de grafs millora significativament les respostes en consultes que requereixen entendre i explotar connexions entre entitats, mentre que els models RAG estàndard són més eficaços en preguntes temàtiques simples.

Repte Epidèmies

Repte 2024

Primera convocatòria del repte epidèmies!

Alumnes del Grau en Enginyeria de Dades; fent servir el seminari en propagació d'etiquetes de l'assignatura 'Anàlisi de Grafs i Cerca d'Informació', podreu construir un model de predicció per la pandèmia de COVID (2020-2021)?

És senzill:
  • Primer: Completeu el vostre model SIR al notebook proporcionat a l'aula.
  • Segon: Proposeu els "num_casos" de l'item de la llista de grafs amb index 241.
  • Tercer: Proposeu 11 items addicionals a la llista de grafs, corresponent a les prediccions de les següents setmanes (recordeu que els items afegits seran de tipus nx.Graph, amb les mateixes propietats que els anteriors).
  • Quart: Empaqueteu la vostra llista de grafs en un 'pickle' i pujeu-lo al formulari de participació.
  • Participeu tant com vulgueu!

Contact