CORPUS DILEGIS (IT-ES)
LINGUA, GENERE E CITTADINANZA

Il corpus DiLeGIS raccoglie testi normativi italiani e spagnoli relativi a tematiche di genere, pubblicati dal 1950 ad oggi.
Realizzato nell'ambito del progetto PRIN DiLeGIS, questo strumento è pensato per facilitare ricerche, analisi linguistiche e studi comparativi sull'evoluzione del linguaggio giuridico in relazione alle questioni di genere.

browser bar

from dilegis_corpus import Corpus, TextAnalyzer corpus = Corpus(language=['it', 'es'], start_year=1950, end_year=2025) gender_keywords = ['donna', 'pari opportunità', 'femminicidio', 'identità di genere'] selected_texts = corpus.filter_by_keywords(gender_keywords) analyzer = TextAnalyzer(selected_texts) keyword_freq = analyzer.get_frequency_distribution() concordances = analyzer.get_concordances('pari opportunità', window=5) analyzer.export_results(keyword_freq, format='csv', filename='gender_frequency.csv') analyzer.export_concordances(concordances, format='html', filename='pari_opportunità.html')

FAQ

Quanti testi contiene il corpus?

Arrow icon

Il corpus contiene complessivamente 564 testi: 277 italiani e 287 spagnoli.

Come sono stati selezionati i testi?

Arrow icon

I testi sono stati individuati attraverso ricerche mirate per parole-chiave (ad esempio: donna, femminicidio, pari opportunità, identità di genere) sui portali ufficiali italiani (Normattiva) e spagnoli (BOE), seguite da una lettura e selezione critica da parte dei ricercatori.

Posso consultare liberamente il corpus?

Arrow icon

Sì, il corpus è consultabile online tramite la piattaforma Sketch Engine (previa autorizzazione gratuita) oppure scaricabile integralmente per consultazioni offline.

In che formato è disponibile il corpus?

Arrow icon

I testi sono disponibili in formato PDF e TXT, adatti sia a consultazioni generali sia ad analisi linguistiche avanzate.

Per quali scopi posso usare il corpus DiLeGIS?

Arrow icon

Il corpus è pensato per analisi linguistiche, studi comparativi tra Italia e Spagna, ricerche accademiche e divulgative su linguaggio giuridico, genere e cittadinanza..

Come posso citare il corpus nelle mie ricerche?

Arrow icon

Puoi citarlo indicando: «Corpus DiLeGIS (1950-oggi), PRIN DiLeGIS – Language, gender and citizenship in democratic societies, Italia-Spagna».