Quanti testi contiene il corpus?
Il corpus contiene complessivamente 564 testi: 277 italiani e 287 spagnoli.
Il corpus DiLeGIS raccoglie testi normativi italiani e spagnoli relativi a tematiche di genere, pubblicati dal 1950 ad oggi.
Realizzato nell'ambito del progetto PRIN DiLeGIS, questo strumento è pensato per facilitare ricerche, analisi linguistiche e studi comparativi sull'evoluzione del linguaggio giuridico in relazione alle questioni di genere.
from dilegis_corpus import Corpus, TextAnalyzer corpus = Corpus(language=['it', 'es'], start_year=1950, end_year=2025) gender_keywords = ['donna', 'pari opportunità', 'femminicidio', 'identità di genere'] selected_texts = corpus.filter_by_keywords(gender_keywords) analyzer = TextAnalyzer(selected_texts) keyword_freq = analyzer.get_frequency_distribution() concordances = analyzer.get_concordances('pari opportunità', window=5) analyzer.export_results(keyword_freq, format='csv', filename='gender_frequency.csv') analyzer.export_concordances(concordances, format='html', filename='pari_opportunità.html')
Il corpus contiene complessivamente 564 testi: 277 italiani e 287 spagnoli.
I testi sono stati individuati attraverso ricerche mirate per parole-chiave (ad esempio: donna, femminicidio, pari opportunità, identità di genere) sui portali ufficiali italiani (Normattiva) e spagnoli (BOE), seguite da una lettura e selezione critica da parte dei ricercatori.
Sì, il corpus è consultabile online tramite la piattaforma Sketch Engine (previa autorizzazione gratuita) oppure scaricabile integralmente per consultazioni offline.
I testi sono disponibili in formato PDF e TXT, adatti sia a consultazioni generali sia ad analisi linguistiche avanzate.
Il corpus è pensato per analisi linguistiche, studi comparativi tra Italia e Spagna, ricerche accademiche e divulgative su linguaggio giuridico, genere e cittadinanza..
Puoi citarlo indicando: «Corpus DiLeGIS (1950-oggi), PRIN DiLeGIS – Language, gender and citizenship in democratic societies, Italia-Spagna».