Estructura

A. Estructura del vocabulari
Nombre total d'ocurrències del corpus (N): 1.422.388;
Nombre total de lemes (V): 22.262;
Nombre total d'accepcions: 30.821;
Índex de riquesa lèxica (Carrol CTTR): 13,198;
Lemes de freqüència alta: 112 (72 gramaticals i 40 lèxics);
Lemes de freqüència mitjana: 415;
Lemes de freqüència baixa: 13.252;

Hàpax (H): 8.443:
%H (percentatge d'hàpax sobre el total d'N): 0,59%;
Freqüència màxima (abs.): 114.263;
Freqüència màxima (rel.): 80,332/l.000.


B. Estructura del diccionari
S’analitzen totes les paraules del text, inclosos els noms propis. Tanmateix, la informació d’una entrada del DiCCA-XV presenta característiques diferents segons que es tracti d’unitats del vocabulari o de l’onomàstica. 

1. Per al vocabulari general, l’estructura s’organitza a partir de les dades següents:

1.1. El lema de cada una de les entrades del diccionari apareix en primer lloc. En els casos d’homonímia, cada un dels lemes apareix acompanyat d’un superíndex.

1.1.1. El lema agrupa les diverses formes que pot presentar un terme en virtut de la seva estructura morfològica, d’acord amb la tradició lexicogràfica: gènere i nombre en els elements nominals (determinants, substantius i adjectius), i mode, temps, persona i nombre en els verbals. En els pronoms personals, però, atenent al caràcter gramatical de la variació de cas, agrupem les formes de nominatiu, acusatiu i datiu sota un lema únic.

1.1.2. Sota un mateix lema s’agrupen també totes les variants formals del vocable, fonètiques i gràfiques (alternances artificio/arteficio, banyar/bañar/vañar, barca/barqua, bermejo/mermejo, bisahuelo/visaguelo, breujedad/breuedat/breuidat, burla/bulra, ceujl/civil, cobrir/cubrir, coraçon/corazon, cosa/cossa, deffuncion/defunsion, ideota/ydiota...), sempre que presentin una mateixa història etimològica i, en el corpus, un mateix valor semàntic.

Els substantius masculins o femenins amb el tret [+animat] i amb formació de gènere regular en romanç (ayo -a, emperador -ora) tenen una entrada única, i es marquen amb la funció de sust. masc./fem. En canvi, els femenins irregulars que deriven directament d'una forma llatina tenen entrada independent (dea, emperatriz).

Quan en la formació del terme intervenen diferents morfemes derivatius (calor/calura, carnoso/carnudo, callejon/calliço...), o bé quan respon a processos diferents —veu popular, cultisme o manlleu— o quan la seva evolució és pròpia d’un sistema diferent del castellà —català, aragonès— (coger/collir/collegir, canonigo/canonje) cada un d’ells té entrada com a lema independent, i es dóna constància de l’existència de la variant lèxica a la fitxa corresponent.

Els diminutius i augmentatius no lexicalitzats (boca/boquiqua, poco/poquito, alto/altissimo) són considerats també variants formals del lema, sempre que parteixin del mateix radical lèxic. En canvi, presenten entrada independent quan en la seva formació intervenen radicales diferents (agudo/acutissimo). També en aquest cas, es dóna constància de la variant lèxica a la fitxa corresponent.

1.1.3. La forma del lema correspon a la grafia més habitual a la llengua culta de finals del segle XV, amb preferència per la forma documentada més moderna, però sempre d’acord amb la norma gràfica de l’època (amb absència d’accents, dièresis, etc.). Quan hi ha diversos lemes d’una mateixa família lèxica es lematitzen tots ells segons el mateix criteri.

1.1.4. Les locucions i frases llatines, destacades en cursiva, apareixen globalment en una entrada única, ordenades pel primer element (ab intestato, ipso facto). Les locucions castellanes, en canvi, apareixen agrupades sota el lema corresponent al terme considerat com a nucli de l’expressió, independentment de la seva posició (por amor de, en ayunas, de balde, bien que, boca ayuso, censal muerto). Les locucions verbals s’agrupen sota el lema corresponent al nom o a l’adjectiu que contenen (dar alas, perder la cabeça, haver a coraçon, hazer se fuerte). Finalment, las frases proverbials s’agrupen sota el lema del primer terme lèxic que contenen (no te metas entre cebolla y su cuero, si te dieren la cabrilla acorre con tu soguilla).

1.2. Se cita succintament l’etimologia proposada en el Diccionario crítico etimológico castellano e hispánico (DCECH) per J. Corominas (amb la col·laboració de J.A. Pascual). En el cas d’alguns catalanismes, partim del Diccionari etimològic i complementari de la llengua catalana (DECLE), també de Joan Coromines i, ocasionalment, del Diccionari català valencià balear, d’Alcover-Moll. I per als arabismes tenim en compte les dades del Diccionario de arabismos y voces afines en iberoromance (DA), de Federico Corriente.

S’assenyala la data de la primera documentació en el corpus i la de la primera documentació citada en el DCECH.

Quan la paraula no apareix al DCECH, o bé (com passa amb nombrosos derivats) no s’hi cita la data de primera documentació, apareixen els signes “Ø” o bé “s.f.”, respectivament, en el lloc corresponent. En aquests dos casos, i també quan la data del DCECH és posterior a 1400, s'inclou la data de la primera documentació fiable del CORDE (consulta: setembre-desembre 2013).

1.3. Quan la paraula apareix als diccionaris de Nebrija, a la primera edició del Lexicon o Dictionarium ex sermone latino (Nebrija Lex. 1492) o del Dictionarium ex hispaniensi in latino sermonem o Vocabulario español latín (Nebrija Voc1. ca. 1495) o bé és un terme afegit a la segona edició del Vocabulario (Nebrija Voc2. 1513), coetanis dels nostres textos, es reprodueix l’entrada corresponent. Quan es tracta de mots que només apareixen en el Lexicon com a lema llatí, aquest apareix precedit d’asterisc.

1.4. S’ofereix una relació de tots els termes del corpus relacionats a partir d’una mateixa base etimològica.

1.5. Es proporcionen dades quantitatives relacionades amb la frequència absoluta i relativa dels vocables en el nostre corpus.

1.6. S’especifiquen totes les variants formals i les locucions, amb expressió, entre parèntesis, del nombre d’ocurrèncias de cada una d’elles. En els verbs s’assenyala, també entre parèntesis, el règim prepositiu.

1.7. També s’especifiquen totes les formes gramaticals (por ordre alfabètic), amb el nombre d’ocurrències de cada una d’elles entre parèntesis.

1.8. Finalment, es defineixen les diferents accepcions del vocable.

1.8.1. Per a cada una de les accepcions s’especifica la seva funció i sentit, establerts sempre a partir de l’ús real en els textos.

1.8.1.1. En les definicions de les unitats lèxiques, hem procurat partir de termes hiperònims que facilitin les posteriors cerques de veus relacionades semànticament.

1.8.1.2. En el cas dels substantius, diferenciem entre substantius que presenten variació de gènere en relació amb certes característiques del referent (amigo -a, gato -a), marcats com sust. masc./fem., i aquells que, sense relació amb el referent, poden presentar alternances de gènere (blancor, dote) marcats com sust. masc. o fem.

1.8.1.3. En els adjectius, marquem entre claudàtors el substantiu al qual s’aplica quan té un valor exclusiu:

rucio: [Caballería] que tiene el pelo de color mezclado de blanco y pardo claro.

1.8.1.4. En els verbs, expressem sempre els arguments (<subjecte> [objecte]). En els casos de verbs intransitius que presenten usos transitius (amb acusatius interns o complements intrínsecs) es marca entre parèntesis aquesta possibilitat en el camp de la funció, i a la definició s’especifica també l’objecte entre parèntesis:

altercar: verbo intrans./(trans.). Discutir <varias personas> violentamente ([algo]).

Paral·lelament, marquem com verbo trans./(intrans.) la funció d’aquells verbs transitius que presenten usos absoluts i, en aquest cas, amb els claudàtors entre parèntesis per tal d’indicar la possibilitat de la integració semàntica de l’objecte:

beber: verbo trans./(intrans.). Tomar <una persona o un animal> ([)un líquido(]).

1.8.2. Les accepcions s’han ordenat atenent al seu valor semàntic i funcional, des dels valors primaris als derivats semànticament o funcional.

1.8.3. Les locucions apareixen a continuació dels valors fonamentals, ordenades d’acord amb la seva funció (locucions substantives, adjectives, adverbials, prepositives i conjuntives, en aquest ordre). Les locucions verbals apareixen en últim lloc. En totes elles, igual com en els lemes, es respecta el criteri gràfic de l’època.

Quan una paraula forma part d’una expressió pluriverbal, s’assenyala aquesta circumstància i se citen els exemples corresponents, però el seu valor semàntic s’especifica a la fitxa del lema considerat bàsic (cf. 1.1.4), al qual es remet.

1.8.4. En els mots i locucions d’altres llengües (generalment, del llatí) només es dóna l’equivalència castellana (en cursiva).

1.8.5. Es marquen també en aquest apartat les ocurrències de cada una de les accepcions, així com la seva distribució en els quatre tipus de textos.

1.8.6. Per a cada accepció, se citen quatre exemples, si és possible, un de cada una de les quatre tipologies textuals considerades.

1.8.7. Se citen les variants lèxiques de cada una de las accepcions, així com els sinònims presents en el corpus.


2. Les fitxes onomàstiques presenten les dades següents:

2.1. El lema. En els casos en què una mateixa forma identifica referents diferents, es tracta de manera similar als casos d’homonímia de l’apartat del vocabulari general, amb una entrada per a cada forma, diferenciades amb un superíndex.

2.2. No s’analitza l’etimología del terme ni tampoc, en conseqüència, la família etimològica. Només s’esmenta la data de primera documentació en el nostre corpus.

2.3. Si la paraula (o algun dels seus components en el cas de les formes complexes) apareix en algun dels diccionaris de Nebrija, que sí que inclouen noms propis en la seva primera edició, es reprodueix l’entrada corresponent.

2.4. S’assenyalen les dades quantitatives relacionades amb la freqüència del terme i de les seves variants formals, així com de la seva distribució en els textos.

2.5. Per a cada lema es proporciona, sempre que s’ha pogut localitzar, una succinta informació de caràcter enciclopèdic. De vegades, però, només podem facilitar la informació que deriva del propi text en què apareix.

2.6. Finalment, presentem quatre exemples, elegits amb criteris similars als que s’han aplicat per al vocabulari comú.


C. Estructura de la base de dades

La base de dades del DiCCA-XV consta de diverses taules interrelacionades que permeten realitzar cerques a partir de qualsevol dels seus camps. Per això, a més de la consulta del diccionari a partir del lemari, la interfície d’usuari permet fer consultes complexes segons diferents criteris:

a) gramaticals: obtenció de llistats de locucions adverbials, o de locucions verbals, o de verbs amb un determinat règim preposicional o amb determinat morfema flexiu o derivatiu...

b) lèxics i semàntics: conjunt de paraules d’un determinat camp semàntic, o llistat de verbs que seleccionen un argument determinat, o d’adjectius que exigeixen cert tret semàntic del mot que complementen...

c) etimològics: relació dels llatinismes, o dels manlleus del català o de l’italià, o dels neologismes del segle XV...

d) onomàstics: llistats de topònims de determinat àmbit geogràfic, o d’antropònims propis d’una zona o d’una població, o llistats de personatges mitològics o literaris...

d) textuals: obtenció de llistats de tots els contextos de determinat lema, o dels mots que apareixen en relació de coocurrència (en les dues posicions anteriors i posteriors), o dels que presenten determinada estructura sintàctica...

La possibilitat d’entrecreuar aquests criteris permet obtenir una infinitat de resultats amb els quals esperem facilitar la tasca investigadora de filòlegs i historiadors i, en general, de tots aquells que s’interessen per una època i una àrea geogràfica fonamentals per a la configuració de l’espanyol modern.