Estructura
1. Estructura del vocabulari
1.1. Valors generals
Nombre total d'ocurrències del corpus (N): 2.234.436;
Nombre total de lemes (V): 26.337;
Nombre total d'accepcions: 36.064;
Índex de repetició /N/V): 84,84;
Índex de riquesa lèxica (Carrol CTTR: V/√2N): 12,45;
Nombre de lemes neològics: 5.665;
Índex de repetició dels neologismes: 5,06;
Lemes de freqüència molt alta (fabs > 1700; frel > 1/1000): 116; (amb 1.103.167 ocurrències i un percentatge de lectura de 62,86%);
Lemes de freqüència alta (fabs > 300; frel > 0,17/1000): 445;
Lemes de freqüència mitjana (fabs > 30; frel > 0,015/1000): 2.866;
Lemes de freqüència baixa ((fabs < 30 i >1): 11.836;
Hàpax (H): 8.996;
%H (percentatge d'hàpax sobre el total de V): 37,08%;
Freqüència màximaabs: 141.811
Freqüència màximarel: 80,81/l.000.
1.2. Valors segons la tipologia textual
Textos A:
Nombre d'ocurrències (Na): 443.728;
nombre de lemes (Va): 9.049;
nombre d'accepcions: 11.398;
índex de repetició (Na/Va): 48,75;
nombre de lemes exclusius: 5.029 (= 55,57%);
índex de repetició dels lemes exclusius: 6,57;
nombre de lemes neològics: 1.313;
índex de repetició dels lemes neològics: 5,75;
índex de riquesa lèxica (Carrol CTTR: V/√2N): 9,63;
Textos B:
Nombre d'ocurrències (Nb): 455.633;
nombre de lemes (Vb): 10.120;
nombre d'accepcions: 15.012;
índex de repetició (Nb/Vb): 43,07;
nombre de lemes exclusius: 3.910 (= 38,64%);
índex de repetició dels lemes exclusius: 4,12;
nombre de lemes neològics: 2.742;
índex de repetició dels lemes neològics: 3,13;
índex de riquesa lèxica (Carrol CTTR: V/√2N): 10,83;
Textos C:
Nombre d'ocurrències (Nc): 456.967;
nombre de lemes (Vc): 10.389;
nombre d'accepcions: 14.917;
índex de repetició (Nc/Vc): 42,32;
nombre de lemes exclusius: 4.163 (= 40,07%);
índex de repetició dels lemes exclusius: 2,64;
nombre de lemes neològics: 1.352;
índex de repetició dels lemes neològics: 4,23;
índex de riquesa lèxica (Carrol CTTR: V/√2N): 11,08;
Textos D:
Nombre d'ocurrències (Nd): 439.796;
nombre de lemes (Vd): 9.807;
nombre d'accepcions: 14.250;
índex de repetició (Nd/Vd): 44,69;
nombre de lemes exclusius: 2.898 (= 30,17%);
índex de repetició dels lemes exclusius: 2,24;
nombre de lemes neològics: 2.162;
índex de repetició dels lemes neològics: 3,14;
índex de riquesa lèxica (Carrol CTTR: V/√2N): 10,48;
Textos E:
Nombre d'ocurrències (Nd): 438.312;
nombre de lemes (Vd): 9.807;
nombre d'accepcions: 14.250;
índex de repetició (Nd/Vd): 44,69;
nombre de lemes exclusius: 2.898 (= 30,17%);
índex de repetició dels lemes exclusius: 2,24;
nombre de lemes neològics: 2.162;
índex de repetició dels lemes neològics: 3,14;
índex de riquesa lèxica (Carrol CTTR: V/√2N): 10,48;
1.3. Valors funcionals
Valors nominals (sust., adj., pron. i loc. nom.):
Nombre d'accepcions: 16.189;
nombre d'ocurrències: 681.148;
índex de repetició: 42,07;
percentatge de lectura: 38,82%
Valors verbals (verbs i loc. verb.):
Nombre d'accepcions: 5.639;
nombre d'ocurrències: 295.437;
índex de repetició: 52,39;
percentatge de lectura: 16,83%
Valors adverbials (adv. pron. adv. i loc. adv.):
Nombre d'accepcions: 1.503;
nombre d'ocurrències:101.522;
índex de repetició: 67,54;
percentatge de lectura: 5,78%
Valors dels connectors i articles (prep. i loc. prep., conj. i loc. conj.):
Nombre d'accepcions: 589;
nombre d'ocurrències: 617.515;
índex de repetició: 1.048,41;
percentatge de lectura: 35,19%
Valors de l'onomàstica (nom. prop.):
Nombre d'accepcions: 8.503;
nombre d'ocurrències: 44.905;
índex de repetició: 5,28;
percentatge de lectura: 2,56%
Formes d'altres procedències (llatí, grec, català, àrab, hebreu...), frases proverbials i elements marginals:
Nombre d'accepcions: 959;
nombre d'ocurrències: 14.246;
índex de repetició: 14,85;
percentatge de lectura: 0,82%
2. Estructura de la base de dades
La base de dades del DiCCA-XV consta de diverses taules interrelacionades que permeten realitzar cerques a partir de qualsevol dels seus camps. Per això, a més de la consulta del diccionari a partir del lemari, la interfície d’usuari permet fer consultes complexes segons diferents criteris:
a) gramaticals: obtenció de llistats de locucions adverbials, o de locucions verbals, o de verbs amb determinat morfema flexiu o derivatiu...
b) lèxics i semàntics: conjunt de paraules d’un determinat camp semàntic, o llistat de verbs que seleccionen un argument determinat, o d’adjectius que exigeixen cert tret semàntic del mot que complementen...
c) etimològics: relació dels llatinismes, o dels manlleus del català o de l’italià, o dels neologismes del segle XV...
d) onomàstics: llistats de topònims de determinat àmbit geogràfic, o d’antropònims propis d’una zona o d’una població, o llistats de personatges mitològics o literaris...
d) textuals: obtenció de llistats de tots els contextos de determinat lema, o dels mots que apareixen en relació de coocurrència (en les dues posicions anteriors i posteriors), o dels que presenten determinada estructura sintàctica...
La possibilitat d’entrecreuar aquests criteris permet obtenir una infinitat de resultats amb els quals esperem facilitar la tasca investigadora de filòlegs i historiadors i, en general, de tots aquells que s’interessen per una època i una àrea geogràfica fonamentals per a la configuració de l’espanyol modern.