Esta sección incluye enlaces a bases de datos que pueden resultar de utilidad para el estudio de las hablas andaluzas:
El Corpus Léxico de Inventarios recopila léxico tanto culto como cotidiano de la literatura del Siglo de Oro.
Para esta tarea se han centrado en muestras documentales como inventarios, tasaciones, cartas de arras y, en general, las relaciones de bienes conservadas en los registros notariales de la época. De esta manera, este recurso recoge una extensa oferta de archivos históricos provinciales españoles de numerosas provincias y municipios, así como americanos –de países como México, Chile, Perú, Bolivia, Colombia, etc.-, incluido el Archivo de Indias. De la documentación reunida, se han transcrito 615 documentos (5178 páginas originales, y 1.599.464 formas)
El corpus Oralia Diacrónica del Español es fruto de DiLEs, un grupo investigador de la Universidad de Granada, cuyo fin es dinamizar la investigación en Dialectología Histórica, especialmente la relacionada con la historia de las hablas andaluzas. De esta manera, elaboraron este corpus conformado por declaraciones de testigos, certificaciones médicas e inventarios de bienes peninsulares de los siglos XVI a XIX. Además, busca crear, mantener y publicar en línea ediciones digitales y, simultáneamente, corpus con anotación lingüística para así, aunar intereses de carácter filológico con otros propios de la lingüística computacional.
Aparte, en este recurso encontraremos una edición digital rigurosa de los documentos (respeto de las grafías originales, información sobre cambios de escribano, tachaduras, fragmentos de lectura dudosa, etc.); además de una anotación morfosintáctica de los textos (POS tags), con lematización y normalización de las variantes morfológicas y ortográficas, junto con una elaboración de buscadores potentes (CQP) útiles para el análisis histórico-lingüístico.
El Corpus Diacrónico y Diatópico del Español de América reúne tres conjuntos documentales; Cordiam-Documentos, Cordiam-Literatura y Cordiam-Prensa y tiene cuatro siglos de profundidad histórica.
Además, al tener solo textos escritos en América, constituye una base robusta para hacer una gramática histórica comprehensiva del español y, dada su amplia diversidad geográfica, permite investigar la dialectología histórica de la lengua española en América. Así, el Cordiam: a) ofrece una plantilla de metadatos para refinar las búsquedas, b) proporciona información cuantitativa del universo de palabras sobre el cual se ha realizado una búsqueda, c) permite ver y guardar el documento completo, d) posibilita guardar automáticamente las concordancias seleccionadas en una base de datos, y e) contiene una tipología textual para cada uno de los tres subcorpus.