1. Introducción
El objetivo de este capítulo es proporcionar una visión general de los estudios de corpus sobre fonética y fonología actualmente disponibles en español. Dado que la fonética y la fonología tienen en cuenta la producción y recepción del habla, la recopilación de material sonoro es obligatoria en algún momento; el registro de sonido debe transcribirse para poder buscarse en él con posterioridad: se convierte en un corpus. El estudio de la fonética y la fonología incorpora además diferentes unidades, ya sean segmentales (fonemas, alófonos) o suprasegmentales (p. ej., entonación, duración, velocidad del habla), y la transcripción del material de sonido a menudo se enriquece con mediciones acústicas y/o anotaciones simbólicas, para reflejar los diferentes intereses de estudio. Por su parte, los datos se pueden registrar en entornos aislados, con una acústica perfecta, comúnmente llamados datos de laboratorio, o pueden incluir habla espontánea (p. ej., entrevistas, debates, conversaciones). Así mismo, los estudios fónicos cubren múltiples áreas de especialidad, como la lingüística clínica, las tecnologías del habla, la fonética forense o el español como lengua extranjera, entre muchos otros. En todo caso, el estudio de los datos fónicos está profundamente interrelacionado con la evolución del hardware (calidad de los micrófonos, nuevos formatos de grabación, dispositivos mejorados [móviles, grabadoras]) y la evolución del software, ya que su recopilación y análisis son cada vez más sofisticados a medida que pasa el tiempo; también cobrará especial relevancia la forma en que se cuantifican los datos mediante la aplicación de múltiples pruebas estadísticas. Así pues, teniendo en cuenta la importante cantidad de bibliografía sobre el tema de este capítulo, las referencias se seleccionaron de acuerdo con dos criterios principales: su publicación reciente o su importancia en términos de número de citas. En definitiva, el principal interés de este capítulo es presentar una breve panorámica sobre cómo la metodología de corpus es determinante y útil en el desarrollo de estudios fónicos.
Palabras clave: fonética/fonología; laboratorio; acústica; segmental; suprasegmental
The aim of this chapter is to provide an overview of the corpus studies on phonetics and phonology currently available in Spanish; since phonetics and phonology take into account the production and reception of speech, the collection of sound material is mandatory at some point; the sound recorded must be transcribed and then it becomes manipulable and searchable: it turns into a corpus. The study of phonetics and phonology considers different units, be they segmental (phonemes, phones) or suprasegmental (e.g., intonation, duration, speech rate), and the transcription of the sound material is often enriched with acoustic measurements and/or symbolic annotations reflecting the different interests of study. Data can be recorded in isolated environments, with a perfect acoustic, commonly called laboratory data, or they can include spontaneous speech (e.g., interviews, debates, conversations). Phonic studies also cover multiple specific areas, like clinical linguistics, speech technologies, forensic phonetics or Spanish as a foreign language, among many others. Considering the important amount of literature on this topic, the references presented in this chapter have been selected according to two main criteria: their recent publication and their importance in terms of number of citations. Generally speaking, the study of phonic data is deeply interrelated with the evolution of hardware (quality of microphones, new recording formats, improved devices (mobile, recorders) and the evolution of software, being their collection and analysis more and more sophisticated with time, as well as the way the data are quantified by applying multiple statistical tests. In conclusion, the main concern of this chapter is to outline how a methodology based in corpus could be useful to develop phonic studies.
Key words: phonetics/phonology; laboratory; acoustic; segmental; suprasegmental
2. Conceptos fundamentales
Fonética y fonología constituyen dos disciplinas que pretenden abordar el estudio de sonidos segmentales, como los fonos, y suprasegmentales, como la entonación, desde perspectivas distintas (Quilis 1993; Martínez Celdrán y Fernández Planas 2007). La fonética tiene una base acústica y, por tanto, se basa en la concreción, mientras que la fonología atiende a la figura mental del sonido y, en tal sentido, prioriza la abstracción (Fernández Planas 2007). La fonología tiene una extensión menor que la fonética, ya que limita los rasgos de los sonidos del entorno físico del hablante a aquellos que delimitan significados y que son, por tanto, puramente comunicativos (Ladefoged y Johnson 2011; Quilis 1981).
En general, las propiedades que se estudian en las investigaciones fónicas tienen en cuenta fenómenos acústicos, como la duración, la intensidad, la frecuencia fundamental o la velocidad de habla, entre otros, pero también factores motores, como la realización articularia o la distorsión perceptiva de algún sonido (Fernández Planas 2007; Quilis 1981). En cuanto a los datos acústicos, las unidades de medida son de diversa índole, pero las más comunes son las unidades temporales (milisegundos, sobre todo), las tonales (hercios o semitonos) y las de intensidad (decibelios).
Al tratar con gran cantidad de datos, el análisis fónico está tradicionalmente vinculado al procedimiento de investigación científica común, es decir, se valida o refuta una hipótesis de investigación en contraste con una muestra extraída de la pronunciación o de la percepción de informantes concretos, bien procedan de un entorno de laboratorio, bien de un ámbito más espontáneo (Llisterri 1991). Al mismo tiempo, los datos se analizan desde la estadística descriptiva, basada en frecuencias, medias, varianza, etc., pero también desde la estadística inferencial, por la que lo recogido en una muestra concreta, la usada en el análisis, se da o no por generalizable para una población mayor:
La función principal de un corpus, tanto textual como oral, es establecer la relación entre la teoría y los datos; el corpus tiene que mostrar a pequeña escala cómo funciona una lengua natural; pero para ello es necesario que esté diseñado correctamente sobre unas bases estadísticas apropiadas que aseguren que el desarrollo sea efectivamente un modelo de la realidad.
(Llisterri y Torruella 1999, 45–46)
Por lo tanto, los estudios con corpus fónicos suelen recoger mucha información (valores acústicos, múltiples unidades de análisis [p. ej., vocales, consonantes, tonos]). Si esta recolección de datos es controlada, es decir, realizada en un laboratorio de fonética o en un entorno aislado de ruido y con un micrófono de alta calidad, el volumen de material dependerá de los objetivos concretos del investigador (Ladefoged y Johnson 2011; Llisterri 1999, 1991). Por otro lado, en casos donde el material procede de un entorno más espontáneo y donde no siempre pueden controlarse las condiciones de grabación (p. ej., interrupciones, ruido de fondo), el número de registros puede ser algo menor, si bien suele combinarse con un amplio conjunto de variables de análisis (Cabedo Nebot 2012).
En todo caso, será siempre necesario filtrar o controlar la posible influencia de datos anómalos o de outliers. Puede darse el caso de que algunos informantes tengan una característica patológica o de otra índole que pueda justificar los resultados extremos obtenidos para ellos. En estos casos, es habitual actuar de dos formas: una, eliminar o filtrar directamente esos datos antes de entrar en la fase de análisis estadística; dos, crear un grupo de control paralelo con el que contrastar los resultados obtenidos. Mientras la primera operación se utiliza en general en cualquier investigación fónica, la segunda está dirigida, sobre todo, a cuestiones en las que se comparan grupos: por ejemplo, hablantes con patología de voz (afasia, dislalia) y hablantes sin patología; estudiantes de un idioma (por ejemplo, de español) con nativos de ese mismo idioma, etc.
3. Estado de la cuestión
Este estado de la cuestión se subdividirá en diferentes áreas temáticas que cubren los ámbitos en los que la fonética y la fonología aumentan sus horizontes gracias al uso de corpus: estudios estrictamente de fonética segmental o suprasegmental de la lengua española; fonética forense; enseñanza de español como lengua extranjera; tecnologías del habla; y patologías del habla.
Debe tenerse en consideración que cada una de estas secciones puede acercarse al estudio fonético o fonológico de varias maneras: mediante la consulta de corpus especializados ya creados que incorporan datos fónicos (recogidos en entorno espontáneo o en laboratorio) o mediante recogida experimental y controlada de datos (normalmente recogidos en un laboratorio).
Buena parte de la moderna fonética experimental sigue basándose en habla de laboratorio (muestras rara vez dialógicas, grabadas en condiciones no comunicativas, a menudo frases preparadas y leídas … incluso por el propio investigador) y persigue la comprobación de los detalles y las contradicciones teóricas de tal o cual tendencia teorética. Muy lejos, pues, de la descripción objetiva del habla genuina de los hablantes reales en situaciones auténticas de comunicación.
(Cantero 2015, 11)
Como se comentaba anteriormente, no es posible dar cabida en esta sección a todos los estudios fónicos que han incluido tratamiento de corpus en sus investigaciones, por lo que las citaciones empleadas tienen una simple funcionalidad expositiva. El procedimiento de análisis compartido por la gran mayoría de estos estudios, que servirán de ejemplo, es el que sigue:
Tabla 8.1 Procedimiento común de análisis en investigaciones fónicas. Análisis | Datos | Procedencia datos | Cantidad datos | Unidades | Informantes (controlados/balanceados/azar) |
Acústico | F0, duración | Laboratorio, entorno espontáneo | Amplia (normalmente >100) | Fonos, sílabas, tonemas | Variación (edad, sexo, nivel sociocultural) |
Auditivo | Valoraciones, percepción sonido | Entorno controlado (web, laboratorio) | Limitada por la evaluación de sujetos |
Por lo que se desprende de la tabla 8.1, el procedimiento de análisis se basa en la recolección de datos de diversa consideración, procedentes de la producción o per...