Lingüística de corpus en español/The Routledge Handbook of Spanish Corpus Linguistics muestra el modo en que ha cambiado el panorama de la denominada lingüística de corpus en español y cómo en la actualidad ha llegado a concitar un espacio disciplinar independiente, y, al mismo tiempo, integrar estos conocimientos en cualquier programa de estudios, investigación o diseño curricular en educación superior.

Este volumen lo componen 36 capítulos que ofrecen un panorama amplio, diverso y comprehensivo de los avances en lingüística de corpus de y en español, abarcando un vasto repertorio de conceptos esenciales y de aspectos teóricos y metodológicos desde una conceptualización de la lingüística contemporánea tanto inter como transdisciplinaria.

Los ámbitos que se cubren no son ni estancos, ni definitivos, ni, mucho menos, los únicos. Son perfectamente susceptibles de revisión, de mejora y/o de cambio. El objetivo último de esta obra no es el limitar o fijar, sino todo lo contrario, es el de motivar y provocar a los lectores y lectoras para que no cesen las avenidas de propuestas innovadoras en el ámbito de la lingüística de corpus del español y seguir así profundizando en el conocimiento de esta lengua.

Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics shows how the landscape of corpus linguistics in Spanish has changed and how it has become an independent discipline while incorporating this knowledge into any syllabus, research or curriculum design in higher education.

This volume comprises 36 chapters that provide a broad, diverse and comprehensive overview of advances in corpus linguistics of and in Spanish, covering a vast repertoire of essential concepts as well as theoretical and methodological aspects from a conceptualization of contemporary linguistics that is both inter- and transdisciplinary.

The fields covered are not definitive, or even the only ones. They are entirely open to revision, improvement and/or change. The goal of this work is not to fix or limit these topics. On the contrary, it is intended to motivate and provoke the readers to continue exploring new avenues of innovative proposals in the field of Spanish corpus linguistics and thus deepen their knowledge of this language.

Cuenta con la confianza de 375,005 estudiantes

Acceso a más de 1 millón de títulos por un precio mensual asequible.

Estudia de forma más eficiente usando nuestras herramientas de estudio.

Editorial

Routledge

Año

2022

ISBN de la versión impresa

9780367350123

ISBN del libro electrónico

9781000511529

Categoría

Languages & Linguistics

Categoría

Languages

Parte II
Estudios del español mediante corpus

DOI: 10.4324/9780429329296-10

8 Estudio de la fonología/fonética española mediante corpus (Study of Spanish phonology/phonetics through corpus)

Adrián Cabedo Nebot

DOI: 10.4324/9780429329296-11

1. Introducción

El objetivo de este capítulo es proporcionar una visión general de los estudios de corpus sobre fonética y fonología actualmente disponibles en español. Dado que la fonética y la fonología tienen en cuenta la producción y recepción del habla, la recopilación de material sonoro es obligatoria en algún momento; el registro de sonido debe transcribirse para poder buscarse en él con posterioridad: se convierte en un corpus. El estudio de la fonética y la fonología incorpora además diferentes unidades, ya sean segmentales (fonemas, alófonos) o suprasegmentales (p. ej., entonación, duración, velocidad del habla), y la transcripción del material de sonido a menudo se enriquece con mediciones acústicas y/o anotaciones simbólicas, para reflejar los diferentes intereses de estudio. Por su parte, los datos se pueden registrar en entornos aislados, con una acústica perfecta, comúnmente llamados datos de laboratorio, o pueden incluir habla espontánea (p. ej., entrevistas, debates, conversaciones). Así mismo, los estudios fónicos cubren múltiples áreas de especialidad, como la lingüística clínica, las tecnologías del habla, la fonética forense o el español como lengua extranjera, entre muchos otros. En todo caso, el estudio de los datos fónicos está profundamente interrelacionado con la evolución del hardware (calidad de los micrófonos, nuevos formatos de grabación, dispositivos mejorados [móviles, grabadoras]) y la evolución del software, ya que su recopilación y análisis son cada vez más sofisticados a medida que pasa el tiempo; también cobrará especial relevancia la forma en que se cuantifican los datos mediante la aplicación de múltiples pruebas estadísticas. Así pues, teniendo en cuenta la importante cantidad de bibliografía sobre el tema de este capítulo, las referencias se seleccionaron de acuerdo con dos criterios principales: su publicación reciente o su importancia en términos de número de citas. En definitiva, el principal interés de este capítulo es presentar una breve panorámica sobre cómo la metodología de corpus es determinante y útil en el desarrollo de estudios fónicos.

Palabras clave: fonética/fonología; laboratorio; acústica; segmental; suprasegmental

The aim of this chapter is to provide an overview of the corpus studies on phonetics and phonology currently available in Spanish; since phonetics and phonology take into account the production and reception of speech, the collection of sound material is mandatory at some point; the sound recorded must be transcribed and then it becomes manipulable and searchable: it turns into a corpus. The study of phonetics and phonology considers different units, be they segmental (phonemes, phones) or suprasegmental (e.g., intonation, duration, speech rate), and the transcription of the sound material is often enriched with acoustic measurements and/or symbolic annotations reflecting the different interests of study. Data can be recorded in isolated environments, with a perfect acoustic, commonly called laboratory data, or they can include spontaneous speech (e.g., interviews, debates, conversations). Phonic studies also cover multiple specific areas, like clinical linguistics, speech technologies, forensic phonetics or Spanish as a foreign language, among many others. Considering the important amount of literature on this topic, the references presented in this chapter have been selected according to two main criteria: their recent publication and their importance in terms of number of citations. Generally speaking, the study of phonic data is deeply interrelated with the evolution of hardware (quality of microphones, new recording formats, improved devices (mobile, recorders) and the evolution of software, being their collection and analysis more and more sophisticated with time, as well as the way the data are quantified by applying multiple statistical tests. In conclusion, the main concern of this chapter is to outline how a methodology based in corpus could be useful to develop phonic studies.

Key words: phonetics/phonology; laboratory; acoustic; segmental; suprasegmental

2. Conceptos fundamentales

Fonética y fonología constituyen dos disciplinas que pretenden abordar el estudio de sonidos segmentales, como los fonos, y suprasegmentales, como la entonación, desde perspectivas distintas (Quilis 1993; Martínez Celdrán y Fernández Planas 2007). La fonética tiene una base acústica y, por tanto, se basa en la concreción, mientras que la fonología atiende a la figura mental del sonido y, en tal sentido, prioriza la abstracción (Fernández Planas 2007). La fonología tiene una extensión menor que la fonética, ya que limita los rasgos de los sonidos del entorno físico del hablante a aquellos que delimitan significados y que son, por tanto, puramente comunicativos (Ladefoged y Johnson 2011; Quilis 1981).

En general, las propiedades que se estudian en las investigaciones fónicas tienen en cuenta fenómenos acústicos, como la duración, la intensidad, la frecuencia fundamental o la velocidad de habla, entre otros, pero también factores motores, como la realización articularia o la distorsión perceptiva de algún sonido (Fernández Planas 2007; Quilis 1981). En cuanto a los datos acústicos, las unidades de medida son de diversa índole, pero las más comunes son las unidades temporales (milisegundos, sobre todo), las tonales (hercios o semitonos) y las de intensidad (decibelios).

Al tratar con gran cantidad de datos, el análisis fónico está tradicionalmente vinculado al procedimiento de investigación científica común, es decir, se valida o refuta una hipótesis de investigación en contraste con una muestra extraída de la pronunciación o de la percepción de informantes concretos, bien procedan de un entorno de laboratorio, bien de un ámbito más espontáneo (Llisterri 1991). Al mismo tiempo, los datos se analizan desde la estadística descriptiva, basada en frecuencias, medias, varianza, etc., pero también desde la estadística inferencial, por la que lo recogido en una muestra concreta, la usada en el análisis, se da o no por generalizable para una población mayor:

La función principal de un corpus, tanto textual como oral, es establecer la relación entre la teoría y los datos; el corpus tiene que mostrar a pequeña escala cómo funciona una lengua natural; pero para ello es necesario que esté diseñado correctamente sobre unas bases estadísticas apropiadas que aseguren que el desarrollo sea efectivamente un modelo de la realidad.

(Llisterri y Torruella 1999, 45–46)

Por lo tanto, los estudios con corpus fónicos suelen recoger mucha información (valores acústicos, múltiples unidades de análisis [p. ej., vocales, consonantes, tonos]). Si esta recolección de datos es controlada, es decir, realizada en un laboratorio de fonética o en un entorno aislado de ruido y con un micrófono de alta calidad, el volumen de material dependerá de los objetivos concretos del investigador (Ladefoged y Johnson 2011; Llisterri 1999, 1991). Por otro lado, en casos donde el material procede de un entorno más espontáneo y donde no siempre pueden controlarse las condiciones de grabación (p. ej., interrupciones, ruido de fondo), el número de registros puede ser algo menor, si bien suele combinarse con un amplio conjunto de variables de análisis (Cabedo Nebot 2012).

En todo caso, será siempre necesario filtrar o controlar la posible influencia de datos anómalos o de outliers. Puede darse el caso de que algunos informantes tengan una característica patológica o de otra índole que pueda justificar los resultados extremos obtenidos para ellos. En estos casos, es habitual actuar de dos formas: una, eliminar o filtrar directamente esos datos antes de entrar en la fase de análisis estadística; dos, crear un grupo de control paralelo con el que contrastar los resultados obtenidos. Mientras la primera operación se utiliza en general en cualquier investigación fónica, la segunda está dirigida, sobre todo, a cuestiones en las que se comparan grupos: por ejemplo, hablantes con patología de voz (afasia, dislalia) y hablantes sin patología; estudiantes de un idioma (por ejemplo, de español) con nativos de ese mismo idioma, etc.

3. Estado de la cuestión

Este estado de la cuestión se subdividirá en diferentes áreas temáticas que cubren los ámbitos en los que la fonética y la fonología aumentan sus horizontes gracias al uso de corpus: estudios estrictamente de fonética segmental o suprasegmental de la lengua española; fonética forense; enseñanza de español como lengua extranjera; tecnologías del habla; y patologías del habla.

Debe tenerse en consideración que cada una de estas secciones puede acercarse al estudio fonético o fonológico de varias maneras: mediante la consulta de corpus especializados ya creados que incorporan datos fónicos (recogidos en entorno espontáneo o en laboratorio) o mediante recogida experimental y controlada de datos (normalmente recogidos en un laboratorio).

Buena parte de la moderna fonética experimental sigue basándose en habla de laboratorio (muestras rara vez dialógicas, grabadas en condiciones no comunicativas, a menudo frases preparadas y leídas … incluso por el propio investigador) y persigue la comprobación de los detalles y las contradicciones teóricas de tal o cual tendencia teorética. Muy lejos, pues, de la descripción objetiva del habla genuina de los hablantes reales en situaciones auténticas de comunicación.

(Cantero 2015, 11)

Como se comentaba anteriormente, no es posible dar cabida en esta sección a todos los estudios fónicos que han incluido tratamiento de corpus en sus investigaciones, por lo que las citaciones empleadas tienen una simple funcionalidad expositiva. El procedimiento de análisis compartido por la gran mayoría de estos estudios, que servirán de ejemplo, es el que sigue:

Tabla 8.1 Procedimiento común de análisis en investigaciones fónicas.
Análisis	Datos	Procedencia datos	Cantidad datos	Unidades	Informantes (controlados/balanceados/azar)
Acústico	F0, duración	Laboratorio, entorno espontáneo	Amplia (normalmente >100)	Fonos, sílabas, tonemas	Variación (edad, sexo, nivel sociocultural)
Auditivo	Valoraciones, percepción sonido	Entorno controlado (web, laboratorio)	Limitada por la evaluación de sujetos

Por lo que se desprende de la tabla 8.1, el procedimiento de análisis se basa en la recolección de datos de diversa consideración, procedentes de la producción o per...

Cover
Half Title
Series
Title
Copyright
Dedication
Contents
Lista de tablas
Lista de figuras
Biografías de los autores
Agradecimientos
Introducción: lingüística de corpus en español
Parte I Tipología de corpus para el español
Parte II Estudios del español mediante corpus
Parte III Metodologías, herramientas y recursos para el análisis de corpus del español
Index

Preguntas frecuentes

¿Puedo cancelar mi suscripción cuando quiera?

Sí, puedes cancelar tu suscripción en cualquier momento desde la pestaña Suscripción en los ajustes de tu cuenta en el sitio web de Perlego. La suscripción seguirá activa hasta que finalice el periodo de facturación actual. Descubre cómo cancelar tu suscripción

¿Puedo descargar los libros?

No, los libros no se pueden descargar como archivos externos, como los PDF, para usarlos fuera de Perlego. Sin embargo, puedes descargarlos en la aplicación de Perlego para leerlos sin conexión en el móvil o en una tableta. Descubre cómo descargar libros para leer sin conexión

¿En qué se diferencian los planes de precios?

Perlego ofrece dos planes: Essential y Complete

El plan Essential es ideal para los estudiantes y los profesionales a los que les gusta explorar una amplia gama de temas. Accede a la biblioteca Essential, con más de 800 000 títulos de confianza y superventas sobre negocios, crecimiento personal y humanidades. Incluye un tiempo de lectura ilimitado y la voz estándar de «Lectura en voz alta».
Complete: perfecto para los estudiantes avanzados y los investigadores que necesitan un acceso completo sin ningún tipo de restricciones. Accede a más de 1,4 millones de libros sobre cientos de temas, incluidos títulos académicos y especializados. El plan Complete también incluye funciones avanzadas como la lectura en voz alta prémium y el asistente de investigación.

Ambos planes están disponibles con un ciclo de facturación mensual, semestral o anual.

¿Cómo funciona Perlego?

Somos un servicio de suscripción de libros de texto en línea que te permite acceder a toda una biblioteca en línea por menos de lo que cuesta un libro al mes. Con más de un millón de libros sobre más de 990 categorías, ¡tenemos todo lo que necesitas! Descubre nuestra misión

¿Perlego ofrece la función de texto a voz?

Busca el símbolo de lectura en voz alta en tu próximo libro para ver si puedes escucharlo. La herramienta de lectura en voz alta lee el texto en voz alta por ti, resaltando el texto a medida que se lee. Puedes pausarla, acelerarla y ralentizarla. Obtén más información sobre la lectura en voz alta

¿Puedo leer en mi tableta o mi móvil?

¡Sí! Puedes usar la aplicación de Perlego en dispositivos iOS y Android para leer cuando y donde quieras, incluso sin conexión. Es ideal para cuando vas de un lado a otro o quieres acceder al contenido sobre la marcha.
Ten en cuenta que no será compatible con los dispositivos que se ejecuten en iOS 13 y Android 7 o en versiones anteriores. Obtén más información sobre cómo usar la aplicación

¿Es Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics un PDF/ePUB en línea?

Sí, puedes acceder a Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics de Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe, Giovanni Parodi,Pascual Cantos-Gómez,Chad Howe en formato PDF o ePUB, así como a otros libros populares de Languages & Linguistics y Languages. Tenemos más de un millón de libros disponibles en nuestro catálogo para que explores.

Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics