Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics
eBook - ePub

Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics

Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe, Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe

Compartir libro
  1. Spanish
  2. ePUB (apto para móviles)
  3. Disponible en iOS y Android
eBook - ePub

Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics

Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe, Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe

Detalles del libro
Vista previa del libro
Índice
Citas

Información del libro

Lingüística de corpus en español/The Routledge Handbook of Spanish Corpus Linguistics muestra el modo en que ha cambiado el panorama de la denominada lingüística de corpus en español y cómo en la actualidad ha llegado a concitar un espacio disciplinar independiente, y, al mismo tiempo, integrar estos conocimientos en cualquier programa de estudios, investigación o diseño curricular en educación superior.

Este volumen lo componen 36 capítulos que ofrecen un panorama amplio, diverso y comprehensivo de los avances en lingüística de corpus de y en español, abarcando un vasto repertorio de conceptos esenciales y de aspectos teóricos y metodológicos desde una conceptualización de la lingüística contemporánea tanto inter como transdisciplinaria.

Los ámbitos que se cubren no son ni estancos, ni definitivos, ni, mucho menos, los únicos. Son perfectamente susceptibles de revisión, de mejora y/o de cambio. El objetivo último de esta obra no es el limitar o fijar, sino todo lo contrario, es el de motivar y provocar a los lectores y lectoras para que no cesen las avenidas de propuestas innovadoras en el ámbito de la lingüística de corpus del español y seguir así profundizando en el conocimiento de esta lengua.

Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics shows how the landscape of corpus linguistics in Spanish has changed and how it has become an independent discipline while incorporating this knowledge into any syllabus, research or curriculum design in higher education.

This volume comprises 36 chapters that provide a broad, diverse and comprehensive overview of advances in corpus linguistics of and in Spanish, covering a vast repertoire of essential concepts as well as theoretical and methodological aspects from a conceptualization of contemporary linguistics that is both inter- and transdisciplinary.

The fields covered are not definitive, or even the only ones. They are entirely open to revision, improvement and/or change. The goal of this work is not to fix or limit these topics. On the contrary, it is intended to motivate and provoke the readers to continue exploring new avenues of innovative proposals in the field of Spanish corpus linguistics and thus deepen their knowledge of this language.

Preguntas frecuentes

¿Cómo cancelo mi suscripción?
Simplemente, dirígete a la sección ajustes de la cuenta y haz clic en «Cancelar suscripción». Así de sencillo. Después de cancelar tu suscripción, esta permanecerá activa el tiempo restante que hayas pagado. Obtén más información aquí.
¿Cómo descargo los libros?
Por el momento, todos nuestros libros ePub adaptables a dispositivos móviles se pueden descargar a través de la aplicación. La mayor parte de nuestros PDF también se puede descargar y ya estamos trabajando para que el resto también sea descargable. Obtén más información aquí.
¿En qué se diferencian los planes de precios?
Ambos planes te permiten acceder por completo a la biblioteca y a todas las funciones de Perlego. Las únicas diferencias son el precio y el período de suscripción: con el plan anual ahorrarás en torno a un 30 % en comparación con 12 meses de un plan mensual.
¿Qué es Perlego?
Somos un servicio de suscripción de libros de texto en línea que te permite acceder a toda una biblioteca en línea por menos de lo que cuesta un libro al mes. Con más de un millón de libros sobre más de 1000 categorías, ¡tenemos todo lo que necesitas! Obtén más información aquí.
¿Perlego ofrece la función de texto a voz?
Busca el símbolo de lectura en voz alta en tu próximo libro para ver si puedes escucharlo. La herramienta de lectura en voz alta lee el texto en voz alta por ti, resaltando el texto a medida que se lee. Puedes pausarla, acelerarla y ralentizarla. Obtén más información aquí.
¿Es Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics un PDF/ePUB en línea?
Sí, puedes acceder a Lingüística de corpus en español / The Routledge Handbook of Spanish Corpus Linguistics de Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe, Giovanni Parodi, Pascual Cantos-Gómez, Chad Howe en formato PDF o ePUB, así como a otros libros populares de Filología y Español. Tenemos más de un millón de libros disponibles en nuestro catálogo para que explores.

Información

Editorial
Routledge
Año
2022
ISBN
9781000511529
Edición
1
Categoría
Filología
Categoría
Español

Parte II
Estudios del español mediante corpus

DOI: 10.4324/9780429329296-10

8 Estudio de la fonología/fonética española mediante corpus (Study of Spanish phonology/phonetics through corpus)

Adrián Cabedo Nebot
DOI: 10.4324/9780429329296-11

1. Introducción

El objetivo de este capítulo es proporcionar una visión general de los estudios de corpus sobre fonética y fonología actualmente disponibles en español. Dado que la fonética y la fonología tienen en cuenta la producción y recepción del habla, la recopilación de material sonoro es obligatoria en algún momento; el registro de sonido debe transcribirse para poder buscarse en él con posterioridad: se convierte en un corpus. El estudio de la fonética y la fonología incorpora además diferentes unidades, ya sean segmentales (fonemas, alófonos) o suprasegmentales (p. ej., entonación, duración, velocidad del habla), y la transcripción del material de sonido a menudo se enriquece con mediciones acústicas y/o anotaciones simbólicas, para reflejar los diferentes intereses de estudio. Por su parte, los datos se pueden registrar en entornos aislados, con una acústica perfecta, comúnmente llamados datos de laboratorio, o pueden incluir habla espontánea (p. ej., entrevistas, debates, conversaciones). Así mismo, los estudios fónicos cubren múltiples áreas de especialidad, como la lingüística clínica, las tecnologías del habla, la fonética forense o el español como lengua extranjera, entre muchos otros. En todo caso, el estudio de los datos fónicos está profundamente interrelacionado con la evolución del hardware (calidad de los micrófonos, nuevos formatos de grabación, dispositivos mejorados [móviles, grabadoras]) y la evolución del software, ya que su recopilación y análisis son cada vez más sofisticados a medida que pasa el tiempo; también cobrará especial relevancia la forma en que se cuantifican los datos mediante la aplicación de múltiples pruebas estadísticas. Así pues, teniendo en cuenta la importante cantidad de bibliografía sobre el tema de este capítulo, las referencias se seleccionaron de acuerdo con dos criterios principales: su publicación reciente o su importancia en términos de número de citas. En definitiva, el principal interés de este capítulo es presentar una breve panorámica sobre cómo la metodología de corpus es determinante y útil en el desarrollo de estudios fónicos.
Palabras clave: fonética/fonología; laboratorio; acústica; segmental; suprasegmental
The aim of this chapter is to provide an overview of the corpus studies on phonetics and phonology currently available in Spanish; since phonetics and phonology take into account the production and reception of speech, the collection of sound material is mandatory at some point; the sound recorded must be transcribed and then it becomes manipulable and searchable: it turns into a corpus. The study of phonetics and phonology considers different units, be they segmental (phonemes, phones) or suprasegmental (e.g., intonation, duration, speech rate), and the transcription of the sound material is often enriched with acoustic measurements and/or symbolic annotations reflecting the different interests of study. Data can be recorded in isolated environments, with a perfect acoustic, commonly called laboratory data, or they can include spontaneous speech (e.g., interviews, debates, conversations). Phonic studies also cover multiple specific areas, like clinical linguistics, speech technologies, forensic phonetics or Spanish as a foreign language, among many others. Considering the important amount of literature on this topic, the references presented in this chapter have been selected according to two main criteria: their recent publication and their importance in terms of number of citations. Generally speaking, the study of phonic data is deeply interrelated with the evolution of hardware (quality of microphones, new recording formats, improved devices (mobile, recorders) and the evolution of software, being their collection and analysis more and more sophisticated with time, as well as the way the data are quantified by applying multiple statistical tests. In conclusion, the main concern of this chapter is to outline how a methodology based in corpus could be useful to develop phonic studies.
Key words: phonetics/phonology; laboratory; acoustic; segmental; suprasegmental

2. Conceptos fundamentales

Fonética y fonología constituyen dos disciplinas que pretenden abordar el estudio de sonidos segmentales, como los fonos, y suprasegmentales, como la entonación, desde perspectivas distintas (Quilis 1993; Martínez Celdrán y Fernández Planas 2007). La fonética tiene una base acústica y, por tanto, se basa en la concreción, mientras que la fonología atiende a la figura mental del sonido y, en tal sentido, prioriza la abstracción (Fernández Planas 2007). La fonología tiene una extensión menor que la fonética, ya que limita los rasgos de los sonidos del entorno físico del hablante a aquellos que delimitan significados y que son, por tanto, puramente comunicativos (Ladefoged y Johnson 2011; Quilis 1981).
En general, las propiedades que se estudian en las investigaciones fónicas tienen en cuenta fenómenos acústicos, como la duración, la intensidad, la frecuencia fundamental o la velocidad de habla, entre otros, pero también factores motores, como la realización articularia o la distorsión perceptiva de algún sonido (Fernández Planas 2007; Quilis 1981). En cuanto a los datos acústicos, las unidades de medida son de diversa índole, pero las más comunes son las unidades temporales (milisegundos, sobre todo), las tonales (hercios o semitonos) y las de intensidad (decibelios).
Al tratar con gran cantidad de datos, el análisis fónico está tradicionalmente vinculado al procedimiento de investigación científica común, es decir, se valida o refuta una hipótesis de investigación en contraste con una muestra extraída de la pronunciación o de la percepción de informantes concretos, bien procedan de un entorno de laboratorio, bien de un ámbito más espontáneo (Llisterri 1991). Al mismo tiempo, los datos se analizan desde la estadística descriptiva, basada en frecuencias, medias, varianza, etc., pero también desde la estadística inferencial, por la que lo recogido en una muestra concreta, la usada en el análisis, se da o no por generalizable para una población mayor:
La función principal de un corpus, tanto textual como oral, es establecer la relación entre la teoría y los datos; el corpus tiene que mostrar a pequeña escala cómo funciona una lengua natural; pero para ello es necesario que esté diseñado correctamente sobre unas bases estadísticas apropiadas que aseguren que el desarrollo sea efectivamente un modelo de la realidad.
(Llisterri y Torruella 1999, 45–46)
Por lo tanto, los estudios con corpus fónicos suelen recoger mucha información (valores acústicos, múltiples unidades de análisis [p. ej., vocales, consonantes, tonos]). Si esta recolección de datos es controlada, es decir, realizada en un laboratorio de fonética o en un entorno aislado de ruido y con un micrófono de alta calidad, el volumen de material dependerá de los objetivos concretos del investigador (Ladefoged y Johnson 2011; Llisterri 1999, 1991). Por otro lado, en casos donde el material procede de un entorno más espontáneo y donde no siempre pueden controlarse las condiciones de grabación (p. ej., interrupciones, ruido de fondo), el número de registros puede ser algo menor, si bien suele combinarse con un amplio conjunto de variables de análisis (Cabedo Nebot 2012).
En todo caso, será siempre necesario filtrar o controlar la posible influencia de datos anómalos o de outliers. Puede darse el caso de que algunos informantes tengan una característica patológica o de otra índole que pueda justificar los resultados extremos obtenidos para ellos. En estos casos, es habitual actuar de dos formas: una, eliminar o filtrar directamente esos datos antes de entrar en la fase de análisis estadística; dos, crear un grupo de control paralelo con el que contrastar los resultados obtenidos. Mientras la primera operación se utiliza en general en cualquier investigación fónica, la segunda está dirigida, sobre todo, a cuestiones en las que se comparan grupos: por ejemplo, hablantes con patología de voz (afasia, dislalia) y hablantes sin patología; estudiantes de un idioma (por ejemplo, de español) con nativos de ese mismo idioma, etc.

3. Estado de la cuestión

Este estado de la cuestión se subdividirá en diferentes áreas temáticas que cubren los ámbitos en los que la fonética y la fonología aumentan sus horizontes gracias al uso de corpus: estudios estrictamente de fonética segmental o suprasegmental de la lengua española; fonética forense; enseñanza de español como lengua extranjera; tecnologías del habla; y patologías del habla.
Debe tenerse en consideración que cada una de estas secciones puede acercarse al estudio fonético o fonológico de varias maneras: mediante la consulta de corpus especializados ya creados que incorporan datos fónicos (recogidos en entorno espontáneo o en laboratorio) o mediante recogida experimental y controlada de datos (normalmente recogidos en un laboratorio).
Buena parte de la moderna fonética experimental sigue basándose en habla de laboratorio (muestras rara vez dialógicas, grabadas en condiciones no comunicativas, a menudo frases preparadas y leídas … incluso por el propio investigador) y persigue la comprobación de los detalles y las contradicciones teóricas de tal o cual tendencia teorética. Muy lejos, pues, de la descripción objetiva del habla genuina de los hablantes reales en situaciones auténticas de comunicación.
(Cantero 2015, 11)
Como se comentaba anteriormente, no es posible dar cabida en esta sección a todos los estudios fónicos que han incluido tratamiento de corpus en sus investigaciones, por lo que las citaciones empleadas tienen una simple funcionalidad expositiva. El procedimiento de análisis compartido por la gran mayoría de estos estudios, que servirán de ejemplo, es el que sigue:
Tabla 8.1 Procedimiento común de análisis en investigaciones fónicas.
Análisis Datos Procedencia datos Cantidad datos Unidades Informantes (controlados/balanceados/azar)
Acústico F0, duración Laboratorio, entorno espontáneo Amplia (normalmente >100) Fonos, sílabas, tonemas Variación (edad, sexo, nivel sociocultural)
Auditivo Valoraciones, percepción sonido Entorno controlado (web, laboratorio) Limitada por la evaluación de sujetos
Por lo que se desprende de la tabla 8.1, el procedimiento de análisis se basa en la recolección de datos de diversa consideración, procedentes de la producción o per...

Índice