Los idiomas difieren en los sonidos que utilizan. El idioma japonés, por ejemplo, no distingue entre los sonidos “r” y “l” como en “rock” versus “lock”. Sorprendentemente, los bebés se sintonizan con los sonidos de su lengua materna antes de aprender a hablar. Los bebés de un año, por ejemplo, distinguen con menos facilidad entre “rock” y “lock” cuando viven en un entorno donde se habla japonés, en lugar de inglés.
Los informes científicos influyentes de este fenómeno de aprendizaje fonético temprano propusieron inicialmente que los bebés agruparan los sonidos en categorías fonéticas nativas de vocales y consonantes a través de un mecanismo de agrupamiento estadístico conocido como “aprendizaje distributivo”.
Sin embargo, la idea de que los bebés aprenden categorías fonéticas de consonantes y vocales ha sido cuestionada por un nuevo estudio publicado esta semana en las Actas de la Academia Nacional de Ciencias.
En el estudio, un equipo multiinstitucional de científicos cognitivos y lingüistas computacionales ha introducido un marco de modelado cuantitativo que se basa en una simulación a gran escala del proceso de aprendizaje del lenguaje en los bebés. Mediante el uso de técnicas de aprendizaje automático computacionalmente eficientes, este enfoque permite que los mecanismos de aprendizaje se vinculen sistemáticamente con predicciones comprobables sobre la sintonía de los bebés con su lengua materna.
Las hipótesis sobre lo que aprenden los bebés han impulsado tradicionalmente los intentos de los investigadores por comprender este fenómeno sorprendente. Proponemos partir de hipótesis sobre cómo pueden aprender los bebés “.
Thomas Schatz, autor principal del estudio, asociado posdoctoral, Instituto de Estudios Informáticos Avanzados de la Universidad de Maryland de Maryland
Además de Schatz, los autores del estudio incluyen a Naomi Feldman, profesora asociada de lingüística en la Universidad de Maryland con un nombramiento en UMIACS; Sharon Goldwater, profesora del Instituto de Lenguaje, Cognición y Computación de la Escuela de Informática de la Universidad de Edimburgo; Xuân-Nga Cao, ingeniero de investigación de Ecole Normale Supérieure (ENS) en París y cofundador de las startups Langinnov y Gazouyi; y Emmanuel Dupoux, profesor que dirige el equipo de aprendizaje automático cognitivo en ENS.
Para su estudio, los investigadores simularon el proceso de aprendizaje en bebés mediante el entrenamiento de un algoritmo de agrupamiento computacionalmente eficiente en la entrada de voz realista. El algoritmo se alimentó de características auditivas similares a espectrogramas muestreadas a intervalos de tiempo regulares que se obtuvieron de grabaciones de habla naturalista en un idioma de destino. En este estudio, el inglés estadounidense y el japonés fueron los dos idiomas utilizados.
Esto produjo un modelo candidato para el conocimiento fonético temprano de, digamos, un bebé japonés, dicen los investigadores. A continuación, hicieron dos preguntas a los modelos entrenados. ¿Podrían explicar las diferencias observadas en cómo los bebés que aprenden japonés e inglés discriminan los sonidos del habla? Y, ¿los modelos aprendieron categorías fonéticas similares a vocales y consonantes?
Las explicaciones científicas dominantes del aprendizaje fonético temprano habrían esperado que las respuestas a estas preguntas coincidieran (o ambas deberían ser “sí” o ambas deberían ser “no”). Los investigadores encontraron que la respuesta a la primera pregunta era positiva: sus modelos tenían en cuenta el comportamiento observado de los bebés, en particular, la dificultad de los bebés japoneses para distinguir palabras como “piedra” y “cerradura”. La respuesta a la segunda pregunta, sin embargo, fue negativa: se encontró que los modelos habían aprendido unidades de habla demasiado breves y acústicamente variables para corresponder a categorías fonéticas similares a vocales y consonantes.
Estos resultados sugieren una sorprendente reinterpretación de la literatura existente sobre el aprendizaje fonético temprano. Las dificultades para ampliar el aprendizaje distributivo de las categorías fonéticas a condiciones de aprendizaje realistas pueden interpretarse mejor como cuestionar la idea de que lo que los bebés aprenden son categorías fonéticas, en lugar de la idea de que cómo aprenden los bebés es a través del aprendizaje distributivo puro (la interpretación tradicional).
La ciencia cognitiva no ha hecho uso tradicionalmente de modelos a gran escala, dice Schatz, pero los avances recientes en el poder de la computación, grandes conjuntos de datos y algoritmos de aprendizaje automático hacen que este enfoque sea más factible que nunca.
Schatz y Feldman forman parte del Laboratorio de Procesión de la Información y Lingüística Computacional (CLIP) en UMIACS, donde Feldman es el director actual. Los sólidos recursos informáticos en el laboratorio CLIP y el laboratorio de aprendizaje automático cognitivo en París fueron fundamentales para el proyecto de investigación, dice Feldman.
En conclusión, los investigadores creen en su enfoque de modelado computacional, junto con los esfuerzos continuos en el campo para recopilar datos empíricos a gran escala, como grabaciones a gran escala de los entornos de aprendizaje de los bebés en el hogar y la evaluación a gran escala de los bebés. resultados del aprendizaje: abre el camino hacia una comprensión mucho más profunda de la adquisición temprana del lenguaje.
Fuente:
Referencia de la revista:
Schatz, T. y col. (2021) Aprendizaje fonético temprano sin categorías fonéticas: conocimientos de simulaciones a gran escala sobre entradas realistas. PNAS. doi.org/10.1073/pnas.2001844118.