📑Resumen de la charla:
“Los «macrodatos» (más conocidos por su nombre en inglés, «Big data») juegan un papel cada vez más importante en nuestras vidas: la capacidad de los algoritmos automáticos de recuperar información de los usuarios de las redes sociales y de internet en general está siendo una enorme revolución para la sociedad actual. Los sofisticados análisis estadísticos de esta enorme cantidad de datos permiten caracterizar de manera muy precisa a los usuarios en una gran variedad de aspectos, tales como nuestras preferencias de consumo, intereses culturales o comerciales, tendencias políticas o datos sanitarios o incluso lucha contra el terrorismo o el crimen.
Esta avalancha de información obviamente debe interesar a los científicos sociales, y más específicamente a los lingüistas. La posibilidad de basar nuestros modelos de lenguaje en una base empírica mucho mayor que la disponible hasta el momento parece de entrada una oferta tentadora. No obstante, la relación entre «big data» y «ciencia lingüística» está todavía en plena evolución. La lingüística ya empezó su particular revolución empírica hace unas décadas con el auge de la lingüística de corpus. Los corpus actuales ofrecen una cantidad muy elevada de palabras (el SketchEngine, por ejemplo, ofrece un corpus de inglés de 35 billones de palabras y un corpus de español de casi 10.000 millones de palabras). No obstante, el tamaño no lo es todo: dependiendo del propósito de investigación que se busque, el aprovechamiento adecuado de un corpus implica que el material recopilado esté correctamente construido y etiquetado; también es preciso cuidar la representatividad y la precisión de los datos, algo no siempre presente en los macrodatos. Incluso más recientemente han irrumpido en la lingüística los estudios multimodales, que examinan aspectos más allá de la información verbal, tales como gestos, prosodia o expresión facial, y cuya recopilación, proceso y explotación presentan nuevos problemas y oportunidades.
En resumen, la lingüística de corpus y los «big data» ofrecen información complementaria, aunque no totalmente equivalente. En esta presentación revisaremos estos puntos de convergencia y divergencia examinando algunas de las posibilidades que los grandes datos ofrecen al estudio del lenguaje.»
Palabras Clave: lenguaje humano, lenguaje, cognición, lingüística cognitiva.
¿Cómo citar esta charla de nuestro repositorio?
Valenzuela, J. (2019). Big Data ¿Una revolución también en los estudios del lenguaje. En Lingüistica para todos (org.), Zaragoza Lingüística a la Carta. Universidad de Zaragoza. [http://zlalacarta.unizar.es/big-data-en-los-estudios-del-lenguaje].