Descripción del Curso
Este curso explora herramientas y metodologías para el análisis computacional de texto aplicadas a las ciencias sociales. A través de una combinación de conceptos teóricos y prácticos, los participantes aprenderán a extraer, procesar y analizar datos textuales utilizando herramientas de machine learning, así como a interpretar los resultados desde una perspectiva social.
Objetivos del Curso
- Entender los fundamentos teóricos del análisis computacional de texto en ciencias sociales.
- Manejar herramientas básicas para la extracción y preprocesamiento de datos textuales.
- Interpretar resultados y comunicar hallazgos de forma efectiva.
Público Objetivo
Estudiantes, investigadores y profesionales interesados en aplicar el análisis computacional de texto en el ámbito de las ciencias sociales.
Prerrequisitos: No hay prerrequisitos.
Estructura del Curso
-
Módulo 1: Fundamentos del Análisis de Texto
- Introducción al análisis de texto y conceptos básicos de procesamiento de lenguaje natural (NLP).
- Técnicas: Modelos de lenguaje básicos, introducción a Python, NLTK y Jupyter Notebook, tokenización, lematización y stemming.
- Lecturas: Grimmer, J., Roberts, M. E., & Stewart, B. M. (2022). Text as Data: A New Framework for Machine Learning and the Social Sciences.
-
Módulo 2: Representaciones Textuales y Modelado de Tópicos
- Exploración de técnicas para representar textos y descubrir patrones latentes en grandes volúmenes de datos.
- Técnicas: TF-IDF, modelado de tópicos (LDA, Correlated Topic Models), representaciones distribuidas (Word2Vec, Doc2Vec, GloVe).
- Lecturas: Sarmiento et al. (2022), "Identifying and Characterizing New Expressions of Community Framing during Polarization".
-
Módulo 3: Análisis de Redes y Opinión Pública
- Técnicas avanzadas para analizar conexiones sociales y opiniones utilizando datos textuales.
- Técnicas: Extracción de redes desde texto, análisis de sentimientos (léxicos y supervisados), reconocimiento de entidades nombradas (NER).
- Lecturas: Bro (2025), "A Frustratingly Easy Way of Extracting Political Networks from Text".
-
Módulo 4: LLMs para el Análisis Cualitativo
- Uso de LLMs para el análisis cualitativo avanzado en ciencias sociales.
- Técnicas: Análisis cualitativo con modelos generativos, comunicación de hallazgos.
- Lecturas: Bosley (2025), "Improving Probabilistic Models in Text Classification via Active Learning".
Bibliografía
- Grimmer, J., Roberts, M. E., & Stewart, B. M. (2022). Text as Data: A New Framework for Machine Learning and the Social Sciences.
- Bro (2025), "A Frustratingly Easy Way of Extracting Political Networks from Text".
- Bosley (2025), "Improving Probabilistic Models in Text Classification via Active Learning".
- Sarmiento et al. (2022), "Identifying and Characterizing New Expressions of Community Framing during Polarization".