Análisis Computacional de Texto para las Ciencias Sociales

Naim Bro, Profesor Asistente, Universidad Adolfo Ibáñez

Escuela de Invierno en Métodos
Universidad Católica del Uruguay
Modalidad: Presencial

Descripción del Curso

Este curso explora herramientas y metodologías para el análisis computacional de texto aplicadas a las ciencias sociales. A través de una combinación de conceptos teóricos y prácticos, los participantes aprenderán a extraer, procesar y analizar datos textuales utilizando herramientas de machine learning, así como a interpretar los resultados desde una perspectiva social.

Objetivos del Curso

Público Objetivo

Estudiantes, investigadores y profesionales interesados en aplicar el análisis computacional de texto en el ámbito de las ciencias sociales.

Prerrequisitos: No hay prerrequisitos.

Estructura del Curso

  1. Módulo 1: Fundamentos del Análisis de Texto
    • Introducción al análisis de texto y conceptos básicos de procesamiento de lenguaje natural (NLP).
    • Técnicas: Modelos de lenguaje básicos, introducción a Python, NLTK y Jupyter Notebook, tokenización, lematización y stemming.
    • Lecturas: Grimmer, J., Roberts, M. E., & Stewart, B. M. (2022). Text as Data: A New Framework for Machine Learning and the Social Sciences.
  2. Módulo 2: Representaciones Textuales y Modelado de Tópicos
    • Exploración de técnicas para representar textos y descubrir patrones latentes en grandes volúmenes de datos.
    • Técnicas: TF-IDF, modelado de tópicos (LDA, Correlated Topic Models), representaciones distribuidas (Word2Vec, Doc2Vec, GloVe).
    • Lecturas: Sarmiento et al. (2022), "Identifying and Characterizing New Expressions of Community Framing during Polarization".
  3. Módulo 3: Análisis de Redes y Opinión Pública
    • Técnicas avanzadas para analizar conexiones sociales y opiniones utilizando datos textuales.
    • Técnicas: Extracción de redes desde texto, análisis de sentimientos (léxicos y supervisados), reconocimiento de entidades nombradas (NER).
    • Lecturas: Bro (2025), "A Frustratingly Easy Way of Extracting Political Networks from Text".
  4. Módulo 4: LLMs para el Análisis Cualitativo
    • Uso de LLMs para el análisis cualitativo avanzado en ciencias sociales.
    • Técnicas: Análisis cualitativo con modelos generativos, comunicación de hallazgos.
    • Lecturas: Bosley (2025), "Improving Probabilistic Models in Text Classification via Active Learning".

Bibliografía