(Recursos actualizados semanalmente)
Razonamiento Cuantitativo con Datos I
Profesor: Naim Bro (naim.bro.k [at] uai.cl)
Ayudante: Martín Castillo (martincastillo [at] alumnos.uai.cl)
Escuela de Negocios, Universidad Adolfo Ibáñez, 2023
Link al programa
Horario de oficina: los lunes a las 16h, oficina 260-A (escribir con anterioridad en caso de visita)
Clases
- Introducción a los datos (07-03-2023)
Objetivos de aprendizaje: El alumno debe ser capaz de argumentar la importancia de los datos en el contexto actual, los principales efectos en el desarrollo de los negocios y cómo la tecnología ha ayudado en su aplicación. Además, debe entender los desafíos éticos, técnicos y estratégicos que la era de los datos impone y la importancia de poder leer, entender y argumentar con datos.
Contenidos específicos:
- Introducción al curso e información administrativa
- Introducción: Contexto de la importancia de los datos
- Evolución tecnológica y datos
- Cadena de valor de los datos
- Los datos en un contexto de negocios
- Razonamiento cuantitativo (Alfabetización Digital)
- Slides
- Quizz para conocernos: Menti o Google form
- Conociendo mi entorno con datos (14-03-2023)
Objetivos de aprendizaje: El objetivo de esta sesión es que el alumno se familiarice con una base de datos en formato de tabla (Microsoft Excel) y pueda describirla mediante la identificación de tipos de variables. El alumno además debe lograr identificar las fuentes de datos y las diferencias entre muestra y población.
Contenido de ayudantía:
- Crear, guardar y eliminar una tabla de datos en Microsoft Excel
- Crear y eliminar datos y variables
- Utilización de Microsoft Excel como hoja de cálculo (ejercicios)
Contenidos específicos: Caso: ‘Conociendo mi entorno con datos’
- Importancia de datos en la toma de decisiones
- Captura de datos
- Introducción a la hoja de cálculo y dataframe
- Descripción de una base de datos
- Tipos de datos y variables: cuantitativas, continuas, ordinales, nominales, dicotómicas.
- Slides
- Caso, Describiendo a mis compañeros de clase (21-03-2023)
Objetivos de aprendizaje: En esta sesión el alumno debe ser capaz de describir los datos de una base de datos (tabla) utilizando estadísticos descriptivos básicos. El alumno debe familiarizarse con la herramienta Microsoft Excel y aplicar los estadísticos básicos y funciones matemáticas necesarias para describir a los compañeros de clase utilizando los datos de la encuesta aplicada en la primera clase del curso.
Contenidos específicos: Caso “Describiendo a mis compañeros de clase”
- Contexto: Como describir características de una población
- Medidas de tendencia central: Media, mediana, moda
- Medidas de dispersión: Varianza, desviación estándar, coeficiente de variación y rango
- Representación de datos y fórmulas: tipos, funciones, filtros y ordenamientos
- Quiz
- Slides
- Resumen
- Datos
- Caso, Describiendo a mis compañeros de clase y representaciones gráficas (28-03-2023)
Objetivos de aprendizaje: En esta sesión el alumno debe ser capaz de describir los datos de una base de datos (tabla) utilizando estadísticos descriptivos básicos (Medidas de posición) y gráficos simples. El alumno debe familiarizarse con la herramienta Microsoft Excel y aplicar los estadísticos básicos y tabla dinámica para describir a los compañeros de clase utilizando los datos de la encuesta aplicada en la primera clase del curso.
Contenidos específicos: Caso “Describiendo a mis compañeros de clase”
- Medidas de posición: cuartiles, quintiles, deciles y percentilas
- Análisis de datos mediante gráficos: Boxplot, Torta, Barra y Línea
- Uso de tabla dinámica
- Ejercicios: Resolver problemas utilizando la base de datos de la encuesta
- Quiz
- Slides
- Resumen
- Análisis bivariado y caso Fuga de clientes (04-04-2023)
Objetivos de aprendizaje: En esta sesión el alumno debe ser capaz de resolver un problema de negocios utilizando estadísticos simples y gráficos.
Contenido de ayudantía: Tabla dinámica, gráficos y análisis bivariado.
Contenidos específicos: Caso “Análisis de fuga de clientes”
- Contexto: Fuga de clientes y el uso de datos para identificarlos.
- Efectuar un análisis comparativo que permita identificar si existen diferencias en el comportamiento de las variables para clientes que permanecen versus los que se fugaron del banco.
- Frecuencia Absoluta y frecuencia relativa
- Análisis descriptivo univariado (Tablas resúmenes de estadísticos: min, max, promedio, mediana, varianza y desviación estándar)
- Análisis descriptivo bivariado (correlación)
- Coeficiente de variación
- Gráficos: Repaso de gráficos: Torta, Barra, Histograma, boxplot, dispersión y ojiva (opcional)
- Quiz
- Datos
- Slides
- Resumen
- Trabajo Práctico (Prueba 1) (11-04-2023)
En esta prueba los alumnos deberán demostrar dominio de los contenidos vistos en las sesiones 1 - 6.
- Caso, análisis de ventas de retail multicanal (18-04-2023)
Objetivos de aprendizaje: En esta sección el alumno debe ser capaz de realizar análisis multivariado para lo cual se utiliza la tabla pivote como herramienta de selección y agrupación de datos. Realizar análisis descriptivo y comparativo de las variables mediante el uso de tabla pivote, tablas resúmenes de estadísticos y gráficos.
Contenido de ayudantía: Taller de tabla pivote
Contenidos específicos: Caso “Análisis de ventas de retail multicanal”
- Contexto: Análisis de ventas en retail
- Identificar el tipo de producto con mayor cantidad de ventas por región y/o país (comparar revenue y profit).
- Comparar las utilidades por tipo de artículo de la compañía.
- Identificar el tipo de producto con mayor cantidad de ventas por canal (offline/online).
- Contenido a repasar:
- Tipo de variable
- Resumen de estadísticos (medidas de tendencia central)
- Gráficos: Barra, columna, línea y pie.
- Slides
- Introducción al razonamiento algorítmico para análisis de datos (25-04-2023)
Objetivos de aprendizaje: Se espera que al final de la sesión, el alumno pueda utilizar R Studio Cloud para cargar una base de datos, describir las variables que la comprenden, y usar dplyr para hacer un análisis exploratorio básico sin gráficos. Esto último aplicando filter, select, mutate, group by y summarise para aislar las variables de interés y crear tablas de resumen que permita analizarlas. Esta sesión cubre los contenidos descritos en el Capítulo 2 del apunte de R del curso.
Contenido de ayudantía 1:
- Crear cuenta de RStudio Cloud.
- Identificar ventanas de la interfaz de RStudio Cloud y saber para qué se usan
- Cargar una base de datos (formato CSV) en R
- Identificar tipos de variables
- Observar la base de datos a través de la interfaz gráfica de RStudio Cloud
- Cargar una base de datos (formato CSV) en R
- Introducción a Dyplr: Filter, Arrange, Select y Mutate
- Slides
- Preguntas de análisis (trabajo grupal)
- Encuesta, mejor pregunta
- Datos
- Turorial de R
Contenidos específicos clase 1: Clase formato cátedra.
- ¿Qué es un lenguaje de programación?
- Introducción a R / Tidyverse como lenguaje y plataforma para análisis de datos.
- El concepto de datos en formato “tidy”.
- Tipos básicos de variables en R: character, numeric (real or decimal), integer, logical.
- La librería dplyr.
- El data frame (o “tibble” en Tidyverse) como contenedor “inteligente” de variables.
- Flujo de trabajo en R / Tidyverse: Pipes (%>%) + Aplicar funciones
- Exploración rápida de un Tibble: glimpse(), dim(), distinct(), count().
- Los métodos filter() y select()
- Operaciones lógicas entre variables (para poder filtrar y seleccionar)
- Cómo leer help de R
- Introducción al método mutate():
- Operaciones numéricas y funciones básicas aplicables a variables
- Introducción al método summarise() y group_by()
- Métodos de resumen de vectores
- Ejemplos de uso de R para analizar base de datos MPG
- Slides
- Caso, ¿Cómo se comparan los vinos Chilenos y Argentinos? (1) (09-05-2023)
Objetivos de aprendizaje: Generar tablas de resumen en R para abordar un problema de negocios utilizando una base de datos de gran escala. Esta sesión usa los contenidos descritos en el Capítulo 2 del apunte de R del curso.
Contenidos específicos: Caso, ¿Cómo se comparan los vinos Chilenos y Argentinos?
- Contexto: Análisis de mercado, diferenciación de productos, análisis percepción.
- Identificar en qué se diferencian los vinos Chilenos de los Argentinos, tomando en cuenta precio, calidad (ranking), ratio precio-calidad, variedad y composición de variedades ofrecidas.
- Hacer análisis agrupando por variedad, y país.
- Generar tablas de resumen usando dyplr (filter, select, arrange, summarize, mutate, y group_by).
Contenido de ayudantía 1:
- Reforzar uso de métodos filter, select y arrange en base de datos MPG.
- Introducción al uso de RMarkdown como alternativa a la consola
Contenido de ayudantía 2:
- Reforzar uso de métodos mutate, group_by y summarize en base de datos MPG.
- Introducción al uso de RMarkdown como alternativa a la consola.
- Caso, ¿Cómo se comparan los vinos Chilenos y Argentinos? (2) (16-05-2023)
Objetivos de aprendizaje: Generar tablas de resumen en R para abordar un problema de negocios utilizando una base de datos de gran escala. Esta sesión usa los contenidos descritos en el Capítulo 2 del apunte de R del curso.
Contenidos específicos: Caso, ¿Cómo se comparan los vinos Chilenos y Argentinos?
- Contexto: Análisis de mercado, diferenciación de productos, análisis percepción.
- Identificar en qué se diferencian los vinos Chilenos de los Argentinos, tomando en cuenta precio, calidad (ranking), ratio precio-calidad, variedad y composición de variedades ofrecidas.
- Hacer análisis agrupando por variedad, y país.
- Generar tablas de resumen usando dyplr (filter, select, arrange, summarize, mutate, y group_by).
Contenido de ayudantía 1:
- Reforzar uso de métodos filter, select y arrange en base de datos MPG.
- Introducción al uso de RMarkdown como alternativa a la consola
Contenido de ayudantía 2:
- Reforzar uso de métodos mutate, group_by y summarize en base de datos MPG.
- Introducción al uso de RMarkdown como alternativa a la consola.
- Trabajo Práctico (23-05-2023)
- Introducción a la gramática de grafos (30-05-2023)
Objetivos de aprendizaje: Construir gráficos de tipo histograma, box-plot, barra, línea y scatter usando la gramática de grafos de ggplot2. Identificar los formatos en que deben estar las tablas de datos para generar los gráficos que corresponden, y saber ajustar los formatos para poder hacerlo. Esta sesión cubre los contenidos descritos en el Capítulo 3 del apunte de R del curso
Contenido de ayudantía:
- Utilizar ggplot2 para elaborar gráficos que describan una variable: histograma (caso variable continua y discreta), box-plot, densidad, ojiva y violín.
Contenidos específicos: Clase formato cátedra.
- Taxonomía de gráficos y elementos básicos : mapeos, estética y escala.
- Introducción a ggplot2: Codificación de un grafo.
- Gráficos que permiten analizar una o dos variables:
- Box-plot e histograma.
- Columna, Línea y Scatter.
- Caso, explorando la industria de los videojuegos (1) (06-06-2023)
Objetivos de aprendizaje: Generar gráficos que resuman estadísticos simples en R para responder un problema de negocios en una base de datos grande. Esta sesión usa los contenidos descritos en el Capítulo 3 del apunte de R del curso.
Contenidos específicos: Caso, Explorando la industria de los videojuegos
- Contexto: Análisis del mercado: Market-Share y tendencias en el tiempo.
- Identificar la participación de mercado de un género de video-juegos. Profundizar el análisis según zona geográfica, consola, y variación en el tiempo.
- Analizar la atomización del mercado: Líderes de ventas, participación de vendedores más pequeños.
- Hacer análisis estandarizados (normalizados) dentro de una categoría, con tablas de resumen y gráficos.
Específicamente, en esta clase se desarrollará un análisis exploratorio de la base de datos vgsales usando R / Tidyverse, a fin de responder una pregunta de negocios. Se espera que el alumno pueda usar los métodos básicos de ggplot2 (geom_histogram, geom_col, geom_scatter, geom_line) para generar gráficos que resuman información relevante.
Contenido de ayudantía 1:
- Utilizar ggplot2 para elaborar gráficos con más de dos variables: Gráficos de barra de distinto tipo (stack, dodge, fill), línea de múltiples tipo (área, múltiples líneas), y scatter (uso de colores, radio, y formas para marcar puntos).
Contenido de ayudantía 2:
- Utilizar ggplot2 para hacer anotaciones, y editar leyendas, títulos, y ejes de un gráfico.
- Caso, explorando la industria de los videojuegos (2) (13-06-2023)
Objetivos de aprendizaje: Generar gráficos que resuman estadísticos simples en R para responder un problema de negocios en una base de datos grande. Esta sesión usa los contenidos descritos en el Capítulo 3 del apunte de R del curso.
Contenidos específicos: Caso, Explorando la industria de los videojuegos
- Contexto: Análisis del mercado: Market-Share y tendencias en el tiempo.
- Identificar la participación de mercado de un género de video-juegos. Profundizar el análisis según zona geográfica, consola, y variación en el tiempo.
- Analizar la atomización del mercado: Líderes de ventas, participación de vendedores más pequeños.
- Hacer análisis estandarizados (normalizados) dentro de una categoría, con tablas de resumen y gráficos.
Específicamente, en esta clase se desarrollará un análisis exploratorio de la base de datos vgsales usando R / Tidyverse, a fin de responder una pregunta de negocios. Se espera que el alumno pueda usar los métodos básicos de ggplot2 (geom_histogram, geom_col, geom_scatter, geom_line) para generar gráficos que resuman información relevante.
Contenido de ayudantía 1:
- Utilizar ggplot2 para elaborar gráficos con más de dos variables: Gráficos de barra de distinto tipo (stack, dodge, fill), línea de múltiples tipo (área, múltiples líneas), y scatter (uso de colores, radio, y formas para marcar puntos).
Contenido de ayudantía 2:
- Utilizar ggplot2 para hacer anotaciones, y editar leyendas, títulos, y ejes de un gráfico.
- Trabajo Práctico (20-06-2023)
En esta prueba los alumnos deberán demostrar dominio de los contenidos vistos en las sesiones 12, 13 y 14.
- Ayudantía + recuperativas (23-06-2023)