Análisis de datos empresariales con R

Por: edX . en: , ,

Overview

Si tomas decisiones en tu empresa o deseas involucrarte en la ciencia de datos y el uso de tecnologías computacionales, este curso es para ti.

El análisis multivariado es muy importante y único, al tomar en cuenta al mismo tiempo las diferentes variables a las que está sujeta una entidad, la cual puede ser numérica o categórica, es decir, podemos analizar tanto datos que representan propiedades físicas o químicas, como datos que que son indicadores de una situación o estado.

De esta forma podemos analizar cualquier tipo de información proveniente de nuestra empresa y ser capaces de tomar mejores decisiones al considerar todos los factores que afectan a nuestro elemento en cuestión. Y esta es la parte que casi iguala la capacidad de nuestro cerebro de poder decidir de forma casi instantánea y ponderar todas las variables involucradas en la toma de una decisión que puede ser de vida o muerte.

Cada vez que manejamos sometemos a nuestro cerebro a un continuo análisis multivariado que pondera variables como la velocidad, las condiciones del clima, del camino, las distracciones internas y externas o los imprevistos que pudiéramos encontrar. Esto es lo que hacemos en el análisis multivariado, considerar muchas variables, discriminarlas, agruparlas, relacionarlas y conformar grupos de datos.

A lo largo de este curso, aprenderás las principales técnicas del análisis multivariante empleando R y R studio como herramienta de análisis, graficación y toma de decisiones. El software R de análisis estadístico y la plataforma de desarrollo R studio poseen la gran ventaja de ser de uso libre, con una gran comunidad de programadores que la enriquecen con librerías que hacen su uso sencillo y extremadamente poderoso.

En este curso, además de aprender los fundamentos de R y R studio, aplicaremos las técnicas de análisis multivariado como: componentes principales, análisis de clústeres y análisis discriminante en la solución de problemas y casos empresariales. No necesitas experiencia previa en programación solo conocimientos básicos de estadística, te guiaremos paso a paso en el uso de de estas herramientas y su aplicación.

Syllabus

Módulo 1: Introducción al análisis multivariado

Submódulo: Caracterización de datos de tipo multivariado

  • ¿Qué son los datos multivariados y como los empleamos?
  • Covarianzas y correlaciones de datos
  • Distribución Normal y covarianza de datos multivariados
  • Ejemplo de aplicación de análisis de covarianzas y Normal multivariable

Módulo 2: Análisis visual de Datos Multivariados

Submódulo: Graficando el Data Frame de un conjunto de datos

  • Leyendo datos de un archivo externo y acondicionando el data frame
  • Técnicas de Graficación para el análisis multivariado de datos
  • Analizando patrones de datos mediante librerías de graficación
  • Predicción de tendencias usando parámetros estadísticos

Módulo 3. Análisis de clusters

Submódulo: Analizando datos mediante clústeres

  • Introducción
  • Métodos jerárquicos
  • Métodos de agrupamiento no jerárquicos
  • Técnicas de k-medias

Módulo 4. Análisis de componentes principales

Submódulo: Analizando datos por Componentes Principales

  • Cálculo de los componentes principales
  • Variabilidad explicada por los componentes
  • Criterios para determinar el número de componentes principales
  • Aplicación de los componentes principales

Módulo 5. Análisis discriminante

Submódulo: Analizando datos categóricos

  • Etapas para realizar un análisis discriminante
  • Análisis discriminante múltiple
  • Interpretación de resultados y mapa territorial

Plataforma