Curso online Introducción a la Minería de Datos con Aplicaciones en R

curso online de mineria de datos

BENEFICIOS DE LA MODALIDAD ONLINE:
  • Podrás seguir nuestro curso en vivodesde tu casa u oficina en las fechas y horas indicadas a través de tu PC o Mac.
  • Tendrás a un instructor que además de ser un experto en la materia está capacitado para manejar la plataforma de entrenamiento y así lograr los objetivos de aprendizaje deseados durante cada sesión.
  • Podrás hacer preguntas y obtendrás respuestas en tiempo real.
  • Las sesiones serán registrada en un vídeo al cuál podrás acceder en cualquier momento hasta 2 meses después de finalizado el curso, de esta forma no te perderás de nada.

Durante las últimas décadas se ha producido un desarrollo explosivo en las tecnologías de base de datos y la cantidad de datos que es recolectada. Esto ha creado una oportunidad sin precedentes para la Minería de Datos mediante el proceso de descubrimiento, ya sea supervisado o no, de información interesante y útil a partir de repositorios de datos disponibles.

La Minería de Datos está relacionada con el análisis, mayormente estadístico, de grandes conjuntos de datos con la finalidad de proporcionar ideas, patrones, modelos descriptivos y predictivos que permitan extraer y generar conocimiento para las organizaciones. Algunas de las tareas más comunes son la clasificación, agrupamiento, descubrimiento de reglas de asociación y patrones de respuestas, detección de anomalías, etc.

Dentro de los distintos programas estadísticos disponibles, el R proporciona una poderosa plataforma open source para la aplicación de la Minería de Datos, aunque por lo general el manejo de códigos y la programación es un reto para los analistas de datos que quieren utilizar esta herramienta. La libreria Rattle (R Analytical Tool To Learn Easily) adiciona una interfaz gráfica de usuario específicamente diseñada para facilitar la aplicación de la principales técnicas de Minería de Datos a los usuarios que no están acostumbrados al entorno de trabajo de este programa.

  • Directores, ejecutivos, gerentes, jefes, supervisores y analistas que deseen revisar y profundizar sus conocimientos en los fundamentos estadísticos del análisis de datos para la toma de decisiones.
  • Profesionales de diversas áreas que tengan la necesidad de llevar a cabo análisis de datos para optimizar la toma de decisiones.
  • Estudiantes y académicos que desean aprender a utilizar el software R para el análisis de datos.

La metodología del curso online Introducción a la Minería de Datos con aplicaciones en R se basa en la aplicación práctica de los conceptos teóricos. Cada sección del curso está motivada por un conjunto de datos en particular, de tal forma que el participante gane experiencia trabajando con una amplia variedad de fuentes de datos similares a los que usa en la realidad. Los contenidos del curso están estructurados en 6 sesiones con un total de 24 horas académicas.

Enver G. Tarazona Vargas

Enver Tarazona es Director Académico y co-fundador de Perustat Analytics. Trabajó como experto de la Dirección de Calidad, Procesos y Lealtad de Telefónica Móviles S.A. Cuenta con más de 7 años de experiencia como docente en las principales universidades del país, desempeñándose actualmente como profesor en la Pontificia Universidad Católica del Perú (PUCP) y en la Universidad del Pacífico (UP). Es también profesor invitado del curso de Minería de Datos en la maestría de Estadística Aplicada de la Universidad Nacional Agraria La Molina (UNALM). Tiene además experiencia como capacitador en programas de análisis estadístico como R, SPSS, SAS y Stata para diversas empresas e instituciones entre las que figura Telefónica Móviles S.A., la Superintendencia Nacional de Administración Tributaria (SUNAT) y la Caja Municipal de Ahorro y Crédito Huancayo S.A.

Enver es Ingeniero Estadístico e Informático de la UNALM y Magister en Estadística por la PUCP. Tiene también estudios culminados de maestría en Educación en la Universidad Peruana Cayetano Heredia (UPCH) . Su área de investigación se centra en el ámbito de la Teoría de Respuesta al íItem (TRI) bajo inferencia Bayesiana aplicada al Marketing, comportamiento del consumidor y la medición educativa. Ha participado frecuentemente como expositor en diversos eventos académicos nacionales e internacionales.

Ver el perfil de Enver Tarazona Vargas en LinkedInVer el perfil de Enver Tarazona Vargas

José A. Caycho Huamani

José Caycho trabaja como Analista Senior de Investigación de Marcados en la Dirección de Marketing de Supermercados Peruanos S.A. perteneciente al Grupo InRetail. Cuenta con más de 3 años de experiencia en el rubro de Retail, Conocimiento del Consumidor y de Investigación de Mercados. Es también docente en la División de Estudios Profesionales para Ejecutivos (EPE) de la Universidad Peruana de Ciencias Aplicadas (UPC)

José es Bachiller Estadístico e Informático de la Universidad Nacional Agraria La Molina (UNALM),
Especialista en Gestión de la Calidad y Productividad Total y candidato a Magister en Estadística
Aplicada por la UNALM.

Ver el perfil de José A. Caycho en LinkedInVer el perfil de José A. Caycho

Ebson David Allende Quintana

David Allende es Experto en Modelamiento Predictivo de la División de “Customer Relationship and Management” (CRM) del Banco Internacional del Perú. Ha sido experto en Datamining en la División de Inteligencia de Negocios de Telefónica del Perú, Consultor Analítico y Capacitador de SPSS Andino. Es profesor a tiempo parcial en la División de Estudios Profesionales para Ejecutivos (EPE) de la Universidad Peruana de Ciencias Aplicadas (UPC) y el Centro de Tecnologías de Información de la Universidad César Vallejo.

David es Especialista en Inteligencia de Negocios de la Universidad ESAN, Ingeniero Estadístico e Informático de la Universidad Nacional Agraria La Molina. Experiencia en proyectos de Business Analytics, Business Intelligence, Big Data con importantes entidades locales e internacionales en los rubros de banca, telecomunicaciones, consumo masivo y gobierno.

Ver el perfil de David Allende en LinkedInVer el perfil de David Allende

Contenidos

UNIDAD 1: INTRODUCCIÓN

SESIÓN 1: Conceptos Básicos
  • Breve historia de la Estadística y Minería de Datos. Conceptos básicos. Definición. Relación con otras disciplinas.
  • Taxonomía de las técnicas de Minería de Datos: Tipos de modelos. Tipos de aprendizaje. Técnicas no supervisadas y
  • supervisadas. Aplicaciones.
  • Fases de la Minería de Datos. Descubrimiento de Conocimiento en Bases de datos (KDD).
  • CRISP-DM: Estructura Básica. Fases.
  • Herramientas de Minería de Datos. Instalación de R y de la librería Rattle.
  • Primeros pasos con Rattle. Manejo de Datos.

UNIDAD 2: ANALÍTICA DESCRIPTIVA

SESIÓN 2: Visualización y Transformación de Datos
  • Resumen de datos.
  • Gráficas de distribuciones.
  • Gráficas Interactivas.
  • Transformación.
  • Imputación.
  • Reducción de la Dimensionalidad: Análisis de Componentes Principales.
SESIÓN 3:Técnicas de Segmentación.
  • Análisis de Conglomerados (Cluster): Definición. Requerimientos. Medición de la similaridad y distancias. Principales algoritmos.
  • Conglomerados Jerárquicos
  • Conglomerados no Jerárquicos: K-Medias. EWK (Entropy Weighted KMeans)

UNIDAD 3: ANALÍTICA PREDICTIVA

SESIÓN 4: Regresion Binaria
  • Modelamiento predictivo: Conceptos básicos. Predicción numérica vs.clasificación. Precisión del modelo e interpretación. Balance entre la varianza y sesgo de un modelo predictivo.
  • Modelos de Clasificación lineal y no lineal. Predicción y matrices de confusión.
  • Clasificación binaria: Estimación del modelo de regresión logística binaria: Interpretación de los coeficientes. Validación del modelo.
  • Modelo Probit.
SESIÓN 5: Árboles de Clasificación
  • Árboles de Decisión: Representación. Partes de un Árbol de Decisión.
  • Inducción y aprendizaje. Medidas de Selección de Atributos. Principales Algoritmos.
  • Árboles de Clasificación y Regresión (CART). Construcción y poda del árbol.
  • Árboles por inferencia condicional.
SESIÓN 6: Evaluación y Despliegue de un Modelo
  • Evaluación: Matriz de Confusión. Curvas de Riesgo. Curvas ROC.
  • Scoring.
  • Predictive Model Markup Language (PMML): Exportación de modelos para su implementación.

MÁS INFORMACIÓN

MODALIDAD
Online (Conferencia web)
(Revisa los Requisitos Técnicos)

FECHAS
Sábados 24 y 31 de Octubre; 7, 14, 21 y 28 de Noviembre de 2015 de 2 a 6 pm

NIVEL
Básico

CONOCIMIENTOS REQUERIDOS
Conocimientos básicos en inferencia estadística y análisis de datos.

DURACIÓN
24 Horas Académicas en 6 sesiones.

INVERSIÓN
Público en General: S/. 1200 (ó US$ 400)

Inscripción Temprana (hasta el 17 de octubre de 2015): S/. 850 (ó US$ 280)

Estudiantes de Pre-Grado: S/. 600 (ó US$ 200)
Académicos / Estudiantes de Post-Grado: S/. 850 (ó US$ 280)

La inversión incluye certificado de participación digital emitido por PeruStat Analytics.

Todos los precios incluyen IGV.

FORMAS DE PAGO

1. Transferencia ó Depósito Bancario a nuestra cuenta corriente en soles

BANCO DE CRÉDITO DEL PERÚ
Titular: PeruStat Analytics S.A.C.
Cta. Cte. N° 194-2107756-0-63
CCI N° 00219400210775606395

2. A través de PayPal con tu tarjeta de crédito o débito. Si este es tu caso, por favor ponte en contacto con nosotros para enviarte los pasos de pago.

Nuestros alumnos provienen de los principales sectores de la economía y empresas del país: