Aplicaciones de Ciencia de Datos
Inicio:
12 febrero, 2021
Hora:
7:00 pm
REGÍSTRATE
DURACIÓN: 40 horas académicas en 10 sesiones
HORARIO: Viernes de 7.00 pm a 10.15 pm (Hora de Lima, UTC -5)
MODALIDAD: Online en vivo vía streaming
El curso está enfocado en presentar las principales aplicaciones de la Ciencia de Datos de tal forma que sea posible entender la interacción que existe entre el procesamiento de la información y su introducción en la gestión, tomando como punto de partida el entendimiento del problema de negocio para pasar al planteamiento de una solución analítica con datos, el diseño y desarrollo de su implementación para finalmente hacer su introducción a la gestión y su posterior seguimiento.
Dirigido a: Analistas de datos. Profesionales relacionados a la inteligencia de negocios e investigación de mercados. Público en general que requiera aplicar técnicas de análisis de datos en las empresas que laboran.
Al finalizar este curso, el participante será capaz de pensar en soluciones analíticas a los problemas que usualmente se enfrentan las empresas, como por ejemplo la eficiencia en las ventas, segmentación del mercado, entendimiento del consumidor; entendiendo todo el proceso que conlleva la implementación y seguimiento de dicha solución.
Como herramienta de trabajo se utilizará el software R y su interfaz RStudio para el procesamiento de los datos.
De manera específica el participante estará en capacidad de:
- Emplear R y RStudio como herramientas para el análisis de datos.
- Entendimiento de una problemática de negocio con una visión analítica
- Diseñar y entender una solución analítica hasta su implementación en la gestión.
- Desarrollar el proceso de construcción de un modelo, tomando la perspectiva del negocio y teniendo en cuenta el diseño de implementación.
- Desarrollar un proceso de seguimiento a nuestra propuesta de solución analítica que permita generar alertas de que el modelo desarrollado ya es obsoleto.
- Mostrar otros usos de la información en otros procesos críticos de la empresa como segmentación del mercado o conocimiento del consumidor.
Tema 1: Conceptos Básicos.
- Fundamentos del análisis de datos
- Conceptos de Business Analytics y Big Data
- Tipos de problemas de negocio
- Tipos de datos: estructurada y no estructurada
- Tipos de algoritmos: Regresión, Clasificación, Clusterización, Asociación, Análisis de redes y Optimización
- Diseño de una solución analítica
- Taller 1: R para la ciencia de datos
Tema 2: Caso Práctico número 1: Mejorar la eficiencia en las ventas de una empresa de telemarketing (Lead scoring).
- Conceptos de Lead Scoring
- Presentación del problema de negocio
- Diseño de la solución analítica (implementación)
- Exploración de datos (Feature Selection)
- Transformación de datos (Feature engineering)
- Selección de Modelos (Model Selection)
- Introducción a la Gestión
- Seguimiento
Tema 3: Caso Práctico número 2: Identificación del incumplimiento de pago para la banca (Credit Scoring).
- Conceptos y actualidad en Credit scoring
- Presentación del problema de negocio
- Diseño de la solución analítica (implementación)
- Exploración de datos (Feature Selection)
- Transformación de datos (Feature engineering)
- Selección de Modelos (Model Selection)
- Introducción a la Gestión
- Seguimiento
Tema 4: Caso Práctico número 3: Segmentación del Mercado (Marketing Analytics)
- Conceptos y actualidad en Marketing Analytics
- Presentación del problema de negocio
- Diseño de la solución analítica (implementación)
- Análisis de Clustering
Erick Saavedra
Erick Saavedra Palacios trabaja como Subgerente adjunto del área de modelamiento y metodologías de la gestión del riesgo de crédito en Banco de Crédito BCP. Cuenta con 4 años de experiencia en temas de construcción y validación de modelos de riesgo de crédito en el BCP y 2 años como analista económico en el Instituto Nacional de Defensa de la Competencia y de la Protección Intelectual (Indecopi). Adicionalmente, se ha desempeñado como docente en los cursos de Estadística y Microeconomía del XIX Curso de Extensión Universitaria en Políticas de Competencia y Propiedad Intelectual y actualmente se desempeña como docente de los cursos de Estadística Aplicada, Credit Scoring y Advance Analytics en academia Advance Analytics Academy.
Erick Saavedra es egresado de la Maestría en Estadística de la Pontificia Universidad Católica del Perú (PUCP) y es bachiller en economía de la misma universidad. Entre sus áreas de investigación se encuentran los modelos de riesgos competitivos bayesiano y ha desarrollado investigaciones y aplicaciones de modelos XGBOOST en modelos de riesgos.
– Manejo de Datos con R (De no contar con este conocimiento, podemos compartir un vídeo de nuestro taller luego de su inscripción.)
– Conocimientos básicos de estadística
Antes de asistir:
1. Instale Zoom Client for Meetings. Recibirá una invitación a las sesiones de Zoom de parte de los instructores después de registrarse en el curso. El cliente nativo funciona mejor que el complemento del navegador.
2. Instale la última versión de R desde https://www.r-project.org/
3. Instale la última versión de RStudio desde http://www.rstudio.com/ide/download/
4. Asegúrese de tener una conexión a Internet estable y de que su micrófono, auriculares y cámara web funcionen en Zoom. Deberá utilizarlos durante todo el curso para comunicarse con los instructores y otros delegados.
Certificación
- Certificado de asistencia: Para obtener este certificado debe de mantener un porcentaje mínimo de 75% de asistencia a las clases.
- Certificado de aprobación: El 100% de la calificación final se obtiene sobre la base de pruebas objetivas o actividades colaborativas. Para recibir el certificado de aprobación los participantes deben obtener al menos un 70% de los puntos posibles y contar con el porcentajemínimo de asistencia a clases.
Serán otorgados certificados digitales a nombre de PeruStat Analytics S.A.C. que acredita a los participantes del curso. La certificación que se otorga es excluyente.