Minería de Datos y Machine Learning

Módulo I: Fundamentos y Preparación de datos

Minería de Datos y Machine Learning – Módulo I: Fundamentos y Preparación de datos

mineria-de-datos-machine-learning

Inicio:

septiembre 25, 2020

Hora:

6:00 pm

DURACIÓN: 32 horas académicas en 8 sesiones
HORARIO: Miércoles y viernes de 6.00 pm a 9.15 pm (Hora de Lima, UTC -5)
MODALIDAD: Online en vivo

Este módulo del curso tiene como objetivo introducir a los participantes en los fundamentos de la minería de datos y el aprendizaje automatizado, así como presentar diversas técnicas de exploración, visualización y preparación de datos previos al modelamiento.

OFERTA US$ 210 (ó S/ 756)
20% Dscto. Precio Regular: US$ 265
#QuédateEnCasa

REGÍSTRATE

  • Nuestros instructores cuentan, además de una notable experiencia profesional, de una prestigiosa trayectoria académica.
  • Los certificados otorgados a nombre de PeruStat Analytics acreditan a los participantes de haber participado o aprobado el curso, según sea el caso.

DESCARGA EL SÍLABO

De manera específica el participante estará en capacidad de:

  • Reconocer los conceptos fundamentales asociados a Minería de Datos, entendiendo cuáles son las diferentes fuentes de información a utilizar.
  • Entender las 4 fases fundamentales del aprendizaje automatizado.
  • Comprender el Proceso de Descubrimiento de Conocimiento en Bases de Datos(KDD).
  • Realizar un pre procesamiento de datos, con la finalidad de posteriormente entender y aplicar las diferentes técnicas de extracción de conocimiento de datos.
  • Entender los grandes desafíos del análisis de bases de datos a nivel del Preprocesamiento necesario.
  • Aplicar e interpretar adecuadamente las principales técnicas de Minería de Datos usando R y RStudio.
  • Comprender el desarrollo de los algoritmos de las principales técnicas de Minería de Datos.
  • Presentar de manera efectiva los resultados obtenidos.

UNIDAD 1: INTRODUCCIÓN

TEMA 1: Conceptos básicos (3 horas)

  • Breve historia de la analítica de datos.
  • Definiciones básicas: Estadística. Ciencia de Datos. Minería de Datos. Aprendizaje automatizado. Relación con otras disciplinas
  • Las 4 fases fundamentales del aprendizaje automatizado:
    • Entendimiento de datos: ¿Qué nos están diciendo?
    • Predicción: ¿Que sucederá?
    • Toma de decisiones: ¿Qué hacer?
    • nferencia causal: ¿Funcionará?
  • Taxonomía de las técnicas de Minería de Datos: Tipos de modelos. Tipos de
    aprendizaje. Técnicas no supervisadas y supervisadas. Aplicaciones.
  • Fases de la Minería de Datos. Descubrimiento de Conocimiento en Bases de
    datos (KDD).
  • CRISP-DM: Estructura Básica. Fases.
  • Herramientas de Minería de Datos.

TEMA 2: Entendimientos de datos (5 horas)

  • El proceso de Entendimiento de datos.
  • Tipos de datos.
  • Datos de registro: Atributos y escala de Medición.
  • Exploración y Visualización de datos.
    • Resumen de datos: medidas estadísticas de tendencia, posición (cuantiles), variabilidad y asimetría.
    • Gráficos univariados y bivariados

UNIDAD 2: PREPROCESAMIENTO DE DATOS

TEMA 3: Limpieza y transformación de datos (16 horas)

  • Importancia y calidad de datos.
  • Principales tareas.
  • Datos perdidos: Tipos. Detección. Imputación.
  • Outliers (valores atípicos): Outliers univariados. Outliers multivariados. Outliers
  • basados en densidad local. Otros métodos.

  • Transformación de datos: Puntajes Z.

TEMA 4: Reduccion de información (8 horas)

  • Discretización.
  • Reducción de la dimensionalidad y extracción de nuevas características: Análisis de Componentes Principales.

Enver Tarazona

Enver trabajó como experto de la Dirección de Calidad, Procesos y Lealtad de Telefónica Móviles S.A. Cuenta con más de 12 años de experiencia como docente en las principales universidades del país, desempeñándose actualmente como profesor auxiliar del Departamento Académico de Ciencias de la Pontificia Universidad Católica del Perú (PUCP). Es también profesor contratado en el Departamento Académico de Economía en la Universidad del Pacífico y la maestría de Ciencia de los Datos en la Universidad Ricardo Palma, además de profesor visitante en la maestría de Estadística Aplicada de la Universidad Nacional Agraria La Molina (UNALM).

Enver es Ingeniero Estadístico e Informático de la UNALM y Magíster en Estadística por la Pontificia Universidad Católica del Perú (PUCP), además de estudios culminados de maestría en Educación en la Universidad Peruana Cayetano Heredia (UPCH) y un diploma de segunda especialidad en Medición y Evaluación de Aprendizajes por la Pontificia Universidad Católica de Chile (UC). Cuenta además con diversas especializaciones en Machine Learning, Data Science y Big Data en el MIT, la Universidad de Columbia y la UC.

Se requieren los siguientes conocimientos previos:

  • Conocimientos básicos de análisis de datos
  • Manejo de datos con R

Antes de asistir:

1. Instale Zoom Client for Meetings. Recibirá una invitación a las sesiones de Zoom de parte de los instructores después de registrarse en el curso. El cliente nativo funciona mejor que el complemento del navegador.

2. Instale la última versión de R desde https://www.r-project.org/

3. Instale la última versión de RStudio desde http://www.rstudio.com/ide/download/

4. Asegúrese de tener una conexión a Internet estable y de que su micrófono, auriculares y cámara web funcionen en Zoom. Deberá utilizarlos durante todo el curso para comunicarse con los instructores y otros delegados.

DIRIGIDO A: Analistas de datos. Profesionales relacionados a la inteligencia de negocios, investigación de mercados e interesados en el área de Ciencia de Datos. Académicos e investigadores. Público en general que requiera extraer conocimiento desde diferentes fuentes de información.

METODOLOGÍA: La metodología del curso se basa en una combinación de clases teóricas y análisis de casos prácticos en la computadora, con la finalidad de que el participante comprenda la metodología, la motivación, los supuestos, las fortalezas y las debilidades de los métodos tratados en el curso. Cada sección del curso está motivada por un conjunto de datos en particular, de tal forma que el participante gane experiencia trabajando con una amplia variedad de fuentes de datos similares a los que usa en la realidad. Los contenidos están estructurados en 8 sesiones con un total de 32 horas académicas (24 horas cronológicas).

Solicita más información de este curso a través del siguiente formulario:
Sorry, Event Expired

Preguntas frecuentes del evento

¿Cuáles son las formas de pago?

Para residentes de Perú, las opciones son: transferencia bancaria, PayPal y Culqi (Visa, Mastercard, Diners, AMEX) / Para no residentes de Perú, las opciones son: PayPal y Culqi (Visa, Mastercard, Diners, AMEX)

¿Se puede pagar en partes?

Sí. Sabemos que la situación en nuestros países es complicada y tienes la opción de hacerlo en dos partes de la siguiente manera: 60% del valor del curso antes del inicio del curso y el 40% restante hasta antes de la cuarta semana. Puedes escribirnos a info@perustat.com para solicitarlo.

¿Cómo accedo al precio de estudiante?

Para este curso tenemos un precio especial en beneficio de los estudiantes de pre-grado o post-grado. Para demostrar que eres estudiante sólo debes hacernos llegar algún documento en formato digital que acredite tu matrícula en el presente semestre. Puedes realizar tu registro y posteriormente escribirnos a info@perustat.com con tu documento adjunto.

¿Cuáles son las políticas de cancelación y devolución?

Si la cancelación de su inscripción a algún curso o taller se diese a 15 días o más de la fecha de inicio del curso, se devolverá el monto pagado menos el 6%. Si la cancelación se diese entre los 7 y 14 días antes de la fecha de inicio del curso o taller, se devolverá el monto pagado menos el 50%. Si la cancelación se diese con 6 días o menos de la fecha de inicio del curso, no habrá devoluciones.

¿Qué tipo de certificado se emite al finalizar el curso?

Se emite de manera excluyente y en formato digital uno de los siguientes certificados según sea el caso: 1. Certificado de asistencia: Para obtener este certificado debe de mantener un porcentaje mínimo de 75% de asistencia a las clases. 2. Certificado de aprobación: El 100% de la calificación final se obtiene sobre la base de pruebas objetivas o actividades colaborativas. Para recibir el certificado de aprobación el participantes deben obtener al menos un 70% de los puntos posibles y contar con el porcentaje mínimo de asistencia a clases. Estos certificados se otorgan a nombre de PeruStat Analytics S.A.C. que acredita a los participantes del curso.

¿Existe una fecha límite para la cual debo registrarme?

No. Puede registrarse hasta el inicio del taller o curso, aunque la matrícula debe pagarse antes de recibir acceso a la plataforma de transmisión en vivo y los materiales del curso; y, siempre que las vacantes al curso no hayan alcanzado el límite.

¿Qué tipo de materiales se entregan en los talleres y cursos?

El material que se comparte incluye presentaciones con un resumen de los temas vistos en la clase y scripts con las aplicaciones de cada sesión.

¿Cómo sucede la interacción con el instructor durante cada sesión online en vivo?

Los participantes pueden hacer preguntas basadas en texto usando una función de Zoom que será monitoreada por el personal de PeruStat Analytics y transmitida al instructor. Si no se puede responder una pregunta durante la conferencia, se proporcionará una respuesta de texto en un momento posterior. Los participantes también pueden utilizar la función "Levantar la mano" para hacer una pregunta de forma oral.

¿Se pueden hacer consultas a los instructores fuera de las sesiones en vivo durante el período de duración del curso?

Sí. Se habilitará un espacio dentro del aula virtual, al que los participantes tendrán acceso, donde podrán hacer sus consultas relacionadas al curso y un instructor podrá luego atenderlas dándoles respuesta.

¿Las clases quedan grabadas?

Sí. Las grabaciones completas de la transmisión en vivo estarán disponibles para todos los participantes durante los 15 días posteriores a la finalización de un taller y los 30 días posteriores a la finalización de un curso, según sea el caso. El participante no puede guardar las grabaciones y no estarán disponibles después del período establecido.

¿Puedo guardar los archivos de video grabados de la conferencia para usarlos más tarde?

No. Estos estarán disponibles para transmisión durante quince días después de la finalización de un taller o treinta días después si se tratara de un curso. Es una violación de los derechos de autor registrar y retener estos archivos para sus propios fines o distribuirlos a otros.

¿Brindan soporte técnico en el caso un usuario tenga problemas de conexión o configuración?

PeruStat no puede proporcionar soporte técnico para problemas del usuario final. Como tal, los participantes son totalmente responsables de la conectividad que admite la transmisión en vivo de audio y video. Se proporcionará información sobre el ancho de banda mínimo requerido y los métodos para probar la conectividad. Sin embargo, en la baja probabilidad de que un participante no pueda conectarse, habrá acceso a las sesiones grabadas durante quince (15) días después de la finalización del taller ó treinta (30) días después de la finalización del curso, según sea el caso.

¿Qué pasa si la opción de transmisión en vivo no me funciona?

Cada participante es responsable de la conectividad por su lado y nosotros somos responsables de todos los problemas de transmisión en nuestro lado. Si hay un problema técnico por nuestra parte, recibirá un reembolso completo (o prorrateado si los problemas son inferiores a los cinco días completos). Si hay un problema técnico de su parte, no podemos ofrecer un reembolso, pero aún podrá acceder a las sesiones grabadas.

¿Cuáles son los requisitos de conectividad?

Debido a que los participantes reciben la transmisión de Zoom y no transmiten imágenes de video, los requisitos de conectividad son mínimos. Se requiere un mínimo de 150 kbps (kilobytes por segundo) para participar en un video seminario web, y esto puede ser por cable o inalámbrico. Dadas las conexiones a Internet domésticas típicas o el acceso WiFi personal, estos requisitos son bastante bajos. Por ejemplo, se recomienda utilizar una conexión de 3000 kbps (o 3 Mbps, megabytes por segundo) para transmitir una película en Netflix. Un punto de acceso WiFi típico en un teléfono celular típico es de 20-30 Mbps, por lo que cualquier conexión a Internet estándar debe permitir la participación ininterrumpida en el seminario web. Ver https://www.speedtest.net/ para evaluar su propia velocidad de conexión. Tenga en cuenta que una fuente típica de problemas de conectividad en el hogar es vincular el dispositivo a la unidad de transmisión WiFi, así que asegúrese de que su dispositivo tenga líneas ininterrumpidas de sitio al módem inalámbrico; ver, por ejemplo, https://www.familyhandyman.com/smart-homeowner/9-simple-tips-for-faster-wi-fi/

Vacantes: 50

Fechas

  • septiembre 25, 2020
    6:00 pm - 9:15 pm
  • septiembre 30, 2020
    6:00 pm - 9:15 pm
  • octubre 2, 2020
    6:00 pm - 9:15 pm
  • octubre 7, 2020
    6:00 pm - 9:15 pm
  • octubre 9, 2020
    6:00 pm - 9:15 pm
  • octubre 14, 2020
    6:00 pm - 9:15 pm
  • octubre 16, 2020
    6:00 pm - 9:15 pm
  • octubre 21, 2020
    6:00 pm - 9:15 pm

Ver todas las fechas

Ocultar todas las fechas

¡Compártelo!

Ir a Arriba