Duración del curso: 10 de Diciembre - 19 de Diciembre
Martes y Jueves: 20:00 - 22:00 UTC-4
Sábado: 08:00 - 10:00 UTC-4
Modalidad: Online, En tiempo real por ZOOM
¡Incluye Certificado con carga horaria!.
¡Aprovecha el descuento de Preventa! Hasta el 2 de Diciembre (Un solo pago)
Este curso avanzado de Visión por Computadora cubre técnicas innovadoras, incluyendo CNNs avanzadas, Vision Transformers y Modelos de Difusión, explorando temas clave como ResNet, FPN, SimCLR y GANs. A través de teoría y prácticas, se ofrece una perspectiva integral de las técnicas modernas de generación y clasificación de imágenes.
Este curso está dirigido a estudiantes, investigadores y profesionales en inteligencia artificial y visión por computadora con idalmente conocimientos previos en redes neuronales y machine learning, interesados en técnicas avanzadas y aplicaciones de arquitecturas modernas en proyectos complejos.
En el curso descubrirás cómo implementar arquitecturas avanzadas como ResNet, entenderás Self-Supervised Learning con SimCLR, explorarás GANs, Vision Transformers y Modelos de Difusión, comprendiendo su impacto en la generación de imágenes de alta calidad.
Este curso combina teoría y práctica, comenzando con conceptos clave seguidos de ejercicios prácticos guiados en Python y PyTorch, con apoyo en tiempo real de los instructores. Las clases se imparten en vivo a través de Zoom, con acceso a grabaciones y recursos adicionales para reforzar el aprendizaje.
Para realizar este curso, es recomendable tener conocimientos previos en Python. Para aquellos inscritos que no cuenten con experiencia en el lenguaje, proporcionaremos material de nivelación en Python.
Se recomienda haber concluido el curso "Deep Learning para Computer Vision".
Este curso avanzado de Visión por Computadora abarca desde conceptos fundamentales de Convolutional Neural Networks (CNNs)
hasta arquitecturas y técnicas de última generación, como ResNetpara redes profundas y Self-Supervised Learning, que minimiza
la dependencia de datos etiquetados. También explorarás las Generative Adversarial Networks (GANs) para generación de imágenes,
los Vision Transformers (ViT) que utilizan transformadores en visión, y los Modelos de Difusión, una técnica emergente
para crear imágenes detalladas. Cada módulo combina teoría y práctica. Trabajarás con el framework PyTorch
en ejercicios
prácticos ofreciendo implementaciones guiadas de estas técnicas
avanzadas para aplicar en el análisis y procesamiento de imágenes.
Descubre los conceptos esenciales de las redes neuronales convolucionales (CNN), incluyendo su estructura básica y aplicaciones en visión por computadora. Además, profundiza en la arquitectura ResNet, su solución al problema de entrenamiento en redes profundas.
Explora el aprendizaje auto-supervisado y cómo ayuda a reducir la dependencia de grandes cantidades de datos etiquetados en visión por computadora. Con una implementación de SimCLR, ajusta modelos de autoaprendizaje y evalúa su rendimiento en tareas visuales con datasets pequeños.
Adéntrate en el mundo de las GANs, una arquitectura innovadora para la generación de imágenes a través de la interacción entre un generador y un discriminador. La clasee te permitirá entender su estructura y aplicaciones en visión por computadora.
Descubre cómo los Vision Transformers (ViT) adaptan la arquitectura de transformadores para visión por computadora y compara su funcionamiento y rendimiento con las CNNs. Mediante una implementación práctica, profundiza en la estructura y capacidad de interpretación de los ViTs en tareas de clasificación de imágenes.
Explora los modelos de difusión y su innovador enfoque en la generación de imágenes, diferenciándolos de otras arquitecturas generativas como las GANs. A través de una implementación práctica, observa las etapas de difusión y generación inversa en un dataset pequeño, visualizando los resultados generados.