Visión por Computadora con Aprendizaje Profundo

Docentes expositores/as: Marcelo Cappelletti y Martín Morales

Inscripción y postulación a becas: del 18 al 25 de mayo

Fecha de realización: del 15 de julio al 31 de agosto de 2026

Carga horaria: 40 horas

Metodología: Teórico- práctico

Modalidad: Virtual sincrónico. Los encuentros serán los lunes 20 y 27 de julio y todos los lunes de agosto, de 14 a 18 horas.

Código del curso: 47/DCYT

Certificado: Se entregarán certificados de asistencia y aprobación de la Universidad Nacional de Quilmes.

Arancel: Residentes en el país: $ 136000 (Extranjeros residentes en Argentina, deberán presentar certificado de residencia en el país. Caso contrario, la facturación se realizará como Residentes en otros países.)

-Residentes en otros países: informes_posgrado@unq.edu.ar

Proceso de Inscripción

Antes de comenzar el proceso de inscripción, asegurate de tener una dirección de correo electrónico válida y que funcione correctamente, hasta obtener el usuario de estudiante de la UNQ, con dominio “@uvq.edu.ar”, el cuál se considerará automáticamente como su domicilio electrónico. Es importante destacar que las comunicaciones que enviemos a estas direcciones se considerarán válidas y suficientes a todos los efectos legales

A continuación les facilitamos la guía de inscripción: “Guía de Inscripción a cursos de posgrado”

Admisión

Los/as aspirantes a las propuestas formativas de posgrado deberán poseer como mínimo alguna de las siguientes condiciones:
a) Ser graduado/a universitario con título de grado final expedido por una Universidad Nacional, Universidad Provincial o Universidad Privada reconocida por el Poder Ejecutivo Nacional, correspondiente a una carrera con al menos cuatro (4) años de duración;
b) Graduados/as de Universidades extranjeras reconocidas por las autoridades competentes en su país.
c) Acreditar estudios terciarios completos de cuatro (4) o más años de duración con título final expedido por una institución reconocida por la autoridad educativa competente.

Fundamentación

Curso ofrecido en el marco del Doctorado en Ciencia y Tecnología

Objetivos Generales:

Dominar los principios, arquitecturas y técnicas de deep learning aplicadas a la visión artificial, con enfoque en clasificación, detección y segmentación de imágenes.

Objetivos Específicos:

Vinculación con los objetivos de la carrera:

Unidades Temáticas

Unidad 1. Fundamentos de la visión artificial y redes neuronales convolucionales

Introducción a la visión por computadora: tareas, desafíos y aplicaciones. Procesamiento digital de imágenes: convolución, filtrado, normalización. Redes neuronales convolucionales (CNN): arquitectura, capas, funciones de activación y pooling. Implementación práctica de una CNN básica para clasificación de imágenes.

Unidad 2. Arquitecturas clásicas y modernas de deep learning

Evolución de las CNN: LeNet, AlexNet, VGG, ResNet, Inception. Transfer learning y fine-tuning de modelos preentrenados. Regularización, normalización por lotes, optimizadores y funciones de costo. Casos prácticos: clasificación de objetos y detección de defectos industriales.

Unidad 3. Detección y segmentación de objetos

Detección de objetos: R-CNN, Fast/Faster R-CNN, YOLO, SSD. Segmentación semántica y por instancias: U-Net, Mask R-CNN. Evaluación de modelos de detección (IoU, precisión, recall, mAP). Taller práctico con dataset propio o público (COCO, Pascal VOC, etc.).

Unidad 4. Aplicaciones avanzadas y tendencias actuales

Visión multimodal: integración con sensores o texto. Transformers en visión (ViT, DETR). Aplicaciones en IoT, robótica, agricultura, salud e industria.

Proyecto final: desarrollo de un sistema de visión artificial basado en deep learning.

Bibliografía obligatoria

Unidad 1. Fundamentos de la visión artificial y redes neuronales convolucionales

Szeliski, R. (2022). Computer Vision: Algorithms and Applications (2nd ed.). Springer. Cap. 1 y 3 (pp. 1–82). Disponible en: https://szeliski.org/Book/
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. Cap. 9 – “Convolutional Networks” (pp. 326–366).

Unidad 2. Arquitecturas clásicas y modernas de deep learning

Krizhevsky, A., Sutskever, I., & Hinton, G. (2012). ImageNet Classification with Deep Convolutional Neural Networks. NeurIPS, 25, 1097–1105.
He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770–778.

Unidad 3. Detección y segmentación de objetos

Girshick, R. (2015). Fast R-CNN. IEEE International Conference on Computer Vision (ICCV), 1440–1448.
He, K., Gkioxari, G., Dollár, P., & Girshick, R. (2017). Mask R-CNN. IEEE Transactions on Pattern Analysis and Machine Intelligence, 42(2), 386–397.

Unidad 4. Aplicaciones avanzadas y tendencias actuales

Dosovitskiy, A., et al. (2021). An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR).
Khan, S., Naseer, M., Hayat, M., Zamir, S. W., Khan, F. S., & Shah, M. (2022). Transformers in Vision: A Survey. ACM Computing Surveys, 54(10s), 1–41. https://doi.org/10.1145/3505244

Visión por Computadora con Aprendizaje Profundo

COMUNICACIÓN

SERVICIOS

UNIDADES ACADÉMICAS

ESCUELA