Inicio » Cursos posgrado » Curso de Doctorado » Visión por Computadora con Aprendizaje Profundo

Visión por Computadora con Aprendizaje Profundo

    Docentes expositores/as: Marcelo Cappelletti y Martín Morales     

    Inscripción y postulación a becas: del 18 al 25 de mayo

    Fecha de realización: del 15 de julio al 31 de agosto de 2026  

    Carga horaria: 40 horas   

    Metodología: Teórico- práctico

    Modalidad: Virtual sincrónico. Los encuentros serán los lunes 20 y 27 de julio y todos los lunes de agosto, de 14 a 18 horas.  

    Código del curso: 47/DCYT

    Certificado: Se entregarán certificados de asistencia y aprobación de la Universidad Nacional de Quilmes.

    Arancel: Residentes en el país: $ 136000 (Extranjeros residentes en Argentina, deberán presentar certificado de residencia en el país. Caso contrario, la facturación se realizará como Residentes en otros países.)

    -Residentes en otros países: informes_posgrado@unq.edu.ar

    Proceso de Inscripción

    Antes de comenzar el proceso de inscripción, asegurate de tener una dirección de correo electrónico válida y que funcione correctamente, hasta obtener el usuario de estudiante de la UNQ, con dominio “@uvq.edu.ar”, el cuál se considerará automáticamente como su domicilio electrónico. Es importante destacar que las comunicaciones que enviemos a estas direcciones se considerarán válidas y suficientes a todos los efectos legales

    A continuación les facilitamos la guía de inscripción: “Guía de Inscripción a cursos de posgrado”

    Admisión

    Los/as aspirantes a las propuestas formativas de posgrado deberán poseer como mínimo alguna de las siguientes condiciones:
    a) Ser graduado/a universitario con título de grado final expedido por una Universidad Nacional, Universidad Provincial o Universidad Privada reconocida por el Poder Ejecutivo Nacional, correspondiente a una carrera con al menos cuatro (4) años de duración;
    b) Graduados/as de Universidades extranjeras reconocidas por las autoridades competentes en su país.
    c) Acreditar estudios terciarios completos de cuatro (4) o más años de duración con título final expedido por una institución reconocida por la autoridad educativa competente.

    Fundamentación

    Curso ofrecido en el marco del Doctorado en Ciencia y Tecnología

    Objetivos Generales:

    Dominar los principios, arquitecturas y técnicas de deep learning aplicadas a la visión artificial, con enfoque en clasificación, detección y segmentación de imágenes.

    Objetivos Específicos:

    Vinculación con los objetivos de la carrera:

    Unidades Temáticas

    Unidad 1. Fundamentos de la visión artificial y redes neuronales convolucionales

    Introducción a la visión por computadora: tareas, desafíos y aplicaciones. Procesamiento digital de imágenes: convolución, filtrado, normalización. Redes neuronales convolucionales (CNN): arquitectura, capas, funciones de activación y pooling. Implementación práctica de una CNN básica para clasificación de imágenes.

    Unidad 2. Arquitecturas clásicas y modernas de deep learning

    Evolución de las CNN: LeNet, AlexNet, VGG, ResNet, Inception. Transfer learning y fine-tuning de modelos preentrenados. Regularización, normalización por lotes, optimizadores y funciones de costo. Casos prácticos: clasificación de objetos y detección de defectos industriales.

    Unidad 3. Detección y segmentación de objetos

    Detección de objetos: R-CNN, Fast/Faster R-CNN, YOLO, SSD. Segmentación semántica y por instancias: U-Net, Mask R-CNN. Evaluación de modelos de detección (IoU, precisión, recall, mAP). Taller práctico con dataset propio o público (COCO, Pascal VOC, etc.).

    Unidad 4. Aplicaciones avanzadas y tendencias actuales

    Visión multimodal: integración con sensores o texto. Transformers en visión (ViT, DETR). Aplicaciones en IoT, robótica, agricultura, salud e industria.

    Proyecto final: desarrollo de un sistema de visión artificial basado en deep learning.

    Bibliografía obligatoria

    Unidad 1. Fundamentos de la visión artificial y redes neuronales convolucionales

    1. Szeliski, R. (2022). Computer Vision: Algorithms and Applications (2nd ed.). Springer. Cap. 1 y 3 (pp. 1–82). Disponible en: https://szeliski.org/Book/
    2. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. Cap. 9 – “Convolutional Networks” (pp. 326–366).

    Unidad 2. Arquitecturas clásicas y modernas de deep learning

    1. Krizhevsky, A., Sutskever, I., & Hinton, G. (2012). ImageNet Classification with Deep Convolutional Neural Networks. NeurIPS, 25, 1097–1105.
    2. He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770–778.

    Unidad 3. Detección y segmentación de objetos

    1. Girshick, R. (2015). Fast R-CNN. IEEE International Conference on Computer Vision (ICCV), 1440–1448.
    2. He, K., Gkioxari, G., Dollár, P., & Girshick, R. (2017). Mask R-CNN. IEEE Transactions on Pattern Analysis and Machine Intelligence, 42(2), 386–397.

    Unidad 4. Aplicaciones avanzadas y tendencias actuales

    1. Dosovitskiy, A., et al. (2021). An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR).
    2. Khan, S., Naseer, M., Hayat, M., Zamir, S. W., Khan, F. S., & Shah, M. (2022). Transformers in Vision: A Survey. ACM Computing Surveys, 54(10s), 1–41. https://doi.org/10.1145/3505244