Laboratorio de Detección de Objetos
Entender predicciones de cajas delimitadoras
Aprender fundamentos de arquitectura YOLO
Dominar conceptos de IoU y NMS
Aplicar detección de objetos a imágenes
Playground de Detección de Objetos
Aprende YOLO, R-CNN, bounding boxes, IoU y NMS
Guía de Aprendizaje
Elige tu estilo de aprendizaje
¿Qué Hace?
Demuestra regresión de cajas delimitadoras y NMS. Cubre enfoques basados en anclas (Faster R-CNN) y sin anclas (YOLO, FCOS). Muestra métricas IoU, puntuación de confianza, clasificación multi-clase sobre ubicaciones espaciales.
¿Cómo Funciona?
- 1Dos etapas (Faster R-CNN): (1) Red de Propuesta de Regiones genera propuestas, (2) RoI pooling + clasificación
- 2Una etapa (YOLO): detección basada en cuadrícula, cada celda predice (x,y,w,h,conf,probs_clase)
- 3Codificación de caja delimitadora: Δx = (x-x_ancla)/w_ancla, Δy similar, Δw = log(w/w_ancla)
- 4Loss = L_loc (L1 suave en coords de caja) + L_conf (focal loss) + L_cls (cross-entropy)
- 5NMS: ordenar por confianza, suprimir cajas con IoU > umbral (0.5 típico)
- 6Métricas: mAP (Precisión Promedio media), umbrales IoU 0.5:0.95
Analogía Simple
Detección de objetos = localización (¿dónde?) + clasificación (¿qué?). Anclas son plantillas de cajas delimitadoras previas. NMS elimina detecciones duplicadas mediante supresión greedy.
Concepto Clave
Dos etapas: preciso pero lento (5-20 FPS). Una etapa: rápido pero menos preciso (30-150 FPS). Transformers modernos (DETR): predicción basada en conjuntos, no necesita NMS. Trade-off: velocidad vs accuracy.
Conceptos Fundamentales
IoU (Intersección sobre Unión)
Mide superposición de cajas: IoU = Área(superposición) / Área(unión). IoU > 0.5 = buena detección. Usado en NMS y mAP.
Supresión No Máxima
Remueve cajas duplicadas. Mantener caja de mayor confianza, suprimir otras con IoU > 0.5. Previene múltiples detecciones del mismo objeto.
Cajas Ancla
Plantillas de cajas pre-definidas (varias escalas/relaciones de aspecto). Modelo predice ajustes de offset. Faster R-CNN usa 9 anclas por ubicación.
Aplicaciones del Mundo Real
Autos Autónomos
Detectar peatones, vehículos, señales de tráfico, marcas de carril. Detección en tiempo real (30 FPS) en hardware edge (Nvidia Jetson).
Imagenología Médica
Detectar tumores, lesiones, anormalidades en rayos X/tomografías. Asiste radiólogos con tamizaje automatizado.
Vigilancia por Video
Rastrear personas, detectar intrusiones, contar multitudes. Usado en sistemas de seguridad, analítica de retail.
Pruébalo Tú Mismo
Experimento de Umbral NMS
Umbral IoU 0.3 = supresión agresiva (menos cajas). IoU 0.7 = leniencia (más cajas). Ajustar según densidad de objetos.
Umbral de Confianza
Umbral 0.5 = balanceado. 0.8 = alta precisión, bajo recall. 0.3 = alto recall, baja precisión (muchos falsos positivos).
Errores Comunes a Evitar
❌ Sin NMS → detecciones duplicadas
¿Por Qué? Mismo objeto detectado múltiples veces. Siempre aplica NMS con umbral IoU 0.4-0.6.
❌ Escalas de ancla incorrectas
¿Por Qué? Anclas deben coincidir con tamaños de objetos en dataset. Analiza estadísticas de dataset (anchos/altos de cajas) para diseñar anclas.
Instrucciones
- 1. Selecciona una imagen de muestra
- 2. Elige una clase y dibuja cajas haciendo clic y arrastrando
- 3. Ajusta el umbral de confianza para filtrar detecciones
- 4. Habilita NMS para eliminar cajas duplicadas
- 5. Compara tus cajas con ground truth (verde = correcto)
Estadísticas de Detección
Cajas Totales
0
Después de NMS
0
IoU Promedio con GT
0.00
Arquitectura YOLO
YOLO divide imagen en grilla SxS. Cada celda predice B bounding boxes con (x,y,w,h,confianza,clase). Usa anchor boxes para diferentes formas de objetos.
IoU (Intersection over Union)
IoU = Área de Superposición / Área de Unión. IoU > 0.5 = buena detección, IoU > 0.7 = excelente.
NMS (Non-Maximum Suppression)
NMS elimina detecciones duplicadas: ordenar por confianza → mantener más alta → eliminar cajas superpuestas si IoU > umbral → repetir.
Score de Confianza
Probabilidad de que caja contenga objeto × precisión de ubicación. Mayor = más certeza.