¿Cuán Largo Debería Ser Tu Período de Observación de Analítica Antes de Hacer un Cambio?
Por Emily Redmond, Analista de Datos en Emilytics · Abril 2026
TL;DR: Mínimo 2 semanas (considerar variación de día de la semana), mejor 4 semanas (considerar variación semanal). No midas cambios diarios como tendencias.
Observé a una empresa celebrar una victoria en prueba en el día 5.
La variante estaba arriba 30%. El CEO aprobó el lanzamiento.
Por el día 14, la variante estaba abajo 5%. Por el día 28, estaba exactamente empatada con el control.
¿Qué pasó? Variación aleatoria. Cinco días de datos no es suficiente para probar nada.
Por eso el período de observación importa.
Por Qué Importa el Período de Observación
Tu tasa de conversión varía según el día de la semana:
| Día | Conversión |
|---|---|
| Lunes | 3.2% |
| Martes | 3.1% |
| Miércoles | 2.9% |
| Jueves | 3.0% |
| Viernes | 2.8% |
| Sábado | 2.2% |
| Domingo | 2.4% |
Mismo tráfico, mismo producto, resultados diferentes.
Si ejecutas una prueba de lunes a viernes, estás sesgado (tráfico entre semana). Si mides solo el lunes, podrías golpear un pico o valle.
Período de observación mínimo: 2 semanas (para captar dos ciclos completos de variación de día de la semana)
El Período de Observación por Escenario
Escenario 1: Prueba A/B
Mínimo: 2 semanas (un ciclo completo de lunes-domingo × 2) Mejor: 4 semanas (captura dos semanas completas, considera fluctuación) Máximo: 6 semanas (más allá de esto, factores externos enturbian los datos)
¿Por qué no más tiempo?
- Después de 4 semanas, factores externos (estacionalidad, movimientos de competidores, cambios de fuente de tráfico) comienzan a afectar los resultados
- Quieres datos frescos, no pruebas obsoletas
Escenario 2: Midiendo la Tasa de Conversión Base
Mínimo: 4 semanas Mejor: 12 semanas (tres meses muestran estacionalidad) Contexto: No estás probando nada, solo midiendo "¿qué es normal?"
Un mes captura:
- Dos semanas completas de variación de día de la semana
- Días feriados (si los hay)
- Variación de patrón de tráfico
Escenario 3: Midiendo Impacto Post-Lanzamiento
Cronología:
- Despliegue cambio: Día 1
- Mide: Días 1-7
- Indicación temprana: ¿Va en la dirección correcta?
- Mide: Días 1-14
- Confirmación: ¿Se mantiene la dirección?
- Mide: Días 1-28
- Veredicto final: ¿Mejora real o variación aleatoria?
Cambios Diarios vs. Tendencias
Tasa de conversión diaria: Muy ruidosa, no reacciones Tasa de conversión semanal: Más estable, puedes comenzar a confiar Tasa de conversión mensual: Muy estable, confiable para decisiones
Ejemplo:
- Día 1: 2.5% (no importa, solo ruido)
- Día 2: 3.2% (pico, aún ruido)
- Día 3: 2.1% (caída, aún ruido)
- Día 4: 2.8% (de vuelta arriba, aún ruido)
- Promedio de semana 1: 2.65% (ahora estamos hablando)
- Promedio de semana 2: 2.72% (¿es esto una tendencia?)
- Promedio de mes 1: 2.68% (estos son datos reales)
Regla: Nunca tomes decisiones en datos menores a 1 semana de antigüedad.
Controlando la Estacionalidad
Algunos días/semanas tienen estacionalidad inherente:
| Período | Sesgo de Conversión | Por Qué |
|---|---|---|
| Lunes-Viernes | Ligeramente más alto | Día laboral, búsqueda intencional |
| Fin de semana | Más bajo | Navegación casual |
| Black Friday | Mucho más alto | Intención promocional |
| 1-2 Enero | Varía (vacaciones) | — |
| Verano (julio-agosto) | Más bajo | Vacaciones |
Si tu prueba cae en un día anómalo:
Prueba de Black Friday: No lances basado en resultados de Black Friday (no se aplicará al tráfico regular).
Prueba de semana de vacaciones: Podrías ver conversión más baja (menos intención). Espera a que se reanuden las semanas normales.
Mejor práctica: Ejecuta pruebas durante semanas "normales" (evita vacaciones, promociones, eventos principales).
Sitios de Bajo Tráfico: Períodos de Observación Más Largos
Si tienes 100 visitantes por semana:
- Observación de 1 semana: solo 100 puntos de datos (muy ruidosa)
- Observación de 4 semanas: 400 puntos de datos (más estable)
- Observación de 12 semanas: 1,200 puntos de datos (confiable)
Para sitios de bajo tráfico, podrías necesitar 8-12 semanas por prueba.
Calcula tu tamaño mínimo de muestra:
- Conversión base: 2%
- Mejora objetivo: 15% (a 2.3%)
- Tamaño de muestra necesario: 3,000 por variante
- Tráfico por semana: 100 visitantes
- Período de observación: 30 semanas
Los sitios de bajo tráfico toman más tiempo. Planifica en consecuencia.
Sitios de Alto Tráfico: Pueden Medir Más Rápido
Si tienes 10,000 visitantes por semana:
- Observación de 1 semana: 10,000 puntos de datos (bastante estable)
- Observación de 2 semanas: 20,000 puntos de datos (muy estable)
- Observación de 4 semanas: 40,000 puntos de datos (extremadamente estable)
Puedes medir más rápido, pero no lo hagas. Siempre ejecuta al menos 2 semanas para controlar por día de la semana.
Significancia Estadística vs. Período de Observación
Significancia estadística: ¿Qué tan seguros estamos de que este resultado es real (no aleatorio)?
Período de observación: ¿Cuán largo debería ser para obtener resultados estadísticamente significativos?
Son relacionados pero diferentes:
- Prueba de 5 días con 100,000 visitantes podría ser estadísticamente significativa (tamaño de muestra grande)
- Prueba de 4 semanas con 1,000 visitantes podría no ser estadísticamente significativa (tamaño de muestra pequeño)
El tamaño de muestra (tráfico) importa más que el tiempo, pero necesitas ambos.
Regla general:
- Mínimo 2 semanas (controlar por día de la semana)
- Calcula tamaño de muestra para tu tráfico (usa una calculadora en línea)
- Usa lo que sea más largo
Tiempo de Lanzamiento: No Apresures
Una vez que tu prueba se complete y muestre un ganador:
No: Lanza inmediatamente al 100% Haz: Lanzamiento gradual (10% → 25% → 50% → 100%)
¿Por qué?
- Te da tiempo para atrapar errores
- Te permite monitorear rendimiento real (no entorno de prueba)
- Te permite revertir si algo se rompe
Cronología:
- Día 1: Lanza al 10% de usuarios
- Día 2-3: Monitorea, sin problemas → lanza 25%
- Día 4-5: Monitorea, sin problemas → lanza 50%
- Día 6-7: Monitorea, sin problemas → lanza 100%
Total: 1 semana para lanzar un cambio probado de forma segura.
Preguntas Frecuentes
P: ¿Puedo ejecutar una prueba solo por 1 semana? R: Técnicamente sí, pero es riesgoso. La variación de día de la semana es real. Obtendrás resultados sesgados. Mínimo 2 semanas.
P: ¿Y si mi prueba muestra un ganador en el día 7? R: Mantén ejecutándola. Lo que se ve como un ganador podría ser una fluctuación semanal. Ejecuta el período completo antes de decidir.
P: ¿Debería detener una prueba temprano si obviamente está perdiendo? R: No. "Obviamente perdiendo" en el día 7 es solo ruido. Mantén ejecutándola. Tal vez se recupere (menos común, pero sucede).
P: ¿Cómo explico esto a mi jefe que quiere resultados AHORA? R: "Podemos lanzar temprano, pero probablemente enviaremos un cambio malo. ¿Quieres enviar el cambio correcto en el momento correcto, o el cambio rápido en el momento equivocado?" La mayoría de jefes eligen paciencia.
P: ¿Y si estoy probando una característica importante? R: Ejecuta mínimo 4 semanas. Las características importantes necesitan tiempo para mostrar impacto.
Calendario del Período de Observación
| Escenario | Mínimo | Recomendado |
|---|---|---|
| Cambio pequeño (color de botón) | 2 semanas | 4 semanas |
| Cambio medio (reducción de formulario) | 2 semanas | 4 semanas |
| Cambio grande (rediseño de pago) | 4 semanas | 8 semanas |
| Característica nueva | 4 semanas | 8 semanas |
| Midiendo línea base | 4 semanas | 12 semanas |
La Conclusión
La paciencia gana en CRO.
Dos semanas mínimo. Cuatro semanas mejor. No midas cambios diarios.
Significancia estadística + tamaño de muestra suficiente = confianza en resultados.
Apresúralo, y enviarás ganadores que se convierten en perdedores.
Emily Redmond es analista de datos en Emilytics — agente de analítica AI que monitorea tu GA4, Search Console y datos de Bing las 24 horas. 8 años de experiencia. Hola →