Lección 8 — Diseños factoriales

La idea central: estudiar todo al mismo tiempo

En el enfoque tradicional, cuando se quiere entender cómo afectan varios factores a un proceso, se estudia uno por uno: se fija la velocidad y se varía la temperatura, luego se fija la temperatura y se varía el tiempo, y así sucesivamente. Este enfoque "un factor a la vez" (OFAT) tiene un problema grave: no detecta interacciones.

¿Qué es una interacción? Ocurre cuando el efecto de un factor depende del nivel de otro factor. Por ejemplo: quizás la temperatura tiene poco efecto sobre la viscosidad cuando la velocidad es baja, pero un efecto enorme cuando la velocidad es alta. Eso es una interacción — y el enfoque OFAT la pierde por completo.

Diseño factorial

Un diseño factorial estudia todas las combinaciones posibles de los niveles de todos los factores. Esto permite estimar no solo los efectos principales de cada factor, sino también todas las interacciones entre ellos. Es la diferencia entre ver una foto (OFAT) y ver un video en 3D (factorial).

La analogía es perfecta: estudiar factores uno por uno es como fotografiar a alguien solo de frente. El factorial es como tomar fotos desde todos los ángulos — obtienes la imagen completa, con profundidad, y puedes entender realmente cómo es la persona (o el proceso).

El diseño factorial 2ᵏ: la base

El diseño factorial más utilizado es el 2ᵏ, donde cada factor se estudia en 2 niveles (bajo y alto) y k es el número de factores. El número total de tratamientos (combinaciones) es 2 elevado a la k:

2 factores (2²)

2² = 4 tratamientos

El más sencillo. Estudia efectos principales de A y B, más la interacción AB. Ideal para empezar a experimentar con DOE.

3 factores (2³)

2³ = 8 tratamientos

Estima 3 efectos principales (A, B, C), 3 interacciones dobles (AB, AC, BC) y 1 interacción triple (ABC). Muy usado en QbD.

4 factores (2⁴)

2⁴ = 16 tratamientos

Estima 4 principales, 6 dobles, 4 triples y 1 cuádruple. 16 tratamientos con 3 réplicas = 48 experimentos. Ya requiere planificación cuidadosa.

5 factores (2⁵)

2⁵ = 32 tratamientos

32 tratamientos × 3 réplicas = 96 experimentos. Empieza a ser costoso — aquí es donde los diseños fraccionados se vuelven atractivos.

Recomendación práctica

Con 2-3 factores, siempre haz el diseño completo — son pocos tratamientos y obtienes toda la información. A partir de 4-5 factores, evalúa si un diseño fraccionado es más eficiente. No hagas OFAT — es tentador por la simplicidad, pero es como "la caminata del borracho": llegas a algún lado, pero no al óptimo.

Codificación ±1: simplificar los números

En un diseño 2ᵏ, los niveles se codifican como −1 (nivel bajo) y +1 (nivel alto). Esta codificación simplifica enormemente los cálculos y permite comparar factores que están en diferentes unidades.

Ejemplo: codificación de un diseño 2³

Factor A — Velocidad: 50 RPM (−1) y 100 RPM (+1)

Factor B — % Neutralizado: 50% (−1) y 75% (+1)

Factor C — Tiempo: 10 min (−1) y 25 min (+1)

La codificación se obtiene restando la media y dividiendo por la mitad del rango: x_cod = (x − x̄) / (rango/2)

La matriz de diseño para un 2³ con los 8 tratamientos queda así:

Trat.	A (Velocidad)	B (% Neutral.)	C (Tiempo)	Respuesta (Y)
1	−1	−1	−1	y₁
2	+1	−1	−1	y₂
3	−1	+1	−1	y₃
4	+1	+1	−1	y₄
5	−1	−1	+1	y₅
6	+1	−1	+1	y₆
7	−1	+1	+1	y₇
8	+1	+1	+1	y₈

Recuerda: el orden de ejecución debe ser aleatorio. La tabla muestra los tratamientos en orden estándar para facilitar la lectura, pero en el laboratorio se ejecutan en orden aleatorio (principio de Fisher).

El modelo matemático

Cada diseño factorial tiene un modelo matemático asociado que describe cómo la respuesta depende de los factores y sus interacciones. Para un 2³:

Y_ijk = μ + α_i + β_j + γ_k + (αβ)_ij + (αγ)_ik + (βγ)_jk + (αβγ)_ijk + ε

μ = media global | α, β, γ = efectos principales (A, B, C)
(αβ), (αγ), (βγ) = interacciones dobles | (αβγ) = interacción triple | ε = error experimental

El modelo dice: la respuesta observada es la suma de la media global, los efectos de cada factor por separado, los efectos de sus combinaciones (interacciones) y un error aleatorio que no podemos explicar. El ANOVA nos dirá cuáles de estos efectos son estadísticamente significativos.

Interacciones: lo que OFAT nunca ve

Las interacciones son probablemente el concepto más importante — y más subestimado — del diseño factorial.

Interacción doble (AB)

El efecto de A cambia según el nivel de B. Si la velocidad afecta mucho la viscosidad cuando el % neutralizado es alto, pero poco cuando es bajo, hay una interacción AB significativa. No basta con conocer el efecto de cada factor por separado — necesitas saber cómo se potencian o anulan entre sí.

Interacción triple (ABC)

El efecto combinado de los tres factores simultáneamente. Es como ver la "foto" del proceso desde todos los ángulos a la vez. En muchos textos se describe como "no importante" — pero en realidad, la interacción de orden más alto es donde está la esencia del proceso. Es la que te dice cómo se comporta la combinación completa de factores, no solo los fragmentos.

El mito de las interacciones no importantes

Es común leer que las interacciones triples y superiores "se pueden despreciar". Cuidado: eso solo es válido cuando tienes evidencia estadística de que son pequeñas. La interacción ABC te dice cómo se comporta la combinación de todos los factores — es la combinación que realmente irá a producción. Despreciarla sin evidencia es como elegir un perfume sin olerlo completo, solo por los ingredientes individuales.

Lectura de interacciones

En un gráfico de interacción AB, se plotean las medias de la respuesta para cada combinación. Si las líneas son paralelas, no hay interacción — el efecto de A es el mismo independientemente de B. Si las líneas se cruzan o divergen, hay interacción — el efecto de A depende del nivel de B. Cuanto más pronunciado el cruce o la divergencia, más fuerte la interacción.

Cuando k crece: el costo de la completitud

El problema del diseño factorial completo es que crece exponencialmente:

Factores (k)	Tratamientos	Con 3 réplicas	¿Completo o fraccionar?
2	4	12	Siempre completo
3	8	24	Siempre completo
4	16	48	Completo si hay recursos
5	32	96	Evaluar fraccionado
6	64	192	Fraccionado recomendado
7	128	384	Fraccionado necesario

Con 5+ factores, el costo en tiempo, materiales y capacidad de planta puede ser prohibitivo. Aquí entran los diseños fraccionados.

Diseños factoriales fraccionados

Un diseño fraccionado ejecuta solo una fracción del factorial completo — típicamente la mitad (2ᵏ⁻¹), un cuarto (2ᵏ⁻²), etc. A cambio de menos experimentos, se sacrifican interacciones de orden alto.

¿Qué se sacrifica?

En un diseño fraccionado, algunos efectos quedan confundidos (aliased) entre sí — no se pueden distinguir estadísticamente. El principio general es sacrificar las interacciones de orden más alto primero, porque suelen ser las menos relevantes en la práctica. Pero esto es una suposición — si la interacción triple es importante para tu proceso, el fraccionado no la detectará.

Resolución del diseño

La resolución indica qué tan severo es el confundimiento. Un diseño de resolución III confunde efectos principales con interacciones dobles (peligroso). Resolución IV confunde dobles entre sí (aceptable para cribado). Resolución V o mayor: los principales y las dobles están libres de confundimiento (ideal). Para QbD, busca siempre resolución IV o mayor.

¿Cuándo usar fraccionados?

En la fase de cribado (screening): cuando tienes 5-8 factores y necesitas identificar rápidamente cuáles son los 2-3 más importantes. No buscas optimizar — buscas filtrar.
Cuando los recursos son limitados: el fraccionado es la diferencia entre hacer un experimento imperfecto pero informativo, y no hacer ninguno por falta de presupuesto.
Nunca como diseño final: una vez identificados los factores importantes con el fraccionado, el diseño de optimización (superficie de respuesta) debe ser completo.

ANOVA: la prueba de fuego

El Análisis de Varianza (ANOVA) es la herramienta estadística que determina si los efectos observados en el diseño factorial son reales o producto del azar.

La lógica del ANOVA es elegante: descompone la variabilidad total de los datos en dos fuentes — la variabilidad explicada por los factores (efectos del tratamiento) y la variabilidad no explicada (error experimental). Si la variabilidad explicada es mucho mayor que el error, el efecto es significativo.

La tabla ANOVA

El resultado es una tabla que muestra, para cada efecto (A, B, AB, ABC, error), la suma de cuadrados, los grados de libertad, el cuadrado medio, el estadístico F y el valor p. Lo que nos interesa es:

Valor p < 0.05 → el efecto es estadísticamente significativo — ese factor (o interacción) afecta la respuesta
Valor p ≥ 0.05 → no hay evidencia de que el efecto sea significativo — puede ser ruido
R² ajustado → qué porcentaje de la variabilidad total explica el modelo. Cuanto más alto (cercano a 1), mejor el modelo captura el comportamiento real

Interpretación práctica

Si el ANOVA de un diseño 2³ muestra que A (velocidad) tiene p = 0.001, B (% neutralizado) tiene p = 0.023, C (tiempo) tiene p = 0.340, y AB tiene p = 0.008, concluyes: la velocidad y el % neutralizado son significativos, el tiempo no lo es, y hay una interacción significativa entre velocidad y % neutralizado. El tiempo puede eliminarse del modelo sin pérdida de información — simplificando el espacio de diseño.

Validación del modelo: supuestos del ANOVA

Para que las conclusiones del ANOVA sean válidas, los residuales (diferencias entre lo observado y lo predicho por el modelo) deben cumplir ciertos supuestos:

Normalidad: los residuales deben seguir aproximadamente una distribución normal. Se verifica con un gráfico de probabilidad normal — los puntos deben alinearse sobre una recta.
Homocedasticidad: la variabilidad debe ser similar en todos los tratamientos. Se verifica con un gráfico de residuales vs. predichos — no debe haber patrón de embudo.
Independencia: los residuales no deben mostrar tendencias en el tiempo. Se verifica con un gráfico de residuales en orden de ejecución.

Datos atípicos

Si el gráfico de normalidad muestra puntos que se desvían claramente de la recta, probablemente hay datos atípicos. Antes de eliminarlos, busca la causa: ¿hubo un error de medición? ¿Una muestra contaminada? ¿Un fallo de equipo? Si hay justificación técnica para eliminar el dato, hazlo y re-analiza. Si no la hay, el dato puede estar revelando algo real sobre tu proceso.

Coeficiente de variación: ¿es homogéneo el proceso?

El coeficiente de variación (CV) — la desviación estándar dividida por la media, expresada en porcentaje — es una medida rápida de la homogeneidad del proceso:

CV < 5%: proceso muy homogéneo — excelente para producción estable
CV 5-10%: homogeneidad aceptable — normal en etapas intermedias de QbD
CV 10-15%: heterogeneidad moderada — aceptable en etapas iniciales de exploración
CV > 15%: alta variabilidad — hay factores importantes no controlados

En la práctica, cuando un diseño factorial arroja tratamientos con CV muy bajo (consistentes) junto con tratamientos de CV alto (variables), es una señal clara: las combinaciones de factores que dan bajo CV son las candidatas para el espacio de diseño. Proceso estable = proceso predecible = proceso que cumple QbD.

Ideas clave de esta lección

Lo que debes recordar

El diseño factorial es la diferencia entre "creo que este factor importa" y "tengo evidencia estadística de que este factor importa, cuánto importa, y cómo interactúa con los demás". En QbD, esa evidencia es lo que construye el espacio de diseño.

Los diseños factoriales estudian todas las combinaciones de factores y niveles — a diferencia de OFAT que estudia uno por uno
El diseño 2ᵏ es la base: k factores a 2 niveles cada uno. Con 2-3 factores, siempre completo
La codificación ±1 simplifica cálculos y permite comparar factores en diferentes unidades
Las interacciones son donde está la información real — OFAT las pierde completamente
Con 5+ factores, los diseños fraccionados reducen el número de experimentos sacrificando interacciones de orden alto
El ANOVA descompone la variabilidad para determinar qué efectos son significativos (p < 0.05)
El R² ajustado indica qué tan bien el modelo explica los datos. El CV indica qué tan homogéneo es el proceso
Siempre valida los supuestos: normalidad, homocedasticidad, independencia de residuales

Siguiente lección →

Superficies de respuesta y optimización

›