El límite del diseño factorial 2ᵏ
En la lección anterior aprendimos a usar diseños 2ᵏ para identificar qué factores son significativos y cómo interactúan. Pero el 2ᵏ tiene una limitación fundamental: solo tiene dos niveles por factor. Con dos puntos solo puedes trazar una línea recta — un plano, en varias dimensiones.
Eso funciona para cribado: saber si un factor importa o no. Pero no funciona para optimización: encontrar el punto exacto donde la respuesta es máxima (o mínima). Para encontrar un pico o un valle, necesitas detectar curvatura — y para eso necesitas al menos 3 niveles por factor.
Con un diseño 2ᵏ es como explorar un terreno montañoso midiendo solo las esquinas. Sabes que el terreno sube hacia el noreste. Pero ¿dónde exactamente está la cima? ¿Es una cresta plana o un pico agudo? Para eso necesitas puntos intermedios — y eso es lo que proporcionan los diseños de superficie de respuesta.
La metodología de superficies de respuesta (RSM)
La Response Surface Methodology (RSM) es una colección de técnicas estadísticas y matemáticas para modelar y analizar problemas donde una respuesta de interés está influenciada por varios factores, y el objetivo es optimizar esa respuesta.
La RSM se aplica típicamente en la etapa final del QbD — después de que un cribado factorial ha identificado los 2-4 factores más importantes. Es la herramienta que construye el modelo detallado del espacio de diseño.
En RSM, todos los factores deben ser cuantitativos — variables continuas como temperatura, velocidad, concentración, tiempo. Si tienes factores cualitativos (tipo de excipiente, proveedor), estos deben haberse fijado en la etapa de cribado. La RSM trabaja exclusivamente con números continuos porque necesita calcular derivadas para encontrar óptimos.
El modelo de segundo orden
El corazón de la RSM es un modelo polinomial de segundo orden que incluye términos lineales, cuadráticos e interacciones:
La diferencia con el modelo del factorial 2ᵏ es la presencia de los términos cuadráticos (xᵢ²). Estos son los que capturan la curvatura — los que permiten al modelo describir una colina, un valle o un punto de silla. Sin ellos, el modelo solo puede describir planos.
¿Cuándo el modelo funciona bien?
El modelo de segundo orden funciona bien cuando la superficie real del proceso se puede aproximar razonablemente por una parábola en cada dirección. Esto cubre la gran mayoría de procesos farmacéuticos en la práctica. Si la superficie es más compleja (oscilaciones, discontinuidades), se necesitarían modelos de orden superior — pero estos son raros en pharma.
Siempre preferimos polinomios simples (pocos términos) a polinomios complejos (muchos términos). Un modelo con 3 factores y términos de segundo orden es interpretable — puedes ver qué efecto tiene cada variable y cada interacción. Un modelo de machine learning con 50 parámetros ocultos puede predecir bien, pero no te dice en qué condiciones operar tu proceso. En QbD, la interpretabilidad es tan importante como la precisión.
La pendiente de máximo ascenso
Antes de hacer el RSM completo, hay una etapa intermedia muy útil: la pendiente de máximo ascenso (steepest ascent). La idea es simple:
- Del factorial 2ᵏ obtienes un modelo lineal que indica en qué dirección mejora la respuesta
- Realizas experimentos adicionales siguiendo esa dirección — un punto a la vez, avanzando en la dirección de mejora
- En cada punto, mides la respuesta. Mientras mejora, sigues avanzando
- Cuando la respuesta empieza a empeorar (la curva se invierte), has encontrado la zona del óptimo
- En esa zona, aplicas el RSM con un diseño CCD o Box-Behnken
Es como subir una montaña en la niebla: el factorial te dice hacia dónde está la cima, la pendiente de máximo ascenso te lleva hasta la zona, y el RSM te posiciona en el punto exacto.
Diseño Central Compuesto (CCD)
El CCD (Central Composite Design) es el diseño más utilizado para RSM. Combina tres tipos de puntos experimentales:
- Puntos factoriales: las esquinas del cubo — las mismas combinaciones ±1 del diseño 2ᵏ
- Puntos axiales (estrella): puntos fuera del cubo, en los ejes de cada factor. Se extienden a una distancia ±α del centro. Estos son los que capturan la curvatura.
- Puntos centrales: réplicas en el punto medio de todos los factores (0, 0, 0). Estiman el error puro y detectan curvatura.
Puntos factoriales: 2³ = 8 puntos (esquinas del cubo)
Puntos axiales: 2 × 3 = 6 puntos (2 por cada eje)
Puntos centrales: 3-5 réplicas en (0, 0, 0)
Total: 8 + 6 + 4 = 18 experimentos mínimo — suficiente para ajustar un modelo completo de segundo orden con 3 factores
El CCD rotable
Cuando el valor de α se elige de forma que la varianza de la predicción sea uniforme en todas las direcciones a igual distancia del centro, el diseño se llama rotable. Esto significa que la calidad de la predicción no depende de la dirección — es igualmente buena hacia cualquier combinación de factores. Para un CCD con k factores, α = (2ᵏ)^(1/4).
Diseño Box-Behnken
El diseño Box-Behnken es una alternativa al CCD que tiene una ventaja práctica importante: no tiene puntos axiales fuera del cubo. Todos los puntos experimentales están dentro de los límites de los factores.
La construcción es ingeniosa: en vez de usar las esquinas del cubo (como el factorial), se usan los puntos medios de las aristas de cada cara del cubo, más puntos centrales. Esto genera un diseño que:
- Tiene 3 niveles por factor (bajo, medio, alto) — suficiente para detectar curvatura
- No incluye combinaciones extremas — ningún tratamiento tiene todos los factores en su nivel extremo simultáneamente
- Requiere menos experimentos que el CCD en muchos casos
Puntos en aristas: 12 tratamientos (4 por cada par de factores)
Puntos centrales: 3 réplicas mínimo
Total: 12 + 3 = 15 experimentos — menos que el CCD (18) y aún suficiente para el modelo de segundo orden completo
Cuando las combinaciones extremas (todos los factores simultáneamente en nivel alto o bajo) son problemáticas o imposibles. Por ejemplo, si temperatura alta + presión alta + tiempo largo produce una reacción peligrosa o destruye el material. Box-Behnken evita esos vértices del cubo. También es preferible cuando los recursos son limitados — es más económico que el CCD.
CCD vs. Box-Behnken: ¿cuál elegir?
4 factores: 30 puntos (16+8+6 centrales)
Mejor cuando: puedes operar fuera de los rangos nominales
4 factores: 27 puntos (24+3 centrales)
Mejor cuando: los extremos son problemáticos o hay restricción de recursos
| Factores | CCD (con centrales) | Box-Behnken | Factorial 2ᵏ × 3 réplicas |
|---|---|---|---|
| 3 | 20 | 15 | 24 |
| 4 | 30 | 27 | 48 |
| 5 | 52 | 46 | 96 |
En ambos casos, el número de experimentos es mucho menor que un factorial completo con réplicas, y sin embargo se obtiene un modelo de segundo orden completo con capacidad de optimización. Esta es la eficiencia que justifica la RSM en QbD.
Software y herramientas
En la práctica, nadie construye estos diseños a mano. Los paquetes de software estadístico los generan automáticamente, incluyendo la aleatorización:
- StatGraphics: muy popular en la industria pharma latinoamericana. Interfaz amigable, genera diseños con menús guiados, incluye análisis de superficie de respuesta completo.
- Minitab: ampliamente usado en industria. Excelente para DOE y análisis de capacidad de proceso.
- Design-Expert: especializado en DOE y RSM. Muy visual, genera gráficos de contorno y superficie 3D intuitivos.
- R / RStudio: gratuito y extremadamente potente. Paquetes como rsm, DoE.base, FrF2. Requiere conocimiento de programación.
- Excel: limitado para RSM completa, pero útil para cálculos básicos, aleatorización y visualización preliminar. Complementos como XLSTAT amplían sus capacidades.
El software genera el diseño, ejecuta el ANOVA, produce los gráficos y encuentra el "óptimo". Pero interpretar si ese óptimo tiene sentido para tu proceso es tu trabajo. Un software puede decirte que el óptimo está a 150°C, pero si sabes que tu principio activo se degrada a 120°C, el resultado matemático es irrelevante. La inteligencia del producto la pones tú — la estadística es la herramienta, no el decisor.
Lo que debes recordar
El factorial 2ᵏ te dice qué importa. La superficie de respuesta te dice dónde está el óptimo. Juntos construyen el espacio de diseño con fundamento estadístico — no con intuición.
- El diseño 2ᵏ solo detecta efectos lineales. La RSM agrega términos cuadráticos para capturar curvatura y encontrar óptimos
- La secuencia típica es: cribado (2ᵏ) → máximo ascenso → RSM (CCD o Box-Behnken)
- El modelo de segundo orden incluye efectos lineales + cuadráticos + interacciones — todos los factores deben ser cuantitativos
- El CCD rotable da predicción uniforme en todas las direcciones, pero requiere puntos fuera del cubo
- El Box-Behnken evita combinaciones extremas, es más económico y todos los puntos están dentro del espacio operacional
- Ambos diseños requieren significativamente menos experimentos que un factorial completo con réplicas
- El software genera el diseño y el análisis — pero la interpretación requiere conocimiento del producto y del proceso