Lección 9 — Superficies de respuesta

El límite del diseño factorial 2ᵏ

En la lección anterior aprendimos a usar diseños 2ᵏ para identificar qué factores son significativos y cómo interactúan. Pero el 2ᵏ tiene una limitación fundamental: solo tiene dos niveles por factor. Con dos puntos solo puedes trazar una línea recta — un plano, en varias dimensiones.

Eso funciona para cribado: saber si un factor importa o no. Pero no funciona para optimización: encontrar el punto exacto donde la respuesta es máxima (o mínima). Para encontrar un pico o un valle, necesitas detectar curvatura — y para eso necesitas al menos 3 niveles por factor.

La metáfora del terreno

Con un diseño 2ᵏ es como explorar un terreno montañoso midiendo solo las esquinas. Sabes que el terreno sube hacia el noreste. Pero ¿dónde exactamente está la cima? ¿Es una cresta plana o un pico agudo? Para eso necesitas puntos intermedios — y eso es lo que proporcionan los diseños de superficie de respuesta.

La metodología de superficies de respuesta (RSM)

La Response Surface Methodology (RSM) es una colección de técnicas estadísticas y matemáticas para modelar y analizar problemas donde una respuesta de interés está influenciada por varios factores, y el objetivo es optimizar esa respuesta.

La RSM se aplica típicamente en la etapa final del QbD — después de que un cribado factorial ha identificado los 2-4 factores más importantes. Es la herramienta que construye el modelo detallado del espacio de diseño.

Etapa 1

Cribado

Factorial 2ᵏ o fraccionado. Identificar factores significativos

→

Etapa 2

Máx. ascenso

Explorar la dirección de mejora hacia la región óptima

→

Etapa 3

RSM

CCD o Box-Behnken. Modelar curvatura, encontrar óptimo

Requisito fundamental

En RSM, todos los factores deben ser cuantitativos — variables continuas como temperatura, velocidad, concentración, tiempo. Si tienes factores cualitativos (tipo de excipiente, proveedor), estos deben haberse fijado en la etapa de cribado. La RSM trabaja exclusivamente con números continuos porque necesita calcular derivadas para encontrar óptimos.

El modelo de segundo orden

El corazón de la RSM es un modelo polinomial de segundo orden que incluye términos lineales, cuadráticos e interacciones:

Y = β₀ + Σ βᵢxᵢ + Σ βᵢᵢxᵢ² + Σ βᵢⱼxᵢxⱼ + ε

β₀ = intercepto | βᵢ = efectos lineales | βᵢᵢ = efectos cuadráticos | βᵢⱼ = interacciones | ε = error

La diferencia con el modelo del factorial 2ᵏ es la presencia de los términos cuadráticos (xᵢ²). Estos son los que capturan la curvatura — los que permiten al modelo describir una colina, un valle o un punto de silla. Sin ellos, el modelo solo puede describir planos.

¿Cuándo el modelo funciona bien?

El modelo de segundo orden funciona bien cuando la superficie real del proceso se puede aproximar razonablemente por una parábola en cada dirección. Esto cubre la gran mayoría de procesos farmacéuticos en la práctica. Si la superficie es más compleja (oscilaciones, discontinuidades), se necesitarían modelos de orden superior — pero estos son raros en pharma.

Preferir modelos simples

Siempre preferimos polinomios simples (pocos términos) a polinomios complejos (muchos términos). Un modelo con 3 factores y términos de segundo orden es interpretable — puedes ver qué efecto tiene cada variable y cada interacción. Un modelo de machine learning con 50 parámetros ocultos puede predecir bien, pero no te dice en qué condiciones operar tu proceso. En QbD, la interpretabilidad es tan importante como la precisión.

La pendiente de máximo ascenso

Antes de hacer el RSM completo, hay una etapa intermedia muy útil: la pendiente de máximo ascenso (steepest ascent). La idea es simple:

Del factorial 2ᵏ obtienes un modelo lineal que indica en qué dirección mejora la respuesta
Realizas experimentos adicionales siguiendo esa dirección — un punto a la vez, avanzando en la dirección de mejora
En cada punto, mides la respuesta. Mientras mejora, sigues avanzando
Cuando la respuesta empieza a empeorar (la curva se invierte), has encontrado la zona del óptimo
En esa zona, aplicas el RSM con un diseño CCD o Box-Behnken

Es como subir una montaña en la niebla: el factorial te dice hacia dónde está la cima, la pendiente de máximo ascenso te lleva hasta la zona, y el RSM te posiciona en el punto exacto.

Diseño Central Compuesto (CCD)

El CCD (Central Composite Design) es el diseño más utilizado para RSM. Combina tres tipos de puntos experimentales:

Puntos factoriales: las esquinas del cubo — las mismas combinaciones ±1 del diseño 2ᵏ
Puntos axiales (estrella): puntos fuera del cubo, en los ejes de cada factor. Se extienden a una distancia ±α del centro. Estos son los que capturan la curvatura.
Puntos centrales: réplicas en el punto medio de todos los factores (0, 0, 0). Estiman el error puro y detectan curvatura.

CCD para 3 factores

Puntos factoriales: 2³ = 8 puntos (esquinas del cubo)

Puntos axiales: 2 × 3 = 6 puntos (2 por cada eje)

Puntos centrales: 3-5 réplicas en (0, 0, 0)

Total: 8 + 6 + 4 = 18 experimentos mínimo — suficiente para ajustar un modelo completo de segundo orden con 3 factores

El CCD rotable

Cuando el valor de α se elige de forma que la varianza de la predicción sea uniforme en todas las direcciones a igual distancia del centro, el diseño se llama rotable. Esto significa que la calidad de la predicción no depende de la dirección — es igualmente buena hacia cualquier combinación de factores. Para un CCD con k factores, α = (2ᵏ)^(1/4).

Diseño Box-Behnken

El diseño Box-Behnken es una alternativa al CCD que tiene una ventaja práctica importante: no tiene puntos axiales fuera del cubo. Todos los puntos experimentales están dentro de los límites de los factores.

La construcción es ingeniosa: en vez de usar las esquinas del cubo (como el factorial), se usan los puntos medios de las aristas de cada cara del cubo, más puntos centrales. Esto genera un diseño que:

Tiene 3 niveles por factor (bajo, medio, alto) — suficiente para detectar curvatura
No incluye combinaciones extremas — ningún tratamiento tiene todos los factores en su nivel extremo simultáneamente
Requiere menos experimentos que el CCD en muchos casos

Box-Behnken para 3 factores

Puntos en aristas: 12 tratamientos (4 por cada par de factores)

Puntos centrales: 3 réplicas mínimo

Total: 12 + 3 = 15 experimentos — menos que el CCD (18) y aún suficiente para el modelo de segundo orden completo

¿Cuándo elegir Box-Behnken?

Cuando las combinaciones extremas (todos los factores simultáneamente en nivel alto o bajo) son problemáticas o imposibles. Por ejemplo, si temperatura alta + presión alta + tiempo largo produce una reacción peligrosa o destruye el material. Box-Behnken evita esos vértices del cubo. También es preferible cuando los recursos son limitados — es más económico que el CCD.

CCD vs. Box-Behnken: ¿cuál elegir?

CCD Rotable

Central Composite Design

Incluye puntos fuera del cubo (axiales). Mayor cobertura del espacio experimental. Propiedades de rotabilidad que aseguran predicción uniforme.

3 factores: 20 puntos (8+6+6 centrales)
4 factores: 30 puntos (16+8+6 centrales)
Mejor cuando: puedes operar fuera de los rangos nominales

Box-Behnken

Diseño Box-Behnken

Todos los puntos dentro del cubo. Evita combinaciones extremas. Más económico. Puntos medios de aristas en vez de vértices.

3 factores: 15 puntos (12+3 centrales)
4 factores: 27 puntos (24+3 centrales)
Mejor cuando: los extremos son problemáticos o hay restricción de recursos

Factores	CCD (con centrales)	Box-Behnken	Factorial 2ᵏ × 3 réplicas
3	20	15	24
4	30	27	48
5	52	46	96

En ambos casos, el número de experimentos es mucho menor que un factorial completo con réplicas, y sin embargo se obtiene un modelo de segundo orden completo con capacidad de optimización. Esta es la eficiencia que justifica la RSM en QbD.

Software y herramientas

En la práctica, nadie construye estos diseños a mano. Los paquetes de software estadístico los generan automáticamente, incluyendo la aleatorización:

StatGraphics: muy popular en la industria pharma latinoamericana. Interfaz amigable, genera diseños con menús guiados, incluye análisis de superficie de respuesta completo.
Minitab: ampliamente usado en industria. Excelente para DOE y análisis de capacidad de proceso.
Design-Expert: especializado en DOE y RSM. Muy visual, genera gráficos de contorno y superficie 3D intuitivos.
R / RStudio: gratuito y extremadamente potente. Paquetes como rsm, DoE.base, FrF2. Requiere conocimiento de programación.
Excel: limitado para RSM completa, pero útil para cálculos básicos, aleatorización y visualización preliminar. Complementos como XLSTAT amplían sus capacidades.

El software no reemplaza el entendimiento

El software genera el diseño, ejecuta el ANOVA, produce los gráficos y encuentra el "óptimo". Pero interpretar si ese óptimo tiene sentido para tu proceso es tu trabajo. Un software puede decirte que el óptimo está a 150°C, pero si sabes que tu principio activo se degrada a 120°C, el resultado matemático es irrelevante. La inteligencia del producto la pones tú — la estadística es la herramienta, no el decisor.

Ideas clave de esta lección

Lo que debes recordar

El factorial 2ᵏ te dice qué importa. La superficie de respuesta te dice dónde está el óptimo. Juntos construyen el espacio de diseño con fundamento estadístico — no con intuición.

El diseño 2ᵏ solo detecta efectos lineales. La RSM agrega términos cuadráticos para capturar curvatura y encontrar óptimos
La secuencia típica es: cribado (2ᵏ) → máximo ascenso → RSM (CCD o Box-Behnken)
El modelo de segundo orden incluye efectos lineales + cuadráticos + interacciones — todos los factores deben ser cuantitativos
El CCD rotable da predicción uniforme en todas las direcciones, pero requiere puntos fuera del cubo
El Box-Behnken evita combinaciones extremas, es más económico y todos los puntos están dentro del espacio operacional
Ambos diseños requieren significativamente menos experimentos que un factorial completo con réplicas
El software genera el diseño y el análisis — pero la interpretación requiere conocimiento del producto y del proceso

Siguiente lección →

Optimización y definición del espacio de diseño

›