Chemometrie in der Analytischen Chemie

Teil 2 Optimierung mittels Response-Surface Modelling

  • Abb. 1: Partiell zentral zusammengesetztes Design
  • Abb. 2:  RSM-Graf der AAS von Mn in Concanavalin A
  • Abb. 3: RSM-Graf der Hydrolyse von Trehalose mittels TFA,  geschätztes Modell lautet: Ausbeute [µg] = 6891,5 [µg] - 36,9 [µg/min] * Zeit - 4306,6 [µg/M] * Konz. + 0,14 [µg/min2] * Zeit2 + 908,4 [µg/M2]*Konz.2 + 9,97 [µg/min M] * Zeit * Konz
  • Tab. 1: Veraschungs-Bedingungen
  • Abb. 4:  RSM-Graf Reduktion 2,3,4,6-Tetra-O-Methylglucose (Insert blau: zentral zusammengesetztes Design)

Die Optimierung von Prozessen ist in der Analytischen Chemie von großer Bedeutung, z.B. bei der Derivatisierung von Proben vor der Chromatographie oder der Einstellung der Messbedingungen bei der Atomabsorptionsspektroskopie. Sind mehrere Einflussgrößen (Faktoren, x1, x2, x3 ...) in ihrer Auswirkung auf die Zielgröße (z.B. Signal, y) zu beachten, sollte immer eine der beiden etablierten Optimierungs-Strategien (Simplex-, RSM-Optimierung) eingesetzt werden.

Liegen zu viele Parameter vor, müssen zuvor mit Hilfe der statistischen Versuchsplanung (z.B. VPlan [5]) die 2 bis 5 wichtigsten Faktoren ermittelt werden. An dieser Stelle soll der Einsatz des Response-Surface-Modelling (RSM) vorgestellt werden, da hier auch einige negative Aspekte zu berücksichtigen sind.

Einleitung

Es stehen verschiedene kommerzielle Programme zur Verfügung, unter anderem Design-Expert (Stat-Ease) oder RSMSoft [3], welches für die folgenden Anwendungen zum Einsatz gekommen ist.

Das Vorgehen bei RSM ist wie folgt:
Festlegung des Versuchs-Designs, d.h. Untersuchungsbereich und Lokalisierung der Faktoren, z.B. im zentral zusammengesetzten Design (Abb.1, Abb. 4 Insert)
Durchführung aller Untersuchungen bei den vorgegebenen Faktor-Einstellungen
Simulation der Mess-Ergebnisse durch ein numerisches Modell, meist Polynom 2-ten Grades
z.B. y = b0 + b1x1 + b2x2 + b3x3 + b4x12 + b5x22 + b6x32 + b7x1x2 + b8x1x3 + b9x2x3 .

Beurteilung der Modell-Größen wie Maximum, Minimum der Zielgröße und Qualität des Modells.

Dem letzten Punkt kommt eine besondere Bedeutung zu, da das verwendetet Polynommodell als empirisches Modell numerisch leicht zu bestimmen ist.

Es ist aber in fast allen Fällen das falsche Modell, da die pyhsiko-chemisch zugrundeliegenden (mechanistischen) Modelle zumeist nicht bekannt oder numerisch nicht geschlossen lösbar sind.

Mit Hilfe der Varianzanalyse ist daher zu klären, ob das verwendete Polynom die Mess-Ergebnisse angemessen beschreibt. Wichtige Größen sind hier
▪    Residuen-Varianz sR = Abweichung der Messwerte von den theoretischen Werten des Modells zur Bewertung der Unschärfe der Modellkoeffizienten bi (siehe Anhang a)

▪    Der F-Wert gibt an, ob das Modell akzeptiert wird, der so ermittelte Prüfwert wird mit dem Vergleichswert der F-Tabelle verglichen und das Modell wird akzeptiert wenn gilt: Prüfwert < Vergleichswert (siehe Anhang b, vgl. [3] Kap. 4.2.5).

Eine ausführliche Behandlung der theoretischen Grundlagen sollen nicht Ziel der Ausführungen sein, diese sind in einschlägigen Fachbüchern [1, 2, 3, 4] ausreichend dargestellt.

Beispiel 1: Messparameter AAS

Häufige Aufgabenstellung ist die Optimierung der Messbedingungen eines Analysen-Geräts. In dem Beispiel sollen bei der elektrothermischen Atomabsorption (AAS) die Veraschungsbedingungen optimiert werden.

Zielgröße ist ein maximales AAS-Signal (relativ zum Untergrund-Signal), die Einflussfaktoren sind Veraschungszeit und -temperatur. Als Versuchsdesign wurde, um Zeit und Kosten zu sparen, das partielle zentral-zusammengesetzte Design gewählt (siehe Abbildung 1). Die Messbereiche wurden zu Beginn vorgegeben zu Temperatur 250 - 1000°C bzw. Zeit 5 - 50 s, die resultierenden Bedingungen sind in Tabelle 1 angegeben.

Nach Ausführung der Analysen wird mit den resultierenden Absorptionen mittels linearer Regression (vgl. [4] Kapitel 3.4.3) das Modell-Polynom bestimmt zu
rel. Absorption = 0,13 + 2,85*10-4[1/s] * Zeit + 7,20*10-3[1/°C] * Temp - 3,59*10-7[1/s2] * Zeit2 - 7,11*10-5 [1/°C2] * Temp2 - 6,86*10-6 [1/s °C] * Zeit * Temp.

Numerisch kann daraus das maximale AAS-Signal bei den optimalen Bedingungen 250°C und 38,6 s bestimmt werden (Minimum bei 1000°C, 50 s). Abbildund 2 zeigt die entsprechende Hyperfläche.

Ohne zusätzliche Freiheitsgrade liegen alle Messpunkte in der Modell-Hyperfläche, eine statistische Aussage ist nicht gegeben. Auffällig ist, dass das Maximum am Rand des gewählten Untersuchungsbereichs liegt (250°C), es kann angenommen werden, dass geringere Temperaturen günstiger sind. Diese Problematik einer ungeschickten Bereichswahl zu Beginn ist einer der RSM-Nachteile. In diesem Fall müssten die Untersuchungen mit verändertem Design wiederholt werden.

Beispiel 2: Hydrolyse Polysaccharide

Vor der Analyse von Polysacchariden ist die schonende Hydrolyse oft der erste Schritt, hier mit Hilfe von Trifluoressigsäure (TFA). Zielgröße ist die Hydrolyse-Ausbeute von Trehalose als Modellsubstanz analysiert mittels HILIC-HPLC-Trennung und ESI-TOF-MS-Detektion. Als Einflussgrößen wurden die Reaktionszeit bzw. die Konzentration TFA optimiert. Aus Zeitgründen wurde auch hier ein partielles zentral-zusammengesetztes Design verwendet. Abbildung 3 zeigt die resultierende grafische Darstellung des Modells aus den Analysen.

Numerisch kann hieraus die maximale Ausbeute bei den optimalen Bedingungen 240 min und 4 M TFA bestimmt werden (Minimum bei 60 min, 2 M). Aus dem Graf könnte interpretiert werden, dass in diesem Fall das empirische Polynom die Zusammenhänge angemessen beschreibt. Ohne Freiheitsgrade (zusätzliche Messpunkte, Wiederholungsmessungen) ist aber eine statistische Aussage nicht gegeben.

Beispiel 3: Derivatisierung zur GC-MS

Bei der Linkage-Analysis der Proteinglycosylierung ist ein wichtiger Schritt vor der GC-MS-Analyse die Reduktion der partiell O-methylierten Monosaccharide mit Natriumbordeuterid. Als Zielgröße (y) wurde die relative Peakfläche des Glucitol (zum intern. Standard) als Maß für die Derivatisierung von 2,3,4,6-Tetra-O-Methylglucose gewählt. Als Einflussgrößen wurden die Reaktionszeit (x1) bzw. die Temperatur (x2) optimiert.

Hier wurde ein vollständiges zentral-zusammengesetztes Design mit 5 Wiederholungen verwendet (vgl. Abb. 4 Insert). Abbildung 4 zeigt das resultierende grafische Modell aus den GC-MS-Daten. Aus dem geschätzten Modell y = b0 + b1 ∙ x1 + b2 ∙ x2 + b3 ∙ x12  + b4 ∙ x2 2 + b5 ∙ x1 ∙ x2 kann numerisch eine maximale rel. Peakfläche (73%) bei optimalen Bedingungen 1,0 h und 20°C abgeleitet werden (Minimum bei 1,1 h / 70°C).

Bereits die grafische Darstellung deutet auf eine Diskrepanz zwischen dem empirischen Modell und den Messwerten, dies wird durch die statistischen Parameter bestätigt:
sR = 15,1 und F-Wert  = 6,6 (f1 = 3, f2 = 5; Modell nicht akzeptiert)

Das Resümee ist daher: die RSM-Optimierung ist für diese Anwendung ungeeignet! Als Alternative kann hier die Simplex-Optimierung herangezogen werden ([4, 6] z.B. SimSoft [5]). Diese führt auch in kritischen Fällen schrittweise zum Optimum, erlaubt aber keine Aussage zu den Verhältnissen außerhalb der Messpunkte.

Zusammenfassung

Es lässt sich festhalten, dass die Optimierung mittels RSM eine valide Methodik in der Analytischen Chemie ist. Die Vorteile des Verfahrens liegen darin, dass durch einen relativ geringen Arbeitsaufwand (Messumfang) gute Modellierungen durchgeführt werden können, aus denen neben dem Optimum viele Aussagen abgeleitet werden können. Die grafische Darstellung der Messdaten bzw. des mathematischen Modells erleichtert dabei die Interpretation erheblich. Durch die Untersuchung weiterer Messpunkte mit Wiederholungen (Freiheitsgrade f1, f2) ist eine statistisch validierte Bewertung möglich (ANOVA).

Allerdings stößt das Verfahren dann an seine Grenzen, wenn zu Beginn die Optimierungsbereiche der zu untersuchenden Faktoren ungünstig gewählt sind. Da das Verfahren erst nach Abschluss aller Messungen ein Resultat liefert ist somit gegebenenfalls eine Wiederholung der gesamten Optimierung nötig. Kritisch ist, wenn die statistische Behandlung (F-Wert) zeigt, dass das empirische Polynommodell ungeeignet ist, die Messungen zu simulieren. Hier muss dann alternativ die Simplex-Optimierung eingesetzt werden.

Abschließend bleibt festzuhalten, dass der Einsatz von Optimierungsverfahren, wie RSM- und Simplex-Optimierung unabdingbar sind für die Untersuchung von mehreren Einflussfaktoren (eventuell mit Wechselwirkungen). Nur damit ist eine Optimierung von Analysen-Verfahren sicher und effizient möglich.

Anhang

a) Residuen-Varianz

mit n: Gesamtzahl der Untersuchungen; nj: Zahl der Werte bei Rubrik j, k: Zahl unterschiedliche Rubriken (z.B. 2 Temperatur-Einstellungen), q: Zahl Modellkoeffizienten bi, yij: einzelne Untersuchungsgröße, ŷj: aus Modell berechnete Zielgröße bei der Rubrik j, f = n-q: Freiheitsgrad

b) F-Wert

mit ̅yj: über die j-te Rubrik gemittelte Zielgröße, f1 = k - q: Freiheitsgrad 1, f2 = n-k: Freiheitsgrad 2

 

Autoren
Florian Klingler, Eckhard Reh
 

Kontakt
Prof. Dr. Eckhard Reh
Technische Hochschule Bingen
Bingen, Deutschland
info@chemometrie.info

 

Referenzen

[1] Box, George EP; Wilson, Kenneth B. On the experimental attainment of optimum conditions. Breakthroughs in statistics. Springer, New York, NY, 1992. S. 270-310. DOI:10.12691/ajfst-1-4-5

[2] Box, George EP; Hunter, W. H.; Hunter, J. Stuart. Statistics for experimenters (2. Edition 2005), 1978.

[3] Brereton, R.G., Chemometrics, Data Analysis for Laboratory and Chemical Plant, Wiley, 2003

[4] Reh, Eckhard. Chemometrie: Grundlagen der Statistik, Numerischen Mathematik und Software Anwendungen in der Chemie. Walter de Gruyter GmbH & Co KG, 2017.

[5] www.chemometrie.info

[6] Deming, Stanley N.; Parker JR, Lloyd R.; Bonner Denton M. A review of simplex optimization in analytical chemistry. CRC Critical Reviews in Analytical Chemistry, 1978, 7. Jg., Nr. 3, S. 187-202.

Kontaktieren

Technische Hochschule Bingen
Berlinstr. 109
55411 Bingen
Deutschalnd

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.