Chemometrie in der analytischen Chemie

Teil 1: Nichtlineare Regression in der analytischen Kalibration

  • Tab. 1: Statistische Parameter zur Güte der Modelle der LC-MS-Kalibration (Freiheitsgrad f1, f2, SimFit)Tab. 1: Statistische Parameter zur Güte der Modelle der LC-MS-Kalibration (Freiheitsgrad f1, f2, SimFit)

Chemometrie behandelt das Zusammenspiel von numerischer Mathematik, Stochastik und Software-Realisierung in diversen Disziplinen der Chemie. Mit der allgemeinen Verfügbarkeit großer Rechenleistung aktueller Prozessoren hat die Chemometrie in unterschiedlichsten Bereichen eine große Bedeutung erlangt.

In einer Reihe von Artikeln soll der Einsatz wichtiger Chemometrie-Themen (Prozess-Optimierung, Signalbehandlung, Diskriminanz-Analyse ...) an Hand praktischer Anwendungsbeispiele der analytischen Chemie vorgestellt werden. Die entsprechenden theoretischen Grundlagen sollen nicht Ziel der Ausführungen sein, diese sind in einschlägigen Fachbüchern [1, 2, 3] ausreichend dargestellt.

Einleitung

Im ersten Teil wird der Einsatz der nichtlinearen Regression präsentiert. In unterschiedlichsten Bereichen wird die Regression eingesetzt, um den Zusammenhang zwischen Messgröße und funktionaler Variable zu ermitteln. Beispiele sind die elektrochemischen Messungen bei der Kalibration eines pH-Meters, der Masse-Kalibration eines MS oder dem Einsatz der Kubelka-Munk-Funktion in der IR-Spektroskopie. In der analytischen Chemie am weitesten verbreitet ist Kalibration zur Konzentrationsbestimmung z.B. von AAS-Absorptionen. Hier wird zumeist eine lineare Regression zur Schätzung der Messwert-Gerade eingesetzt [1].

Ein lineares Modell (z.B. Gerade) ist jedoch nicht immer korrekt, um die Kalibrations-Resultate zu modellieren wie in Abbildung 1 aufgezeigt, hier müssen nichtlineare Modelle mittels nichtlinearer Regression zum Einsatz kommen.

Lineare Modelle zeichnen sich dadurch aus, dass je ein Modell-Koeffizient (bi , z.B. Achsenabschnitt, Steigung) in jedem additiven Term des Modells steht (z. B. y = b0 + b1 x + b2 x2).

Nichtlineare Modelle haben einen komplexen Aufbau, z.B. Sättigungsmodell y = b0 x / (b1 + x), das aus der Langmuir-Adsorptions-Isotherme bekannt ist. Viele physikochemische Gesetze basieren auf nichtlinearen Modellen.
Die Berechnung linearer Modelle an Hand zugrundeliegender Kalibrations-Werte ist numerisch geschlossen möglich, einfach und basiert immer auf dem gleichen Algorithmus (vgl.

[2], Kap. 5.2 bzw. [3], Kap. 4.2.2).

Zur Schätzung nichtlinearer Modelle muss die nichtlineare Regression verwendet werden.

Die nichtlineare Regression ist nicht geschlossen durch einen definierten Algorithmus möglich, hier muss die Schätzung der Koeffizienten iterativ erfolgen (Versuch/Irrtum). Diverse Algorithmen für die wiederholte Berechnung/Verfeinerung wurden in der Literatur diskutiert (vgl. [2], Kap. 4.2.3).
Der Einsatz der nichtlinearen Regression zeigt 2 Probleme:

a) der Anwender muss interaktiv den Algorithmus unterstützen / korrigieren,
b) das Resultat hängt manchmal von den gewählten Vorgaben ab, mit denen der Prozess gestartet wird, wie in Beispiel 2 explizit demonstriert wird (Startwert-Problem).

Trotzdem kann mit einer guten Software-Implementierung (nachfolgend wird SimFit verwendet [4]) die nichtlineare Regression gut in der Laborpraxis integriert werden, dies wird an Hand von 3 Beispielen im Folgenden aufgezeigt.

LC-MS

Zunächst soll anhand der Kalibration bei der Kopplung HPLC-Massenspektrometrie (LC-MS) die lineare und nicht lineare Regression verglichen werden. Anhand der Visualisierung der Modellkurven wie in Abbildung 2 kann schon eine Vermutung angestellt werden, ob ein Modell geeignet ist oder nicht.

Beide Modelle zeigen einen typischen Sättigungsverlauf für eine LC-MS-Kalibrierung. Dieser ist insofern zu erklären, dass bei dem Elektrosprayprozess (ESI) H+-Ionen auf den Analyt übertragen werden. Durch eine Mehrfach-Protonierung großer Analyte erfolgt eine Sättigung der Ionisierung bei einer begrenzten H+-Zahl im Eluenten. Anhand der Abweichung der Werte vom Regressionspolynom (grau) wird deutlich, dass die Anwendung eines linearen Modells hier zu fortlaufenden Fehlern in den nachfolgenden Analysen führen wird.

Dazu werden zwei statistische Parameter herangezogen, welche die Güte eines Modells bewerten, diese sollen nachfolgend kurz definiert werden und bei den Modellen Anwendung finden.
Die relative Standardabweichung srel ist ein Maß für die Streuung der Messwerte:

Sie sollte in der Regel nicht mehr als 5% betragen (vgl. [3] Kap. 2.2.2 und 4.2.2, siehe Anhang a).
Der F-Wert gibt an, ob das Modell akzeptiert wird:

Der so ermittelte Prüfwert wird mit dem Vergleichswert der F-Tabelle verglichen und das Modell wird akzeptiert, wenn gilt: Prüfwert < Vergleichswert (vgl. [3], Kap. 4.2.5, siehe Anhang b).

Tabelle 1 gibt die Parameter für die beiden oben aufgeführten Modelle der LC-MS- Kalibration wieder.
Das Polynom-Modell der linearen Regression wurde aufgrund eines zu hohen F-Wertes nicht akzeptiert, die nichtlineare Regression ist hier das Mittel der Wahl.

ELISA

Bei der Kalibration eines Enzymimmuno-Assay (ELISA) ist offensichtlich, dass eine nichtlineare Regression zum Einsatz kommen sollte (Abb. 3), oft wird hier das Rodbard-Modell verwendet (siehe Anhang 3). Der Verlauf des Grafen ist durchaus typisch für kompetitive Immunoassays. Die statistischen Parameter wurden berechnet zu: srel = 2,04%; F-Wert = 0,077 (f1= 2, f2=6), Modell wird akzeptiert. Das Insert in Abbildung 3 verdeutlicht die Startwert-Problematik bei der Nichtlinearen Regression. Standardmäßig legt SimFit für die Parameter und deren Bereiche zu Beginn willkürlich die Werte 1,0 vor, hiermit führt die Berechnung in diesem Fall nicht zum gewünschten Resultat. Erst mit den geänderten Startwerten entsprechend dem Insert ist die Iteration erfolgreich.

AAS

Am Beispiel der Kalibration der elektrothermischen Atomabsorption (AAS) soll erneut das Rodbard-Modell eingesetzt werden, das bei der nichtlinearen Regression häufig verwendet wird (Abb. 4). Der Graf folgt einem konkaven Verlauf.  Man erkennt bei genauem Betrachten die Abweichung der Regressionsgeraden im Bereich niedriger Konzentrationen. Begründet wird das mit Adsorptionsverlusten bei niedrigster Konzentrationen, dies führt jedoch zu einer Linearität im oberen Bereich. Augenscheinlich existiert ein geringer y-Offset infolge von Schwermetall-Verunreinigungen durch das Lösungsmittel (Säure). Die statistischen Parameter liegen im tolerablen Bereich: srel = 0,066%; F-Wert = 1,38 (f1= 2, f2=6), das Modell wird akzeptiert.

Zusammenfassung

Anhand der genannten Beispiele wird deutlich wie essentiell und teilweise unverzichtbar die nichtlineare Regression bei vielen physikochemischen Untersuchungen ist. Bei Verwendung des falschen Modells kann es offenkundig zu Fehlern in nachfolgenden Resultaten (beispielsweise zur Kalibration) kommen.
Anders als bei der linearen Regression ist die Berechnung eines Modells mithilfe einer nichtlinearen Regression nicht parametrisch. Das bedeutet, dass keinerlei Voraussetzungen erfüllt werden müssen. Zudem bietet sie den Vorteil, dass keine Linearisierung (z.B. mit Logit-Log-Transformation) von Nöten ist.

Anhang

a) Relative Standardabweichung

mit n: Gesamtzahl Messpunkte, ni: Zahl der Messpunkte bei der Konzentration j
k: Anzahl unterschiedlicher Konzentrationen,
q: Zahl Modellkoeffizienten
ȳ: Mittelwert aller Messwerte yij,
ŷj: theoretischer y-Wert der j-ten Konzentration aus Regressionsmodell,
n: Gesamtzahl Messpunkte
q: Zahl Modellkoeffizienten (Gerade: q = 2)

b) Varianz-Analyse, F-Wert  

mit n: Gesamtzahl Messpunkte, ni: Zahl der Messpunkte bei der Konzentration j
k: Anzahl unterschiedlicher Rubriken,
q: Zahl Modellkoeffizienten
ȳ: y-Gruppenmittelwert der j-ten Konzentration,
yij: y-Wert i von der j-ten Konzentration
ŷj: theoretischer y-Wert der j-ten Konzentration aus Regressionsmodell

c) Rodbard-Modell

b2 > 0 und 0 < b3 < 10

Autoren
David Hornung, Eckhard Reh

Kontakt  
Prof. Dr. E. Reh

Technische Hochschule Bingen
Bingen, Deutschland
e.reh@th-bingen.de

Referenzen:

[1] DIN ISO 8466-2: Kalibrierung und Auswertung analytischer Verfahren und Beurteilung von Verfahrenskenndaten, September 2000

[2] Brereton, R.G., Chemometrics, Data Analysis for Laboratory and Chemical Plant, Wiley, 2006

[3] Reh, E., Chemometrie, Grundlagen der Statistik, numerischen Mathematik und Software-Anwendung in der Chemie, de Gruyter, 2017

[4] www.chemometrie.info

 

Weitere Beiträge zum Thema

Chemgapedia-Lerneinheit(en)

Kontaktieren

Technische Hochschule Bingen
Berlinstr. 109
55411 Bingen
Deutschalnd

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.