Datenaustausch im Labor der Zukunft

Ein Blick auf AnIML und SiLA

  • © Jack Moreh, freerangestock.com© Jack Moreh, freerangestock.com
  • © Jack Moreh, freerangestock.com
  • Tab. 1: Unterstützte Messtechniken für AnIM
  • Burkhard Schäfer ist Diplom-Informatiker und Geschäftsführer der BSSN Software GmbH. Er studierte an der TU Kaiserslautern und der University of New Mexico. Vor Gründung der BSSN Software arbeitete Schäfer bereits an der Standardisierung von Geräteschnittstellen und Datenformaten beim Los Alamos Na-tional Laboratory und dem National Institute of Standards and Technology. Heute liegt sein Fokus auf Strategien für einheitliches Datenmanagement und Integration. Schäfer ist Mitglied von ASTM, wo er die AnIML-Technologie als Architekt mit auf den Weg brachte. Ebenfalls ist er Mitglied des Board of Directors von SiLA.

Offene Datenformate wie AnIML und Kommunikationsprotokolle wie SiLA helfen, das digitale Labor zu vernetzen. Sie sorgen für Planung, Orchestrierung und Dokumentation von Versuchen und Prozessen. Am Ende entsteht ein einheitliches und vollständiges Datenpaket, das sich ideal als Basis für Datenanalyse und weiterführende Nutzung eignet.

Spricht man über das Labor der Zukunft, denkt man oft an Daten. Gesucht werden Wege, Daten einfacher zu erzeugen und besser zu nutzen. Moderne Datenanalyse, maschinelles Lernen und Methoden der künstlichen Intelligenz versprechen viel, erfordern jedoch eine gut gepflegte und leicht zugängliche Datenbasis, sowie einen optimalen Datenfluss zwischen allen beteiligten Systemen.

Doch wie geht das? Standardisierte Datenformate und Kommunikationsprotokolle sind wichtige Bausteine für eine solche digitale Infrastruktur. Ihr geschickter Einsatz ermöglicht die nahtlose Integration von Geräten und Softwaresystemen. Dies schafft effizientere Abläufe, einen nahtlosen Datenfluss sowie verbesserte Datenintegrität.

Dieser Artikel stellt zwei Initiativen vor: das AnIML-Datenformat für hersteller­übergreifende Ablage von Analytikdaten, sowie die SiLA-Initiative, ein Kommunikationsprotokoll für das integrierte Labor. Er betrachtet auch, wie sich durch Nutzung von Standards ein nachhaltige Infrastruktur zur Nutzung und Auswertung von Daten aufbauen lässt.

Das AnIML-Datenformat

AnIML steht für Analytical Information Markup Language. Es handelt sich um ein XML-basiertes Dateiformat für Daten aus der analytischen Chemie und Biologie. Mit ihm lassen sich Daten unterschiedlicher Messtechniken und Hersteller im gleichen Format ablegen. Dabei finden sich nicht nur Ergebnisse, sondern auch Rohdaten, Informationen zu Proben, Geräten, Methoden, Workflows und Audit Trails. Mit AnIML lassen sich einfache und komplexe Laborabläufe gleichermaßen beschreiben und dokumentieren. Bei der Entwicklung wurde besonders auf einfache Implementierbarkeit und niedrige Gesamtkosten Wert gelegt.

Beschreibung von Experimenten

Laborabläufe werden in sogenannte „Experiment Steps“ beschrieben.

Ein Experiment Step ist je nach Messtechnik unterschiedlich aufgebaut. Er kann Proben konsumieren und produzieren. Auch kann ein Experiment Step die Ergebnisse eines anderen aufnehmen und weiter verarbeiten. Ein Experiment Step kann also einen physischen Ablauf oder eine Datenanalyse oder -manipulation darstellen. Auch die an diesem Step beteiligten Geräte, deren Einstellungen, genutzte Software sowie der ausführende Nutzer werden gespeichert. Roh- und Ergebnisdaten sind ebenfalls enthalten. Um Platz zu sparen, können redundante Daten mehrerer Experiment Steps durch Templates zusammengefasst werden. Ein einfaches Beispiel wäre ein UV-Spektrum. Hier gibt es einen einzelnen Experiment Step, der das Spektrum an sich, sowie die Methoden- und Konfigurationsdaten des Spektrometers enthält. Dieser Experiment Step referenziert die von ihm konsumierte Messprobe. Wird die gleiche Probe erneut vermessen, könnte man an diese Messprobe auch weitere Experiment Steps, auch mit anderen Messtechniken, knüpfen.

Etwas komplexer wird es mit Chromatographie, z. B. HPLC. Hier gibt es einen Experiment Step zur Beschreibung der Injektion. Dieser wird mit zusätzlichen Experiment Steps verknüpft, um die Arbeit und Ergebnisse eines jeden verbundenen Detektors zu dokumentieren. So stellt jedes Chromatogramm oder Spektrum einen weiteren Experiment Step dar.
Eine Peaktabelle referenziert keine physische Probe. Sie konsumiert hingegen ein Chromatogramm, stellt also ein „Experiment auf Daten“ dar. Die Methode beschreibt hierbei die Einstellungen des Peakfinders.

AnIML ist generisch, eignet sich also für viele unterschiedliche Messtechniken. Durch das Konzept von „Technique Definitions“ ist beschrieben, wie ein Experiment Step für eine bestimmte Messtechnik aufgebaut ist. So ist das Format leicht erweiterbar. Bestehende Software lässt sich auch für künftige Messtechniken nutzen. Tabelle 1 zeigt einige bereits implementierte Messtechniken auf.

Die Ursprüng von AnIML

Das AnIML-Format stammt vom ASTM-Subkommitee für Analytikdaten (E13.15). Dank einer breit aufgestellten Gruppe mit Vertretern von Endanwendern, Herstellern, Regierungseinrichtungen sowie Forschung und Lehre ergab sich ein breites Anforderungsspektrum. Der ASTM-Prozess sorgte dabei dafür, dass sich alle Beteiligten auf Augenhöhe begegnen konnten und die gleichen Möglichkeiten hatten, den Standard zu prägen. So wurde sichergestellt, dass die Anforderungen und Interessen sowohl von Herstellern als auch Anwendern unterschiedlicher Industriezweige gleichermaßen gewahrt wurden. Dies erklärt auch, warum AnIML bei Herstellern Akzeptanz findet.

AnIML im regulierten Umfeld

AnIML komplett zu beschreiben würde den Rahmen dieses Artikels sprengen. Einige interessante Aspekte sollen hier dennoch erwähnt werden. Das Format bietet Unterstützung für Audit Trails und digitale Signaturen. Diese vereinfachen den Einsatz im regulierten Umfeld, wo behördliche Rahmenbedingungen erhöhte Anforderungen an die Datenhaltung stellen. Mit Audit Trails können jegliche Änderungen an den Daten aufgezeichnet und dokumentiert werden. Digitale Signaturen erlauben den Nachweis, dass Daten von einem bestimmten Autor stammen, und dass sie seit Erzeugung nicht geändert wurden.

Durch XML ist AnIML textbasiert. Somit ist es bei Bedarf auch ohne jegliche Anwendungssoftware lesbar. Die Kombination der Lesbarkeit des XML-Formats und der nachweisbaren Integrität durch digitale Signaturen machen AnIML zu einem idealen Format für die Langzeitarchivierung, gerade im regulierten Umfeld.

Zugänglichkeit als Erfolgsrezept

Standards setzen sich nur dann am Markt durch, wenn sie einfach zu nutzen sind und günstige Gesamtkosten bieten. Mit XML nutzt AnIML eine bewährte und breit akzeptierte Basistechnologie und fügt sich nahtlos in ein großes Ökosystem ein. Dadurch ergeben sich einige interessante Vorteile. Hersteller sind unabhängig von proprietären Bibliotheken oder Implementierungen. Sie können das für ihren Anwendungsfall geeignete Framework nutzen. Endanwender können zahlreiche bestehende XML-Werkzeuge zum Einsatz bringen. Sogar Werkzeuge mit Ursprung außerhalb der Laborwelt können plötzlich mit Labordaten umgehen, auch wenn sie dazu nicht explizit entwickelt wurden. Man denke an Reportgeneratoren oder Datenanalysetools. XML ist leicht erlernbar. So überrascht es nicht, dass einige Hersteller innerhalb weniger Tage ohne Vorwissen eine AnIML-Unterstützung implementieren konnten.

Unterstützung durch Hersteller

Ein weiteres Kriterium, an dem sich ein Standard messen lassen muss, ist seine Verbreitung. Dabei ist die Akzeptanz durch Hersteller entscheidend. Letztendlich ist ein Standard nur dann nutzbar, wenn die passenden Werkzeuge verfügbar sind. AnIML wird derzeit von über 25 Herstellern unterstützt. Beispielsweise nutzt Agilent AnIML in seinem ECM-System. Sciex setzt bei seiner Lösung für Langzeitarchivierung auf AnIML. LabWare, der größte LIMS-Anbieter, stellt seinen Kunden AnIML für seine Geräteschnittstellen bereit. BSSN Software bietet AnIML-Werkzeuge sowie Konverter für über 150 Gerätemodelle verschiedener Hersteller. Durch die gute Verfügbarkeit von Werkzeugen findet AnIML bei Endanwendern immer mehr Verbreitung.

SiLA

SiLA fokussiert sich auf die Entwicklung von Standards zur Kommunikation mit Geräten und Laborsoftware. So können Geräte angesteuert werden, aber auch Software kann untereinander kommunizieren. SiLA setzt dabei auf bewährte Web Service-Technik, sodass ein breites Ökosystem von Werkzeugen zur Implementierung auf verschiedenen Plattformen zur Verfügung steht. Sowohl Geräte als auch Softwaresysteme können über SiLA ihre Dienste im Netzwerk bereitstellen und lassen sich integrieren. Durch einen solchen Serviceansatz ist es nicht mehr nötig, auf den weniger robusten Austausch von Joblisten und Ergebnissen über Dateien in Transferverzeichnissen zurückzugreifen. Vielmehr erlaubt SiLA die interaktive Kommunikation, Statusabfragen und Reaktion auf Ereignisse. Da zur Kommunikation niemals Dateien abgelegt und später wieder eingesammelt werden, ist es deutlich einfacher, Datenintegrität und Nachvollziehbarkeit sicherzustellen.

Ursprung von SiLA

SiLA entstammt ursprünglich dem Umfeld der Laborautomatisierung und des High Throughput Screening. Initial wurden Geräte wie Waagen, Plate Reader, Pipettierer und Roboterarme unterstützt. SiLA hat darauf den Schritt in die analytischen Chemie und Biologie gemacht, angefangen mit Waagen, bis hin zu komplexen Zielen wie Chromatographiedatensystemen (CDS). Durch einen Standard für Prozessmanagementsysteme können komplexe Abläufe oder einzelne Proben an Subsysteme delegiert werden. Dieser Mechanismus lässt sich zur standardisierten Anbindung von CDS-Systemen an LIMS oder ELN nutzen.

Die neue Version SiLA 2

Das SiLA-Konsortium arbeitet aktuell an SiLA 2, der nächsten Generation des Protokolls. Der technische Unterbau wurde mit der neuen Version modernisiert. Herstellerübergreifende Befehlssätze werden durch das Feature-Konzept vereinfacht. Außerdem wurde die Werkzeugunterstützung verbessert, um eine noch einfachere Implementierung zu ermöglichen.

Verbreitung von SiLA

SiLA konnte sich bislang hauptsächlich in Europa in kleinen und großen Installationen im pharmazeutischen und akademischen Umfeld bewähren. Zahlreiche Hersteller engagieren sich aktiv für die Weiterentwicklung und nutzen SiLA in ihren Produkten. Die SiLA Homepage bietet einen Überblick über die verfügbaren Treiber für ca. 200 Gerätemodelle.

Daten und Kommunikation gehören zusammen

SiLA und AnIML verfolgen unterschiedliche Ziele. Als Kommunikationsprotokoll ermöglicht SiLA das Ansteuern von Geräten und Softwaresystemen über Webschnittstellen. AnIML hingegen stellt ein XML-basiertes Datenformat zur Beschreibung von Analytik- und Prozessdaten dar.

Beides ist wichtig. Nutzt man ein universelles Dateiformat, erreicht man eine vollständige Dokumentation des Versuchs. Allfälliger Datenaustausch zwischen Systemen müsste jedoch durch Verschieben von Dateien bewerkstelligt werden. Dies wäre nicht zuverlässig. Hätte man jedoch nur ein standardisiertes Kommunikationsprotokoll, könnte man zwar Geräte und Systeme steuern, würde die resultierenden Daten jedoch in proprietären Silos ablegen.

Die Kombination von SiLA und AnIML stellt einen mächtigen Ansatz dar: Die Steuerung übernimmt SiLA. Die dabei anfallenden Daten kann SiLA jedoch im AnIML-Format transportieren. So ergibt sich nach Abschluss des Experiments ein vollständiges Datenpaket, das alle Prozessschritte, sowie Roh- und Ergebnisdaten umfasst. Beide Projekte arbeiten seit mehreren Jahren zusammen, um ein einheitliches und offenes Ökosystem zu fördern.

Datenanalyse

Laborversuche werden stets von einem unmittelbaren Bedürfnis ausgelöst: man untersucht eine Probe aus der Produktion zur Chargenfreigabe. Man nimmt eine Wasserprobe, um die Funktion einer Kläranlage zu kontrollieren, oder man betreibt einen pH-Sensor, um einen Bioprozess zu überwachen. Interessant wird jedoch, diese Daten zu nutzen, um weitere Ziele durch geschickte Auswertung zu erreichen. So könnte man Zusammenhänge zwischen Prozessparametern und Verunreinigungen finden, Trendanalysen durchführen, oder Statistiken über die Rohdaten mehrerer klinischer Studien erstellen.

Um solche Analysen zu erlauben, muss eine große Datenbasis vorhanden sein. Diese gilt es, gut strukturiert und gut zugänglich zu gestalten. Erst dann lassen sich unterschiedliche Analysewerkzeuge darauf anwenden. Auch die Techniken zum maschinellen Lernen oder die Methoden künstlicher Intelligenz können so mit Daten versorgt werden.

Hier kann ein AnIML-basierter Data Lake gute Dienste leisten. Aus den durch Experimente erhobenen Daten werden relevante Elemente extrahiert und in einer Auswertungsschicht bereitgestellt. Diese Schicht kann nun durch geeignete Werkzeuge abgefragt und genutzt werden. Da sich die Regeln zur Datenextraktion jederzeit ändern lassen, können die verfügbaren Daten bei Bedarf ergänzt werden. So ergibt sich eine zukunftssichere Infrastruktur, die eine maximale Wertschöpfung aus den Daten ermöglicht.

Zusammenfassung

Standards wie AnIML und SiLA fördern klar die Interoperabilität. Mit ihnen lassen sich die Daten unterschiedlicher Experimente einheitlich erheben, ablegen und auswerten. So lassen sich die Daten unterschiedlicher Geräte und Messtechniken mit einem einheitlichen Satz an Werkzeugen nutzen. Man benötigt nicht mehr separate Schnittstellen für jeden Gerätetyp, um eine LIMS-Anbindung vorzunehmen. Auch benötigt man nicht mehr separate Software, um die Daten eines Geräts zu nutzen. So lassen sich die Gesamtkosten für Integration und Datenmanagement senken. Auch die Perspektive, so gesammelte Daten einfacher auswerten und organisationsübergreifend nutzen zu können, macht AnIML und SiLA einen Blick wert.

Autor

Burkhard Schäfer

Kontakt 
Burkhard Schäfer
BSSN Software GmbH
Darmstadt, Deutschland
 

Kontaktieren

BSSN Software GmbH

Darmstadt
Deutschland

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.