NachrichtenProduktivität

MIT-Ingenieure entwickeln AI-Modell zur Vorhersage der Löslichkeit von Molekülen in organischen Lösungsmitteln

Ein Team von Chemieingenieuren am MIT hat mit seinem neuartigen Modell für maschinelles Lernen einen großen Fortschritt bei der Rationalisierung der Synthese von chemischen Verbindungen, einschließlich Arzneimitteln, erzielt. Dieses leistungsstarke Werkzeug kann die Löslichkeit eines Moleküls in verschiedenen organischen Lösungsmitteln vorhersagen - ein entscheidender Schritt in der Arzneimittelentwicklung. Dies kann nicht nur die Herstellung neuer Behandlungen beschleunigen, sondern bietet auch die Möglichkeit, sicherere und nachhaltigere Optionen für industrielle Lösungsmittel zu finden.

Die Optimierung der Lösungsmittelauswahl

Die Bedeutung der Auswahl des am besten geeigneten Lösungsmittels für die chemische Synthese kann gar nicht hoch genug eingeschätzt werden. Bei der Fülle der verfügbaren organischen Lösungsmittel wie Ethanol und Aceton, die sich in ihrer Umweltverträglichkeit und Wirksamkeit unterscheiden, ist die Fähigkeit, eine genaue und effiziente Wahl zu treffen, von größter Bedeutung. Hier kommt das innovative Modell ins Spiel, das von den Doktoranden Lucas Attia und Jackson Burns entwickelt wurde. "Die Vorhersage der Löslichkeit ist ein entscheidender Schritt bei der synthetischen Planung und Herstellung von Chemikalien, insbesondere von Medikamenten. Es besteht seit langem ein Interesse daran, die Löslichkeit besser vorhersagen zu können", erklärt Attia.

Das Modell, liebevoll genannt FastSolvist frei zugänglich und wird bereits von mehreren Forschungslabors und Unternehmen genutzt. Ein großer Vorteil ist die Möglichkeit, weniger gefährliche Ersatzstoffe für die üblicherweise verwendeten industriellen Lösungsmittel zu finden. "Es gibt einige Lösungsmittel, von denen bekannt ist, dass sie die meisten Dinge auflösen. Sie sind zwar nützlich, aber schädlich für die Umwelt und für die Menschen. Unser Modell ist äußerst nützlich, um das nächstbeste Lösungsmittel zu finden, das hoffentlich viel weniger schädlich ist", erklärt Burns.

Geburt und Entwicklung eines spielverändernden Modells

Interessanterweise war diese Erfindung das Ergebnis eines Lehrplanprojekts am MIT, bei dem maschinelles Lernen mit Chemieingenieurwesen kombiniert wurde. Zuvor war das Abraham-Solvationsmodell das Mittel der Wahl, um die Löslichkeit auf der Grundlage der Molekülstruktur abzuschätzen, auch wenn seine Genauigkeit begrenzt war.

Um solche Beschränkungen zu überwinden, führte das Green Lab des MIT im Jahr 2022 SolProp ein. Obwohl es thermodynamische Eigenschaften zur Vorhersage der Löslichkeit nutzte, scheiterte es an unbekannten Molekülen, wie sie in der Arzneimittelentwicklung häufig vorkommen. Wie sich herausstellte, stand der Durchbruch kurz bevor, als 2023 ein umfassender Datensatz - BigSolDB - veröffentlicht wurde. Dieser Datensatz umfasste Löslichkeitsdaten aus fast 800 wissenschaftlichen Arbeiten und umfasste fast 800 Moleküle und über 100 Lösungsmittel. Mit Hilfe dieses riesigen Reservoirs erstellten und trainierten Attia und Burns zwei Modelle - FastProp und ChemProp - mit über 40.000 Datenpunkten, die sogar Temperatureinflüsse berücksichtigten.

Beeindruckende Ergebnisse und Zukunftspotenzial

Das Duo war angenehm überrascht, dass beide Modelle hervorragende Leistungen erbrachten und zwei- bis dreimal genauere Vorhersagen als SolProp lieferten, wobei insbesondere temperaturabhängige Löslichkeitsänderungen erfasst wurden. "Wir waren überwältigt, als wir feststellten, dass die statische und die gelernte Einbettung in ihrer Leistung statistisch nicht zu unterscheiden waren. Das deutet darauf hin, dass die Datenqualität der Hauptengpass ist, nicht die Modellarchitektur", so Burns.

Mit konsistenteren experimentellen Daten könnten sogar noch bessere Ergebnisse erzielt werden, da die von verschiedenen Labors durchgeführten Löslichkeitstests zu Rauschen und Datenschwankungen führen. Eine Abschwächung dieses Problems könnte die Wirksamkeit des Modells weiter verbessern. "Eine der großen Einschränkungen bei der Verwendung dieser Art von kompilierten Datensätzen ist, dass verschiedene Labore unterschiedliche Methoden und Versuchsbedingungen verwenden", betonte Attia. Trotz dieser Einschränkungen beweist FastSolv, das für seine Schnelligkeit und Benutzerfreundlichkeit bekannt ist, bereits seine universelle Anwendbarkeit in der pharmazeutischen Entwicklung, in der Materialwissenschaft und in Initiativen der grünen Chemie. Burns fügt hinzu: "Es gibt Anwendungen in der gesamten Pipeline der Arzneimittelentwicklung. Wir sind gespannt darauf, wo dieses Modell auch außerhalb der Formulierungs- und Arzneimittelforschung eingesetzt werden kann."

Diese bahnbrechende Entwicklung wurde durch die Finanzierung des US-Energieministeriums ermöglicht. Eine ausführlichere Untersuchung dieses Durchbruchs finden Sie im Originalartikel unter MIT-Nachrichten.

Wie ist Ihre Reaktion?

Aufgeregt
0
Glücklich
0
Verliebt
0
Nicht sicher
0
Dummerchen
0

Kommentare sind geschlossen.