Inżynierowie MIT opracowują model sztucznej inteligencji do przewidywania rozpuszczalności cząsteczek w rozpuszczalnikach organicznych
Zespół inżynierów chemików z MIT poczynił duży krok naprzód w usprawnianiu syntezy związków chemicznych, w tym farmaceutyków, dzięki nowatorskiemu modelowi uczenia maszynowego. To potężne narzędzie może przewidywać rozpuszczalność cząsteczki w różnych rozpuszczalnikach organicznych - kluczowy krok w opracowywaniu leków. Może to nie tylko przyspieszyć produkcję nowych terapii, ale także daje możliwość znalezienia bezpieczniejszych, bardziej zrównoważonych opcji dla rozpuszczalników przemysłowych.
Optymalizacja doboru rozpuszczalnika
Znaczenie wyboru najbardziej odpowiedniego rozpuszczalnika w syntezie chemicznej jest nie do przecenienia. Przy mnogości dostępnych rozpuszczalników organicznych, takich jak etanol i aceton, z których każdy różni się wpływem na środowisko i skutecznością, możliwość dokonania dokładnego i skutecznego wyboru ma kluczowe znaczenie. W tym miejscu do gry wkracza innowacyjny model, za którym stoją doktoranci Lucas Attia i Jackson Burns. "Przewidywanie rozpuszczalności jest naprawdę ograniczającym krokiem w syntetycznym planowaniu i produkcji chemikaliów, zwłaszcza leków. Od dawna istniało zainteresowanie możliwością lepszego przewidywania rozpuszczalności" - wyjaśnia Attia.
Model, pieszczotliwie nazywany FastSolvjest swobodnie dostępny i jest już wykorzystywany przez kilka laboratoriów badawczych i korporacji. Jedną z istotnych korzyści, jakie zapewnia, jest możliwość znalezienia mniej niebezpiecznych substytutów powszechnie stosowanych rozpuszczalników przemysłowych. "Istnieją pewne rozpuszczalniki, o których wiadomo, że rozpuszczają większość rzeczy. Są one użyteczne, ale szkodliwe dla środowiska i ludzi. Nasz model jest niezwykle przydatny w identyfikowaniu następnego najlepszego rozpuszczalnika, który, miejmy nadzieję, jest znacznie mniej szkodliwy" - wyjaśnia Burns.
Narodziny i ewolucja modelu zmieniającego zasady gry
Co ciekawe, wynalazek ten był wynikiem projektu programowego na MIT, który łączył uczenie maszynowe z inżynierią chemiczną. Wcześniej model solwatacji Abrahama był sposobem na oszacowanie rozpuszczalności na podstawie struktury molekularnej, aczkolwiek jego dokładność była ograniczona.
W celu przezwyciężenia takich ograniczeń, MIT's Green Lab wprowadziło SolProp w 2022 roku. Chociaż wykorzystywał on właściwości termodynamiczne do przewidywania rozpuszczalności, zawodził w konfrontacji z nieznanymi cząsteczkami, co jest częstym zjawiskiem w opracowywaniu leków. Przełom, jak się okazało, był tuż za rogiem wraz z wydaniem kompleksowego zbioru danych - BigSolDB w 2023 roku. Zawierający dane dotyczące rozpuszczalności z prawie 800 artykułów naukowych, obejmował blisko 800 cząsteczek i ponad 100 rozpuszczalników. Wykorzystując ten ogromny rezerwuar, Attia i Burns zbudowali i wytrenowali dwa modele - FastProp i ChemProp - z ponad 40 000 punktów danych, które uwzględniały nawet wpływ temperatury.
Imponujące wyniki i potencjał na przyszłość
Duet był mile zaskoczony, gdy zauważył, że oba modele wyróżniały się wydajnością, oferując prognozy, które były dwa do trzech razy dokładniejsze niż SolProp, w szczególności wychwytując zmiany rozpuszczalności zależne od temperatury. "Byliśmy zdumieni, widząc, że statyczne i wyuczone osadzenia były statystycznie nie do odróżnienia pod względem wydajności. To wskazuje, że jakość danych jest głównym wąskim gardłem, a nie architektura modelu" - powiedział Burns.
Rzeczywiście, istnieje możliwość uzyskania jeszcze lepszych wyników przy bardziej spójnych danych eksperymentalnych, ponieważ różnice w testach rozpuszczalności przeprowadzanych przez różne laboratoria powodują szum i zmienność danych. Złagodzenie tego zjawiska mogłoby jeszcze bardziej zwiększyć skuteczność modelu. "Jednym z dużych ograniczeń korzystania z tego rodzaju skompilowanych zestawów danych jest to, że różne laboratoria stosują różne metody i warunki eksperymentalne" - podkreślił Attia. Pomimo swoich ograniczeń, FastSolv, znany ze swojej szybkości i przyjaznego dla użytkownika charakteru, już teraz udowadnia swoje uniwersalne zastosowanie w rozwoju farmaceutycznym, materiałoznawstwie i inicjatywach związanych z zieloną chemią. Burns dodaje: "Istnieją zastosowania w całym procesie odkrywania leków. Jesteśmy również podekscytowani widząc, poza formułowaniem i odkrywaniem leków, gdzie ludzie mogą korzystać z tego modelu".
Ten przełomowy rozwój był możliwy dzięki finansowaniu zapewnionemu przez Departament Energii Stanów Zjednoczonych. Bardziej szczegółowe informacje na temat tego przełomu można znaleźć w oryginalnym artykule pod adresem MIT News.