Kiedy woda zamarza, przechodzi ze stanu ciekłego w stan stały, powodując radykalną zmianę właściwości, takich jak gęstość i objętość. Przejścia fazowe w wodzie są tak powszechne, że większość z nas prawdopodobnie o nich nie myśli, ale przejścia fazowe w nowych materiałach lub złożonych układach fizycznych są ważnym obszarem badań.
Aby w pełni zrozumieć te układy, naukowcy muszą być w stanie rozpoznać fazy i wykryć przejścia między nimi. Często jednak nie jest jasne, jak mierzyć zmiany fazowe w nieznanym układzie, zwłaszcza gdy brakuje danych.
Naukowcy z MIT i Uniwersytetu w Bazylei w Szwajcarii zastosowali do tego problemu generatywne modele sztucznej inteligencji, opracowując nową platformę uczenia maszynowego, która może automatycznie rysować diagramy fazowe dla nowatorskich układów fizycznych.
Podejście do uczenia maszynowego opartego na fizyce jest skuteczniejsze niż pracochłonne techniki ręczne, które opierają się na wiedzy teoretycznej. Co ważne, ponieważ ich podejście wykorzystuje modele generatywne, nie wymaga ogromnych, oznakowanych zbiorów danych szkoleniowych wykorzystywanych w innych technikach uczenia maszynowego.
Takie ramy mogłyby pomóc naukowcom na przykład w badaniu właściwości termodynamicznych nowych materiałów lub odkrywaniu splątania w układach kwantowych. Ostatecznie technika ta mogłaby pozwolić naukowcom na samodzielne odkrywanie nieznanych faz materii.
„Jeśli masz nowy system o zupełnie nieznanych właściwościach, jak wybrać obserwowalną wielkość do badania? Mamy nadzieję, przynajmniej w przypadku narzędzi opartych na danych, że można badać duże nowe systemy w sposób zautomatyzowany, co wskaże? Badacz ze stopniem doktora w laboratorium Julii w Laboratorium Informatyki i Sztucznej Inteligencji (CSAIL) powiedział: „Może to być narzędzie na drodze do zautomatyzowanego odkrywania naukowego nowatorskich i dziwacznych właściwości obiektów i jest współautorem artykułu na temat tego podejścia”.
Do Schäfera piszącego tę pracę dołączył pierwszy autor Julian Arnold, absolwent Uniwersytetu w Bazylei; Alan Edelman, profesor matematyki stosowanej na Wydziale Matematyki i kierownik Julia Lab; Starszy autor, Christoph Broder, jest profesorem na Wydziale Fizyki Uniwersytetu w Bazylei. Szukaj jest Opublikowano dzisiaj W listach z przeglądu fizycznego.
Wykrywanie przejść fazowych z wykorzystaniem sztucznej inteligencji
Chociaż przemiana wody w lód może być jednym z najbardziej oczywistych przykładów zmiany fazowej, naukowcy cieszą się bardziej egzotycznymi zmianami fazowymi, na przykład przemianą materiału ze zwykłego przewodnika w nadprzewodnik.
Zmiany te można wykryć poprzez identyfikację „parametru popytu”, czyli ilości, która jest ważna i która ma się zmienić. Na przykład woda zamarza i przechodzi w stan stały (lód), gdy jej temperatura spada poniżej 0°C. W tym przypadku odpowiedni parametr porządku można zdefiniować w kategoriach proporcji cząsteczek wody tworzących część sieci krystalicznej w stosunku do tych, które pozostają w stanie nieuporządkowanym.
W przeszłości badacze polegali na wiedzy fizycznej, aby ręcznie tworzyć diagramy fazowe, opierając się na wiedzy teoretycznej, aby dowiedzieć się, które parametry kolejności są ważne. Jest to nie tylko uciążliwe w przypadku złożonych systemów i być może niemożliwe w przypadku nieznanych systemów o nowatorskich zachowaniach, ale także wprowadza do rozwiązania ludzkie uprzedzenia.
Niedawno badacze zaczęli wykorzystywać uczenie maszynowe do tworzenia klasyfikatorów dyskryminacyjnych, które mogą rozwiązać to zadanie, ucząc się klasyfikowania statystyki pomiarowej jako pochodzącej z określonej fazy układu fizycznego, w taki sam sposób, w jaki takie modele klasyfikują obraz jako kot lub pies.
Badacze z MIT pokazali, jak można wykorzystać modele generatywne do skuteczniejszego rozwiązywania tego zadania klasyfikacji w sposób oparty na fizyce.
the Język programowania JuliaPopularny język obliczeń naukowych, używany także na wstępnych zajęciach z algebry liniowej w MIT, oferuje kilka narzędzi, dzięki którym jest nieoceniony przy budowaniu takich modeli generatywnych, dodaje Schiffer.
Modele generatywne, takie jak te, które stanowią podstawę ChatGPT i Dall-E, zazwyczaj działają poprzez estymację rozkładu prawdopodobieństwa niektórych danych, których używają do generowania nowych punktów danych pasujących do rozkładu (takich jak obrazy nowych kotów podobne do obrazów istniejących kotów). .
Jeśli jednak dostępna jest symulacja układu fizycznego przy użyciu sprawdzonych technik naukowych, badacze otrzymują model jego rozkładu prawdopodobieństwa za darmo. Rozkład ten opisuje statystyki pomiarowe układu fizycznego.
Bardziej znany model
Zespół MIT zauważył, że ten rozkład prawdopodobieństwa definiuje również model generatywny, na którym można zbudować klasyfikator. Podłączyli model generatywny do standardowych formuł statystycznych, aby bezpośrednio utworzyć klasyfikator, zamiast uczyć się go na podstawie próbek, jak miało to miejsce w przypadku metod dyskryminacyjnych.
„To naprawdę świetny sposób na głębokie zintegrowanie wiedzy o systemie fizycznym ze schematem uczenia maszynowego” – mówi Schiffer. „To wykracza poza zwykłe inżynierowanie cech na próbkach danych lub proste odchylenia indukcyjne”.
Ten klasyfikator generatywny może określić, na jakim etapie znajduje się system, biorąc pod uwagę pewne parametry, takie jak temperatura lub ciśnienie. Ponieważ badacze bezpośrednio przybliżają rozkłady prawdopodobieństwa leżące u podstaw pomiarów z układu fizycznego, klasyfikator ma wiedzę o systemie.
Dzięki temu ich metoda działa lepiej niż inne techniki uczenia maszynowego. Ponieważ może działać automatycznie, bez konieczności intensywnego szkolenia, zastosowane przez nich podejście znacznie zwiększa wydajność obliczeniową określania przejść fazowych.
Na koniec, tak jak można poprosić ChatGPT o rozwiązanie problemu matematycznego, badacze mogą zadać klasyfikatorowi generatywnemu pytania, takie jak „Czy ta próbka należy do fazy 1 czy fazy 2?” lub „Czy ta próbka została utworzona w wysokiej czy niskiej temperaturze?”
Naukowcy mogą również zastosować to podejście do rozwiązywania różnych zadań klasyfikacji binarnej w układach fizycznych, na przykład do wykrywania splątania w układach kwantowych (czy stan jest splątany czy nie?) lub określenia, czy teoria A czy B jest lepiej dostosowana do rozwiązania konkretnego problemu. Mogą również zastosować to podejście, aby lepiej zrozumieć i zoptymalizować duże modele językowe, takie jak ChatGPT, określając, jak dostosować określone parametry, aby chatbot zapewniał najlepszą wydajność.
W przyszłości badacze chcą także zbadać teoretyczne gwarancje dotyczące liczby pomiarów potrzebnych do skutecznego wykrycia przejść fazowych i oszacowania liczby niezbędnych obliczeń.
Praca ta została częściowo sfinansowana przez Szwajcarską Narodową Fundację Naukową, szwajcarski fundusz MIT Lockheed Martin Seed Fund oraz Międzynarodowe Inicjatywy Naukowo-Technologiczne MIT.
„Całkowity miłośnik kawy. Miłośnik podróży. Muzyczny ninja. Bekonowy kujon. Beeraholik.”
More Stories
Prognoza cukrzycy w Australii w 2024 r. | Wiadomości o Mirażu
„Gorąca sauna żabia” pomaga australijskim gatunkom w walce ze śmiercionośnym grzybem
Model sztucznej inteligencji poprawia reakcję pacjentów na leczenie raka