Wypełnianie braków za pomocą uczenia maszynowego

Satelita Gaia wykonuje najdokładniejsze jak dotąd pomiary ruchu gwiazd. Konkretnie, mierzy pozycje, prędkości i paralaksy gwiazd na całym niebie. Są to niezwykle przydatne informacje, ale nie dają one pełnego obrazu ruchu gwiazd. Na przykład, jak gwiazdy poruszają się wzdłuż naszej linii widzenia?

Wizja artystyczna sondy kosmicznej Gaia. Źródło: ESA

Nie na wszystkich wymiarach
Obecnie, Gaia zwraca „astrometrię 5D” dla większości obserwowanych gwiazd, która składa się z dwóch współrzędnych położenia, dwóch prędkości i paralaksy. Na podstawie tych danych przeprowadzono już wiele badań naukowych, takich jak badanie pochodzenia strumieni gwiazd otaczających Drogę Mleczną.

Jednak większość astrometrii dostarczanej przez Gaia jest ograniczona do płaszczyzny nieba, co oznacza, że nie widzimy, jak gwiazdy poruszają się wzdłuż naszej linii widzenia – to znaczy, czy poruszają się w naszym kierunku, czy też oddalają od nas. To sprawia, że niektóre fascynujące nauki, takie jak mapowanie subtelnych struktur gwiazdowych i struktur ciemnej materii w Drodze Mlecznej są poza zasięgiem. Badania spektroskopowe mogą dać nam prędkości w linii widzenia, ale są one czasochłonne i ograniczone objętością przestrzeni, którą mogą pokryć. Dodatkowo, niewiele badań spektroskopowych pokrywa się z obszarem obserwowanym przez Gaia.

Nie wszystko jest jednak stracone! Najnowsze badania przeprowadzone przez Adrianę Dropulic (Uniwersytet Princeton) pokazują, w jaki sposób uczenie maszynowe może być wykorzystane do przewidywania prędkości w linii prostej dla gwiazd w astrometrii 5D z Gaia.

Trening sieci neuronowej
Aby rozwinąć swoją technikę uczenia maszynowego, Dropulic i jej współpracownicy zaczęli od publicznie dostępnego katalogu próbnych danych Gaia, które zawierały prędkości w linii widzenia. Dodali również gwiazdy podobne do tych w Gaia-Enceladus, które pojawiają się, gdy wykreśla się prędkości. Katalog próbny obejmował przestrzeń w promieniu około pięciu kiloparseków (16 000 lat świetlnych) od Słońca i zawierał około 75 mln gwiazd. Katalog został następnie podzielony na zbiory treningowe, walidacyjne i testowe, z których pierwszy przyjmował prawdziwą próbkę Gaia, zawierającą informacje o prędkościach w linii widzenia, czyli informacje „6D”.

Następnie Dropulic i współpracownicy wytrenowali sieć neuronową, aby przewidzieć prędkość danej gwiazdy w linii widzenia i związaną z nią przypadkowość. Ważnym zastrzeżeniem tej metody jest to, że nie ma ona na celu niemal idealnego odgadnięcia prędkości w linii widzenia dla pojedynczej gwiazdy. Celem jest raczej uzyskanie rozsądnego oszacowania rozkładu prędkości dla całej grupy gwiazd.

Przejście od próbnych danych
Zaletą posiadania danych wyjściowych sieci było to, że Dropulic i jej współpracownicy byli w stanie skonstruować rozkłady prędkości “próbkowane błędem”, które są tworzone przez uśrednienie wielu przewidywań prędkości i niepewności dla pojedynczej gwiazdy i powtórzenie dla całego rozkładu. Te rozkłady prędkości z próbkowaniem błędów okazały się bliższe rozkładom rzeczywistym niż rozkładom przewidywanym.

Następnym krokiem w tej pracy jest trenowanie sieci neuronowej na rzeczywistym katalogu danych Gaia, a także zbadanie bardziej odległych regionów Drogi Mlecznej. Nadchodzące trzecie wydanie danych z Gaia będzie zawierało około 30 mln gwiazd z pełną astrometrią 6D, więc nie minie dużo czasu, zanim ta metoda uczenia maszynowego będzie mogła zostać wprowadzona w życie.

Opracowanie:
Agnieszka Nowak

Źródło:

Popularne posty z tego bloga

Łączenie się galaktyk rzuca światło na model ewolucji galaktyk

Astronomowie ujawniają nowe cechy galaktycznych czarnych dziur

Odkryto podwójnego kwazara we wczesnym Wszechświecie