Seit dem frühen 20. Jahrhundert müssen Wissenschaftler und Physiker erklären, wie und warum sich das Universum immer schneller auszudehnen scheint. Es wird angenommen, dass diese Energie nicht nur für die kosmische Beschleunigung verantwortlich ist, sondern auch 68,3% der nicht sichtbaren Masse des Universums ausmacht.
Ähnlich wie bei der Dunklen Materie basiert die Existenz dieser unsichtbaren Kraft auf beobachtbaren Phänomenen und darauf, dass sie zufällig zu unseren aktuellen Modellen der Kosmologie passt und nicht auf direkte Beweise. Stattdessen müssen sich Wissenschaftler auf indirekte Beobachtungen verlassen und beobachten, wie schnell sich kosmische Objekte (insbesondere Supernovae vom Typ Ia) von uns entfernen, wenn sich das Universum ausdehnt.
Dieser Prozess wäre für Wissenschaftler - wie diejenigen, die für den Dark Energy Survey (DES) arbeiten - äußerst mühsam, wenn nicht die neuen Algorithmen von Forschern des Lawrence Berkeley National Laboratory und der UC Berkeley gemeinsam entwickelt worden wären.
"Unser Algorithmus kann die Erkennung eines Supernova-Kandidaten in etwa 0,01 Sekunden klassifizieren, während ein erfahrener menschlicher Scanner einige Sekunden dauern kann", sagte Danny Goldstein, ein Doktorand der UC Berkeley, der den Code zur Automatisierung des Prozesses der Supernova-Entdeckung auf DES-Bildern entwickelte .
Derzeit in seiner zweiten Staffel macht das DES mit DECam - einer 570-Megapixel-Kamera, die am Victor M. Blanco-Teleskop am Cerro Tololo Interamerican Observatory (CTIO) in den chilenischen Anden montiert ist, nächtliche Bilder des südlichen Himmels. Die Kamera generiert jede Nacht zwischen 100 Gigabyte (GB) und 1 Terabyte (TB) Bilddaten, die zur Erstverarbeitung und Archivierung an das National Center for Supercomputing Applications (NCSA) und das DOE-Fermilab in Illinois gesendet werden.
Objekterkennungsprogramme, die am National Energy Research Scientific Computing Center (NERSC) entwickelt und bei NCSA implementiert wurden, durchsuchen die Bilder auf der Suche nach möglichen Nachweisen von Supernovae vom Typ Ia. Diese starken Explosionen treten in binären Sternensystemen auf, in denen ein Stern ein weißer Zwerg ist, der Material von einem Begleitstern ansammelt, bis es eine kritische Masse erreicht und in einer Supernova vom Typ Ia explodiert.
„Diese Explosionen sind bemerkenswert, da sie mit einer Genauigkeit von 3 bis 10 Prozent als kosmische Entfernungsindikatoren verwendet werden können“, sagt Goldstein.
Entfernung ist wichtig, denn je weiter ein Objekt im Raum entfernt ist, desto weiter zurück in der Zeit ist es. Durch die Verfolgung von Supernovae vom Typ Ia in verschiedenen Entfernungen können Forscher die kosmische Expansion in der gesamten Geschichte des Universums messen. Dies ermöglicht es ihnen, die Expansionsgeschwindigkeit des Universums einzuschränken und möglicherweise sogar andere Hinweise auf die Natur der dunklen Energie zu geben.
"Wissenschaftlich gesehen ist es eine wirklich aufregende Zeit, da mehrere Gruppen auf der ganzen Welt versuchen, Supernovae vom Typ Ia genau zu messen, um die dunkle Energie, die die beschleunigte Expansion des Universums antreibt, einzuschränken und zu verstehen", sagt Goldstein, der ebenfalls Student ist Forscher im Computational Cosmology Center (C3) des Berkeley Lab.
Das DES beginnt seine Suche nach Explosionen vom Typ Ia, indem es Veränderungen am Nachthimmel aufdeckt. Hier kommt die von Forschern der DES-Supernova-Arbeitsgruppe entwickelte und implementierte Bildsubtraktionspipeline ins Spiel. Die Pipeline subtrahiert Bilder, die bekannte kosmische Objekte enthalten, von neuen Bildern die jeden Abend bei CTIO ausgesetzt sind.
Jede Nacht produziert die Pipeline zwischen 10.000 und einigen hunderttausend Erkennungen von Supernova-Kandidaten, die validiert werden müssen.
„In der Vergangenheit saßen ausgebildete Astronomen stundenlang am Computer, sahen sich diese Punkte an und gaben Meinungen darüber ab, ob sie die Eigenschaften einer Supernova hatten oder ob sie durch Störeffekte verursacht wurden, die sich in den Daten als Supernovae tarnten. Dieser Prozess scheint unkompliziert zu sein, bis Sie feststellen, dass die Anzahl der Kandidaten, die jede Nacht klassifiziert werden müssen, unerschwinglich groß ist und nur einer von wenigen hundert eine echte Supernova jeglicher Art ist “, sagt Goldstein. „Dieser Prozess ist äußerst langwierig und zeitintensiv. Es übt auch großen Druck auf die Supernova-Arbeitsgruppe aus, Daten schnell zu verarbeiten und zu scannen, was harte Arbeit ist. “
Um die Prüfung von Kandidaten zu vereinfachen, hat Goldstein einen Code entwickelt, der mithilfe der maschinellen Lerntechnik „Random Forest“ die Erkennung von Supernova-Kandidaten automatisch und in Echtzeit überprüft, um sie für das DES zu optimieren. Die Technik verwendet ein Ensemble von Entscheidungsbäumen, um automatisch die Arten von Fragen zu stellen, die Astronomen normalerweise bei der Klassifizierung von Supernova-Kandidaten berücksichtigen würden.
Am Ende des Prozesses erhält jede Erkennung eines Kandidaten eine Bewertung, die auf dem Anteil der Entscheidungsbäume basiert, die davon ausgegangen sind, dass sie die Eigenschaften einer Erkennung einer Supernova aufweist. Je näher die Klassifizierungsbewertung an eins liegt, desto stärker ist der Kandidat. Goldstein stellt fest, dass die Klassifizierungspipeline in Vorversuchen eine Gesamtgenauigkeit von 96 Prozent erreichte.
"Wenn Sie alleine subtrahieren, erhalten Sie viel zu viele" False-Positives "- Instrumental- oder Software-Artefakte, die sich als potenzielle Supernova-Kandidaten zeigen -, als dass Menschen sie durchsehen könnten", sagt Rollin Thomas von Berkeley Labs C3, der Goldsteins Mitarbeiter war.
Er stellt fest, dass Forscher mit dem Klassifikator die Artefakte von Supernova-Kandidaten schnell und genau herausfiltern können. „Das bedeutet, dass anstatt 20 Wissenschaftler aus der Supernova-Arbeitsgruppe jede Nacht Tausende von Kandidaten zu sichten, man nur eine Person ernennen kann, die sich vielleicht ein paar hundert starke Kandidaten ansieht“, sagt Thomas. "Dies beschleunigt unseren Workflow erheblich und ermöglicht es uns, Supernovae in Echtzeit zu identifizieren, was für die Durchführung von Follow-up-Beobachtungen von entscheidender Bedeutung ist."
"Mit ungefähr 60 Kernen auf einem Supercomputer können wir 200.000 Erkennungen in ungefähr 20 Minuten klassifizieren, einschließlich der Zeit für die Datenbankinteraktion und die Merkmalsextraktion." sagt Goldstein.
Goldstein und Thomas stellen fest, dass der nächste Schritt in dieser Arbeit darin besteht, der Pipeline eine zweite Stufe des maschinellen Lernens hinzuzufügen, um die Klassifizierungsgenauigkeit zu verbessern. Diese zusätzliche Schicht würde berücksichtigen, wie das Objekt in früheren Beobachtungen klassifiziert wurde, da es die Wahrscheinlichkeit bestimmt, dass der Kandidat "real" ist. Die Forscher und ihre Kollegen arbeiten derzeit an verschiedenen Ansätzen, um diese Fähigkeit zu erreichen.