DERİN ÖĞRENMEYLE ÖTEGEZEGEN TESPİTİ

Astronotlardan merhaba! Bu hafta bir makaleden bahsedeceğiz. Bu çalışmada gezegen öncesi disklerde oluşmakta olan ön gezegenlerin kütlesini tahmin etmek amacıyla bir yapay sinir ağı geliştirilmiş.

Bu makaleyi -ironik bir şekilde- dünya bir toz bulutuydu seviyesinden anlatmaya başlayacağız. Yapay sinir ağları günümüzde bilimsel araştırmalarda bolca kullanılan bir araçtır. Artificial Neural Network, yani Yapay Sinir Ağları aslında yeni bir konsept değil, 1950’lerden beri geliştirilen bir teknoloji. Son yıllarda bu kadar sık duymamız ve kullanımının artmasının sebebi ise gelişen bilgisayar teknolojileri. 2000’den sonra işlemci teknolojisinin ve dağıtık sistemlerin gelişmesiyle paralel olarak yapay sinir ağları kullanımı arttı. 

Dağıtık sistemler nedir? Bazen bilgisayarınızdaki işlemcinin gücü, elindeki işi yapmaya yetmez. Ama eğer birçok bilgisayar birbiriyle iletişim kurar ve güçlerini birleştirirse, tek bir işlemciyle çözülemeyecek o problem birden fazla bilgisayarın birlikte çalışmasıyla çözülebilir. Bilgisayarların birbiriyle iletişim kurmaları için ya fiziksel olarak aynı ortamda bulunmaları gerekir ki kablolarla direkt bağlanabilsinler, ya da internete erişimlerinin olması gerekir. Görüyorsunuz her şey birbiriyle bağlantılı. Kronolojik olarak önce internet yaygınlaştı, sonra dağıtık sistemler geliştirildi. Dağıtık sistemlerin sağladığı hesaplama gücüyle de derin öğrenme mümkün hale geldi. 

Yapay sinir ağlarının ilham kaynağı ise insan beyni, terim de buradan geliyor. Herkes az çok beynin nasıl çalıştığını bilir. Örneğin Astronotlar podcastini dinlerken canımız kahve çekti. Güzel bir kahve yapıp kupamıza doldurduk. Elimiz kupaya değdiği anda elimizdeki algılayıcılar sinyal üretti ve bu sinyal beyne gitti. Bu süreçte her bir sinir hücresi aldığı sinyali işledi, bir çıktı üretti ve bu çıktıyı sinapslar aracılığıyla bağlantıda olduğu diğer nöronlara iletti. Böyle sinyaller iletile iletile beyinde dolaştı ve beyin en sonunda bir karar verdi: Bu kahve sıcak. İşte bilgisayarda kodlanılan yapay sinir ağının yapısı da buna çok benziyor. 

Biyolojiden çıkıp astronomiye gidelim yavaştan, ama önce bilgisayar bilimlerinden geçmemiz lazım. Şimdi biz sizlere yapay sinir ağlarının tarihinden bahsedip, sizi sıkmayacağız. Genel olarak konseptten bahsedeceğiz. Birçok yapay sinir ağı modeli var, genel resim aşağı yukarı şöyle: Bu yapay sinir ağını birçok nörondan ve bağlantıdan oluşan bir yapı olarak düşünün. Burda nöron dediğimiz şey matematiksel işlemin gerçekleştiği yer. Nöron için nod veya hücre terimleri de kullanılır sık sık. Bir de bu nöronları birbirine bağlayan yollar var. Şimdi bütün bu yapıyı katman katman düşünelim. İlk katmanda girdilerin içeri alındığı nöronlar olacak. Örneğin sizin veri setinizin özellik sayısı 5 ise ilk katmanda 5 nöron olacak. Yani bir emlakçı elindeki evlerin fiyatlarını belirlerken bu evlerin özelliklerine bakar değil mi? Kaç odası var? Kaç metrekare? Kaç banyosu var, evin kapısı ne renk gibi.

İlk katman girdi katmanı dedik. Bir de çıktı katmanı var ki burda da örneğin emlakçı örneği için evin satış fiyatı olacak. Arada da gizli katman dediğimiz katmanlar var. Bunların sayısı tamamen size bağlı, yapay sinir ağınızı nasıl tasarlarsanız o kadar katman var. Sadece bir tane gizli katmanınız da olabilir, 100 tane de. Tabi katman sayısı arttıkça gerekli işlem gücü artacağı için o modeli eğitmek hayli zaman alacaktır. Her katmanda da, yine istediğimiz sayıda nöron var. Bir katmandaki nöronların çıktısı, diğer katmandaki nöronların girdisi oluyor. Veri bir akış içinde yani, girdi katmanından giriyor, diğer katmanlara akıyor, en sonunda da çıktı katmanında sonuç üretiliyor. Bu nöronların her biri birer işlem birimi. Yani  bunlara gelen her girdi, bir aktivasyon fonksiyonuna tabi tutuluyor ve bu çıktı bir sonraki katmandaki nöronlara iletiliyor. Bu aktivasyon fonksiyonu dediğimiz şey de doğrusal, yani lineer olmayan bir matematik fonksiyonu. Örneğin en çok kullanılan aktivasyon fonksiyonlarından biri ReLU (Rectified Linear Unit), sayı sıfırdan küçükse sıfır çıktı olarak veriyor. Sayı sıfırdan büyükse de değişiklik yapmadan sayının kendisini çıktı olarak veriyor. Her bir nöronda dönen işler bu kadar basit aslında. Ama bu basit işlemler çok sayıda çok fazla veri için yapılınca işler karmaşıklaşıyor. İşleri karmaşıklaştıran bir diğer şeyse, aradaki bağlantıların ağırlıkları. Ağırlık dediğimiz şey de, verinin özelliklerine önem sırası vermek gibi bir şey. Örneğin bir evin kaç odalı olduğu fiyatını oldukça etkiler, ama evin kapısının renginin fiyatına etkisi yok denecek kadar azdır. Bu farkı da veriler bir nörondan diğer nörona iletilirken bir katsayıyla, yani ağırlıkla çarparak gösteriyoruz. 

Veri biliminde temelde iki çeşit öğrenme yöntemi var: gözetimli (supervised) ve gözetimsiz (unsupervised) öğrenme. Gözetimli öğrenmede algoritmayı eğitmek için kullandığınız veri etiketlenmiştir. Yani, yine ev fiyatları örneğinden gidersek, elimizdeki örnek veri setinde evlerin asıl fiyatları da var. Algoritma önce girdiyi alıyor, işlemleri yapıyor ve çıktı üretiyor. Sonra kendi ürettiği çıktıyla doğru sonucu karşılaştırıyor ve modelin parametrelerini aradaki farkı en aza indirecek şekilde tekrar düzenliyor. Buradaki parametrelere az önce bahsettiğimiz ağırlıkları verebiliriz mesela. Parametreler artık neredeyse hiç değişmediğindeyse öğrenme süreci bitmiş oluyor. Gözetimsiz öğrenmeyse apayrı bir konu. Bu kez elimizde sadece girdiler var, çıktı yok. Yani veri etiketli değil. Buna örnek olarak kümeleme problemini verebiliriz. Kümeleme algoritmaları verilerin özellikleri arasındaki farkı hesaplıyor. Fark az çıkanları da benzer kabul ediyor ve grupluyor. Yapay sinir ağları hem gözetimli hem de gözetimsiz öğrenmede kullanılabiyor. 

Konumuz protoplanetary disk, yani gezegen öncesi disk. Ötegezegenler hakkında pek çok bölüm yaptık, ama ötegezegenleri henüz oluşum aşamasındayken tespit etmek ve gözlemlemek istiyorsak daha farklı yaklaşmalıyız olaya. Yeni oluşan bebek yıldızların etrafındaki gaz ve toz henüz temizlenmemiştir. Bir disk şeklinde bebek yıldızın etrafında dönerler. Bu gezegen öncesi diskte ön gezegenler oluşmaya başlar. İşte araştırmacılar bu gezegen öncesi disklerde oluşmaya başlayan ön gezegenlerin kütlesini tahmin edebilen için bir yapay sinir ağı geliştirmişler. Geliştirdikleri yapay sinir ağı, az önce anlattığımızdan biraz farklı. Normal sinir ağlarında çıktılarda bir güven aralığı yoktur, size tek bir sayı verirler. Bu çalışmada araştırmacılar yeni bir sinir ağı geliştirmişler ve adına da Bayesian Derin Öğrenme Ağı demişler. Bu yapay sinir ağı çıktıyı bir aralık şeklinde veriyor. Yani çıktının hata payını da öğrenmiş oluyoruz bu şekilde. Geleneksel metotlarla yapılan bilimsel araştırmalarda da hep hata payı vardır, bu yüzden Bayesian yapay sinir ağının çıktıları diğer bilimsel araştırmalarla kolayca karşılaştırılabiliyor da aynı zamanda. Öte yandan ağı eğitmek için de gezegen öncesi disk simülasyonları yapmışlar. 1098 tane simülasyon verisiyle ağı eğitmişler. Simülasyondaki gezegen kütlesiyle, sinir ağının tahmin ettiği kütle arasındaki korelasyon %82, yani modelin başarısına %82 diyebiliriz. Hatta 2 tane vaka çalışması yapmışlar. İnceledikleri gezegen öncesi diskler  HL Tauri and AS 209. HL Tauri Boğa takımyıldızı yönünde 450 ışık yılı uzaklıkta genç bir yıldız. Yaşı 100,000 yıldan küçük, o kadar genç yani. AS 209 ise Yılancı takımyıldızı yönünde bulunuyor ve bize yaklaşık 410 ışık yılı uzaklıkta. Araştırmacıların geliştirdiği yapay sinir ağı, bu iki sistemdeki gezegenlerin kütlelerini başka çalışmaların bulduğu sonuca yakın tahmin etmiş.

Buradaki iki ön gezegen diski bu yapay sinir ağıyla keşfedilmemiş, sadece test amaçlı kullanılmış, ama ileride keşfedilmesi bekleniyor mu? Evet bekleniyor, gezegen öncesi disklerin fotoğraflanmasının ve araştırılmasının daha başındayız. Gelecekte elimizde çok fazla veri olacak, tüm bu verileri geleneksel yöntemlerle analiz etmek hayli zor ve vakit alıcı olurdu. Bu makalede geliştirdikleri yapay sinir ağı bu verilerin analiz edilmesinde kullanılacak ve muhtemelen birçok aday öngezegen keşfedecekler bu yöntemle.

astronotlar.space@gmail.com e-posta adresimize konuştuğumuz içeriklere dair düşüncelerinizi ve değinmemizi istediğiniz konuları yazabilir, bir kitap, link veya bilgi paylaşımında bulunabilirsiniz. Sosyal medya hesaplarımızı Instagram ve Twitter’dan “astro_notlar” olarak takibe almayı unutmayın! Facebook’tan vazgeçmem diyenler ise bizi AstroNotlar sayfasında bulabilirler. Gelecek hafta görüşünceye dek, gökyüzüne iyi bakın, hoşçakalın!

E-posta: astronotlar.space@gmail.com
Facebook: facebook.com/astronotlar.space
Instagram: instagram.com/astro

Kaynaklar:

https://arxiv.org/pdf/2202.11730.pdf

https://www.ibm.com/cloud/blog/supervised-vs-unsupervised-learning

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.