Parameter Optimization for Mathematical Modeling

Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: İstanbul Teknik Üniversitesi, Lisansüstü Eğitim Enstitüsü, Türkiye

Tezin Onay Tarihi: 2023

Tezin Dili: İngilizce

Öğrenci: MEHMET TUNÇEL

Danışman: Ahmet Duran

Özet:

Dinamik sistemleri, diferansiyel denklemleri ve istatistiksel modelleri içinde barındırabilen matematiksel modellemeler fen bilimleri, mühendislik ve finansın birçok alanında karşımıza çıkan karmaşık sistemlerin davranışını yorumlamak ve tahmin etmek için etkili yöntemlerdendir. Model parametrelerinin tahmini matematiksel modellemenin kritik parçasıdır. Bu parametreler model doğruluğu ve performansı üzerinde önemli etkiye sahiptirler. Belirli bir objektif fonksiyonu için en optimal değerleri sağlayan parametreleri belirlemek, parametre optimizasyon yöntemlerinin amacıdır ve sınırlı bir sürede anlamlı parametrelerle daha fazla doğrulukta sonuca yakınsamak birçok gerçek hayat uygulaması için önemsenen stratejik amaçlardandır.
Bunun yanı sıra, büyük doğrusal sistem denklemlerinin çözümü, bazı matematiksel modeller için önemli adımlardandır. Bu nedenle, hesaplama kaynakların yönetimi, matematiksel modelleme için de önemli bir aşama olarak karşımıza çıkmaktadır.

Etkin başlangıç parametre vektörlerinin seçimi, birçok bilim ve mühendislik probleminde parametre vektörlerine ve diferansiyel denklemlere sahip matematiksel modeller için önemli yere sahiptir. A. Duran ve G. Caginalp (2008) varlık akış diferansiyel denklemleri ile hisse fiyatı için hibrit parametre optimizasyon tahmin algoritması sundu. Bölüm 2’de, parametre vektör optimizasyonunun ters bir problemi için yeni bir matematiksel yöntem öneriyoruz. Hiper kutudaki ızgara ve rasgele yaklaşımların etkinliğini, varlık akışı teorisinden gelen matematiksel bir modelde parametre vektör optimizasyonunun ters bir problemi için doğrusal olmayan en küçük kareler hatası, maksimum iyileştirme faktörü ve yineleme sayısı açısından analiz ediyor ve karşılaştırıyoruz. Bu analiz, yatırımcılar ve makine öğrenimi uygulamalarında popülasyon dinamiklerinin anlaşılması açısından oldukça değerlidir. Bu amaçla, seçilen her olay ve başlangıç parametre vektörü için F[˜K] fonksiyonunu optimize ediyoruz. Burada geri izleme satırı arama algoritmasını kullanan Broyden-Fletcher-Goldfarb-Shanno (BFGS) formülüne sahip quasi-Newton (QN) yöntemini kullanıyoruz. F[ ˜K] simülasyon yoluyla hesaplanıp gerçek piyasa fiyatını temsil eden değerleri ile hesaplanan piyasa fiyatı değerleri arasındaki üstel ağırlıklı kare farkların toplamını temsil etmektedir. Bu çalışmamızda (A. Duran ve G. Caginalp, 2008)’den farklı olarak, Monte Carlo simülasyonları ve yakınsama diyagramları elde ettik. Bunları kullanarak ve sınırsız optimizasyon problemindeki simülasyon veri setimize dayanarak ızgara yaklaşımının başarısının rastgele yaklaşıma nispeten daha iyi olduğunu görmekteyiz.

Bunun yanı sıra, kısa zamanda karar vermenin çok önemli olduğu finansal uygulamalarda kullanılan dinamik bir sistem için ölçeklenebilir bir paralel sayısal parametre optimizasyon algoritmasına sahip olmak önemlidir. Bölüm 3’te, Message Passing Interface (MPI) paralel programlamasını kullanıyoruz ve parametre tahmini için böyle yeni bir paralel algoritma sunmaktayız. Algoritmamızı 1989’dan beri G. Caginalp ve araştırma ekibi tarafından geliştirilen ve analiz edilen varlık akışı diferansiyel denklemlerine uygulamaktayız. Bazı zaman serileri için (A. Duran and M. Tunçel, 2014)’de 512 çekirdeğe kadar hızlanma sağlanmakla birlikte (A. Duran and M. Tunçel, 2014)’den farklı olarak, bu çalışmada daha kapsamlı finansal piyasa durumlarını, örneğin düşük volatilite, yüksek volatilite ve borsa fiyatının değişen büyüklüklerine göre net varlık değerinde iskonto/prim durumlarını da ele alıyoruz. Ayrıca, ilk parametre vektörlerinin sayısına bağlı olarak optimizasyon işleminin başarısını ölçmek için model parametre vektörünün yakınsamasını, doğrusal olmayan en küçük kareler hatasını ve maksimum iyileştirme faktörünü de değerlendirmekteyiz.

Büyük matematiksel modeller için ele alınması gereken bir konu da hesaplama sistemlerinin doğru eşleştirilmesi ve parametrelerinin ayarlanmasıdır. Bu konu için Bölüm 4’te farklı yüksek performanslı hesaplama kümelerinde arterlerdeki kan akışının simülasyonundan gelen büyük matrislerin çözümü için biyomedikal sıvı akışı simülasyonlarının ve OpenFOAM’da çözücü olan icoFoam’un hesaplama zorluklarını incelemekteyiz. Akış problemi simülasyonunda üretilen matrisler zaman ilerledikçe her adımda birbirinden farklı matematiksel özelliklere geçiş yapmaktadır. Bu çalışmada, çözücülerin kötü koşullu (ing: ill-conditioned) matrisler için davranışlarını inceledik. Yinelemeli çözücü icoFoam’un ve doğrudan çözücü olan SuperLU_DIST’in hibrit paralel kodlarını (MPI + OpenMP) CPU performanlarını Fransa CEA TGCC’nin Curie (Tier-0 sistemi) ince düğümlerinde koşturarak karşılaştırdık. Ayrıca, TGCC’nin Curie (Tier-0 sistemi) hibrit düğümlerinde SuperLU_DIST’in MPI + OpenMP ve MPI + OpenMP + CUDA hibrit paralel çözücü kodlarının performansını farklı parametreler ile inceleyip karşılaştırdık. 20 milyon x 20 milyona kadar olan büyük matrisler için çözücülerin hızlandırılmasına ilişkin sonuçları bu bölümde irdelemekteyiz.

Matematiksel modellemelerin içerdiği diğer bir önemli konu da petrol ve gaz rezervuarı simülasyonlarında olduğu gibi zaman kısıtlı gerçek hayat karar verme uygulamaları için büyük seyrek doğrusal sistemleri tahmin edilebilir bir sürede performanslı bir şekilde çözmek için gerekli ön bilgileri ve parametreleri elde etmektir.
Bu nedenle, büyük matrislerin ölçeklenebilir doğrudan çözücülerin performansı üzerindeki spektral etkilerini özdeğerleri kullanarak incelemeyi amaçladık. Bölüm 5’te, bir matrisin özdeğer dağılımı ile çözücünün performansı arasında bir ilişki olup olmadığını araştırmaktayız. Çeşitli seyrek matrislerin özdeğer dağılımlarını
ele aldık. Bazen özdeğerlerin dağılım grafiğini elde etmek için tüm özdeğerler bulunabilmektedir. Ama büyük matrisler için tüm özdeğerleri bulmak hesaplama ve kaynakları açısından oldukça pahalıdır. Bu nedenle, Gerschgorin teoremi kare
matrislerin spektral durumunun tahmini için kullanılabilmektedir. Gerschgorin dairelerinin ayrık, üst üste binmesi veya kümelenmesi gibi çeşitli davranışlar, özdeğerlerin dağılımı ve çözücünün bu matris için performansı hakkında ipucu verebilmektedir. Bu merkezde Bölüm 5’te, rastgele doldurulmuş seyrek matrisleri ve rezervuar modellemesinden gelen çeşitli desenli matrisleri içeren bir test matrisleri portföyünü tek gözeneklilik tek geçirgenlikden çift gözeneklilik çift geçirgenlik modellerine kadar ele almaktayız. 3 fazlı modelden ve 7 bileşenli EOS modelinden
desenli matrislere ek olarak Florida Üniversitesi seyrek matris koleksiyonundan modifiye edilmiş HELM2D03LOWER_20K matrisimizi ve EMILIA_923 matrislerini ayrıntılı incelemekteyiz. En uygun minimum çekirdek sayısını, belirli bir problem boyutu için minimum çözüm süresini sağlayan çekirdek sayısı olarak tanımlamaktayız.
Burada problem boyutu ile matrisin spektral etkileri ve bellek gibi kullanılabilir kaynaklar arasında bir ilişki görünmektedir. Gerekli en uygun minimum çekirdek sayısının, matrisin seyreklik seviyesine ve boyutuna bağlı olduğunu görüyoruz. Matrisin seyreklik seviyesi azaldıkça ve matrisin boyutu arttıkça, optimal minimum
çekirdek sayısının artmasını beklemekteyiz.

Sonuç olarak yukarıdaki çalışmaları içeren bu tez, parametre optimizasyon yöntemleri ve matematiksel modellemede yaygın olarak kullanılan doğrusal denklem çözümleri için önemli olan yeni yöntem ve stratejiler sunmaktadır. Her bölüm, çalışmanın ayrıntılarıyla ilgili ayrı ayrı literatür taramasını da içermektedir. Tez özetle aşağıdaki gibi düzenlenmiştir. Bölüm 2’de, daha iyi yakınsama performansı elde etmek için parametre optimizasyonunda kullanılan başlangıç parametre vektörü seçimi için yeni bir yöntem sunmaktayız. Bölüm 3’te, matematiksel modellemenin çözümü için çok önemli olan zaman sınırlamasını dikkate alarak paralel sayısal parametre optimizasyonu için yeni bir algoritma önermekteyiz. Bölüm 4’te, hesaplamalı sistem için doğru kaynakların ve kombinasyonlarının eşleştirilmesinin önemi, yaygın olarak kullanılan senaryolar ve testlerle gösterilmektedir. Bölüm 5’te, hesaplamalı kaynak büyüklüğü ile problemin doğru ve verimli eşleşmesi, özdeğer spektrumu kullanılarak
doğrusal sistemin ön değerlendirmesi ile incelenmiş ve optimal minimum çekirdek
sayısı tanımlanmıştır. Bölüm 6’da bu tezden elde edilen sonuçlar bütünüyle ele alınıp değerlendirilmektedir.