Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire

Towards GPU-accelerated Direct and Iterative Solvers for Computational Wave Scattering in HELM

Télécharger
Distrée, Florent ULiège
Promoteur(s) : Arnst, Maarten ULiège
Date de soutenance : 8-sep-2025/9-sep-2025 • URL permanente : http://hdl.handle.net/2268.2/24701
Détails
Titre : Towards GPU-accelerated Direct and Iterative Solvers for Computational Wave Scattering in HELM
Titre traduit : [fr] Accélération par le GPU de la simulation d'éléments finis avec application à la nano-optique informatique 3D
Auteur : Distrée, Florent ULiège
Date de soutenance  : 8-sep-2025/9-sep-2025
Promoteur(s) : Arnst, Maarten ULiège
Membre(s) du jury : Geuzaine, Christophe ULiège
Bogdanowicz, Janusz 
Tomasetti, Romin ULiège
Langue : Anglais
Nombre de pages : 104
Discipline(s) : Ingénierie, informatique & technologie > Multidisciplinaire, généralités & autres
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en ingénieur civil physicien, à finalité approfondie
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] This thesis contributes towards the development of GPU-accelerated direct and iterative solvers for computational wave scattering.
This research was carried out in the context of experimental Finite Element code HELM developed in a computational stochastic research group.

The research extends the physical modeling capabilities of the HELM C++ framework by formalizing a scattered-field weak formulation with Perfectly Matched Layers to accurately model complex, heterogeneous media.

The core of the work investigates two primary solution strategies on modern GPU architectures.

First, a numerical performance evaluation of GPU-accelerated direct solvers is presented, demonstrating that the NVIDIA cuDSS library offers a performance advantage over both its predecessor, cuSOLVER, and CPU-based solvers like KLU2, achieving speedups of up to an order of magnitude on a single GPU.

Second, an iterative solver based on a Multigrid Shifted Laplacian preconditioner is explored. In particular, an implementation of this preconditioner in the MueLu package from Trilinos is used. Several contributions were made to the MueLu implementation to enable its use with general ordinal types, as well as to permit a nearly complete GPU-resident multigrid V-cycle for complex arithmetic.

A comparative scaling analysis reveals that while the GPU direct solver is faster for the tested 2D problems, the iterative multigrid method exhibits superior asymptotic complexity, suggesting it is a viable path for large-scale 3D and parallel problems. Key limitations, including the parallel scalability of the Restricted Additive Schwarz smoother and remaining host-bound computations, are identified. Future work could focus on integrating Optimized Schwarz methods and achieving a fully GPU-resident workflow by offloading the coarse-grid solve and matrix reordering.


Fichier(s)

Document(s)

File
Access Master_Thesis_Final.pdf
Description:
Taille: 10.44 MB
Format: Adobe PDF
File
Access Summary.pdf
Description:
Taille: 107.4 kB
Format: Adobe PDF

Auteur

  • Distrée, Florent ULiège Université de Liège > Master ing. civ. phys., fin. approf.

Promoteur(s)

Membre(s) du jury

  • Geuzaine, Christophe ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Applied and Computational Electromagnetics (ACE)
    ORBi Voir ses publications sur ORBi
  • Bogdanowicz, Janusz
  • Tomasetti, Romin ULiège Université de Liège - ULiège > Département d'aérospatiale et mécanique > Computational and stochastic modeling
    ORBi Voir ses publications sur ORBi








Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.