Calcul rapide des modèles de diffusion à l'aide d'algorithmes de fonctions hypergéométriques
MaisonMaison > Blog > Calcul rapide des modèles de diffusion à l'aide d'algorithmes de fonctions hypergéométriques

Calcul rapide des modèles de diffusion à l'aide d'algorithmes de fonctions hypergéométriques

Jun 11, 2024

Rapports scientifiques volume 13, Numéro d'article : 780 (2023) Citer cet article

1588 accès

3 Altmétrique

Détails des métriques

La diffusion de la lumière, des rayons X, des électrons ou des neutrons par la matière est largement utilisée pour la caractérisation structurelle des échelles de longueur atomiques aux échelles macroscopiques. Avec l’avènement des sources de faisceaux à haute brillance et le développement rapide de détecteurs pixellisés sur de grandes surfaces, les modèles de diffusion sont désormais acquis à des fréquences et des tailles d’image sans précédent. La lente analyse de ces modèles de diffusion s’est transformée en un sérieux goulot d’étranglement qui retarde les connaissances scientifiques. Nous introduisons ici un algorithme basé sur l'utilisation de fonctions hypergéométriques offrant des gains en vitesse de calcul allant jusqu'à 105 par rapport aux algorithmes d'intégration numérique actuels. Les fonctions hypergéométriques fournissent des descriptions analytiques de formes géométriques, peuvent être rapidement calculées sous forme de séries et d'expansions asymptotiques, et peuvent être implémentées efficacement dans les GPU. L'algorithme fournit la vitesse de calcul nécessaire pour calculer les modèles de diffusion sur les échelles de temps requises pour le retour d'expérience en temps réel, l'analyse de grands volumes de données de diffusion et pour la génération d'ensembles de données de formation pour l'apprentissage automatique.

La diffusion de la lumière, des rayons X, des électrons ou des neutrons par la matière est largement utilisée pour la caractérisation de la structure des matériaux, depuis les échelles de longueur atomiques jusqu'aux échelles macroscopiques1,2. Pour obtenir des informations structurelles à plusieurs échelles, les expériences de diffusion doivent acquérir des modèles de diffusion sur de grandes zones de détection. Les détecteurs pixelisés modernes couvrent donc des zones de plus en plus vastes, le nombre de pixels correspondant dépassant désormais 107. Parallèlement, les sources de faisceaux de haute intensité telles que les lasers, les sources synchrotron de quatrième génération, les sources de spallation de neutrons, les microscopes électroniques à correction d'aberration et les sources de rayons X à jet métallique sont devenues largement répandues. disponible. La combinaison de faisceaux de haute intensité avec des détecteurs rapides à grande surface permet désormais des expériences in situ et operando élucidant des changements structurels rapides et complexes, obtenant ainsi des informations clés sur l'évolution structurelle, la fonction et les performances des matériaux. Les matériaux et dispositifs couramment étudiés comprennent les alliages métalliques haute performance, les fibres, les batteries, les piles à combustible et les cellules solaires, les nanomatériaux, les composites, les polymères, les colloïdes, les membranes, ainsi que les implants, les formulations d'administration de médicaments et les tissus biologiques.

Cette évolution a conduit à une augmentation sans précédent du taux d'acquisition et du volume des données de diffusion 1D et 2D, à tel point que le temps nécessaire à l'analyse des données est devenu un goulot d'étranglement majeur dans le processus d'obtention d'informations sur les matériaux. Par conséquent, les logiciels de réduction et d’analyse des données de diffusion sont continuellement améliorés grâce à l’introduction de pipelines d’analyse de données plus efficaces3, à l’accélération GPU4 et à l’utilisation d’algorithmes d’apprentissage automatique5. Pourtant, la vitesse de calcul pour l’analyse des données n’a pas augmenté à un rythme comparable à l’augmentation des taux d’acquisition de données actuels.

L'analyse à plusieurs échelles de longueurs des données de diffusion de matériaux procède généralement par la modélisation de sous-structures avec des objets géométriques, qui sont liés et assemblés en objets composés distribués spatialement avec un certain degré d'ordre de position et d'orientation. Les objets géométriques courants comprennent les sphères, les ellipsoïdes, les parallélépipèdes, les cylindres, les disques, les polyèdres ou les tubes ou membranes flexibles dont les surfaces peuvent être décrites mathématiquement sous des formes analytiques fermées. Cette approche géométrique pour modéliser des structures complexes est également couramment utilisée dans les simulations informatiques et dans les algorithmes graphiques de lancer de rayons.

Le calcul des modèles de diffusion implique le calcul de la transformée de Fourier de la structure de l'objet assemblé, puis la moyenne ultérieure des distributions de taille, d'orientation et de position des objets caractérisant le matériau réel étudié6. Le calcul nécessite plusieurs intégrations numériques pour calculer les transformées de Fourier et faire la moyenne sur les fonctions de distribution. Ce calcul prend du temps et constitue le goulot d'étranglement de l'étape d'analyse des données. Par conséquent, il existe une longue histoire de nouvelles méthodes mathématiques importantes pour le calcul et l’analyse efficaces des fonctions de diffusion7,8,9,10,11.

 105. The algorithm can be efficiently parallelized and implemented into GPUs for further acceleration. This enables the computation of 2D scattering patterns at > 1 fps even for current 4k pixel detectors./p>1\) (Regime II) we use the asymptotic expansion (Eq. (7)) for spheres (\(d=3\)) which is/p> 100-times faster compared to numerical integration. If we extrapolate the reported CPU time to 105 data points, the gain in computational speed is > 107./p> 1 fps calculation of 16 million data point 4k pixel detector scattering patterns with a single core CPUs as motivated in the Introductory Section./p> 50, enabling sub-second 1D- and 2D-fitting of very large detector array data as demonstrated in the Supporting Information (SI Sect. 12). As applications we demonstrate in the Supporting Information the simulation of large 2D small-angle X-ray (SAXS), small-angle neutron (SANS) and small-angle light scattering patterns, as well as selected area electron diffraction (SAED) patterns with 2k- or 4k-detectors (SI Sect. 12). We furthermore show GPU-accelerated 2D-fitting, and examples of simulated data sets for the training of neural networks./p> 105 faster than conventional numerical integration schemes. This acceleration is possible, because hypergeometric functions can be efficiently computed via series and asymptotic expansions, the expansion coefficients can be rapidly calculated via recursion relations and are q-independent. They are therefore the same for every pixel and can be pre-calculated and provided to the (i,j)-pixel calculation loop as described in the algorithm in Fig. 2. Over large q-ranges, only one or two terms of the expansion are necessary to compute the scattering intensities with sufficient accuracy. The algorithm enables the fast calculation of scattering patterns of simple and complex objects with defined spatial and orientational distributions. Since the computations of the pixel scattering intensities are mutually independent, the calculation can be efficiently implemented into parallel algorithms for GPUs for further significant acceleration. The algorithm enables rapid calculation of large area 2D-scattering patterns and 1D-scattering data enabling high-throughput fitting of large 1D- and 2D-data sets, on-the-fly data analysis for steering scattering experiments, and fast training of neural networks. It thereby helps addressing the data analysis bottleneck for widespread application in the structural analysis of synthetic and biological materials using X-ray, neutron, light and electron scattering and diffraction experiments. The significant saving in computation time of factors of 105–107 furthermore considerably reduces computer energy consumption relevant for green IT./p>