opalx/html/MultiVariateGaussian_8cpp_source.html

#include "MultiVariateGaussian.h"

#include <mpi.h>

#include <Kokkos_Core.hpp>

#include <algorithm>

#include "Utilities/OpalException.h"


MultiVariateGaussian::MultiVariateGaussian(

        std::shared_ptr<ParticleContainer_t> pc, std::shared_ptr<FieldContainer_t> fc,

        Distribution_t* opalDist)

    : SamplingBase(pc, fc, opalDist) {

    // Initialize covariance matrix from the distribution.

    for (unsigned int i = 0; i < 6; i++) {

        for (unsigned int j = 0; j < 6; j++) {

            cov_m[i][j] = opalDist_m->correlationMatrix_m[i][j];

        }

    }


    setSigmaR(opalDist_m->getSigmaR());

    setSigmaP(opalDist_m->getSigmaP());

    setCutoffR(opalDist_m->getCutoffR());

    setCutoffP(opalDist_m->getCutoffP());


    meanR_m    = 0.0;

    meanP_m    = 0.0;

    meanP_m[2] = opalDist_m->getAvrgpz();


    samplerTimer_m = IpplTimings::getTimer("Sampling");

    initRandomPool();

}


MultiVariateGaussian::MultiVariateGaussian(

        std::shared_ptr<ParticleContainer_t> pc, const Vector_t<double, 3>& meanR,

        const Vector_t<double, 3>& meanP, const Vector_t<double, 3>& sigmaR,

        const Vector_t<double, 3>& sigmaP, const Vector_t<double, 3>& cutoffR,

        const Vector_t<double, 3>& cutoffP, bool fixMeanR, bool fixMeanP)

    : SamplingBase(pc) {

    // Initialize covariance matrix from the distribution.

    for (unsigned int i = 0; i < 6; i++) {

        for (unsigned int j = 0; j < 6; j++) {

            cov_m[i][j] = 0.0;

            if (i == j && i % 2 == 0) {

                cov_m[i][j] = sigmaR[i / 2] * sigmaR[i / 2];

            }

            if (i == j && i % 2 == 1) {

                cov_m[i][j] = sigmaP[i / 2] * sigmaP[i / 2];

            }

        }

    }

    setMeanR(meanR);

    setMeanP(meanP);

    setSigmaR(sigmaR);

    setSigmaP(sigmaP);

    setCutoffR(cutoffR);

    setCutoffP(cutoffP);

    setFixMeanR(fixMeanR);

    setFixMeanP(fixMeanP);


    samplerTimer_m = IpplTimings::getTimer("Sampling");

    initRandomPool();

}


MultiVariateGaussian::MultiVariateGaussian(

        std::shared_ptr<ParticleContainer_t> pc, const Vector_t<double, 3>& meanR,

        const Vector_t<double, 3>& meanP, const Matrix_t& cov, const Vector_t<double, 3>& cutoffR,

        const Vector_t<double, 3>& cutoffP, bool fixMeanR, bool fixMeanP)

    : SamplingBase(pc) {

    cov_m = cov;


    setMeanR(meanR);

    setMeanP(meanP);

    setSigmaR(

            ippl::Vector<double, 3>(

                    Kokkos::sqrt(cov_m[0][0]), Kokkos::sqrt(cov_m[2][2]),

                    Kokkos::sqrt(cov_m[4][4])));


    setSigmaP(

            ippl::Vector<double, 3>(

                    Kokkos::sqrt(cov_m[1][1]), Kokkos::sqrt(cov_m[3][3]),

                    Kokkos::sqrt(cov_m[5][5])));

    setCutoffR(cutoffR);

    setCutoffP(cutoffP);

    setFixMeanR(fixMeanR);

    setFixMeanP(fixMeanP);


    samplerTimer_m = IpplTimings::getTimer("Sampling");

    initRandomPool();

}


void MultiVariateGaussian::initRandomPool() {

    extern Inform* gmsg;

    size_t randInit;


    if (Options::seed == -1) {

        randInit = 1234567;

        *gmsg << "* Seed = " << randInit << " on all ranks" << endl;

    } else {

        randInit = static_cast<size_t>(Options::seed + 100 * ippl::Comm->rank());

    }


    GeneratorPool rand_pool64(randInit);

    randPool_m = rand_pool64;

    return;

}


void MultiVariateGaussian::ComputeCholeskyFactorization() {

    for (unsigned int i = 0; i < 6; i++) {

        for (unsigned int j = 0; j < 6; j++) {

            L_m[i][j] = 0.0;

        }

    }

    double sum = 0.0;

    for (unsigned int i = 0; i < 6; i++) {

        for (unsigned int j = 0; j <= i; j++) {

            sum = 0.0;

            for (unsigned int k = 0; k < j; k++) {

                sum += L_m[i][k] * L_m[j][k];

            }

            if (j == i) {

                L_m[j][j] = Kokkos::sqrt(cov_m[j][j] - sum);

            } else {

                L_m[i][j] = (cov_m[i][j] - sum) / L_m[j][j];

            }

        }

    }

}


void MultiVariateGaussian::ComputeCenteredBounds() {

    rmin_m = -cutoffR_m;

    rmax_m = cutoffR_m;

    pmin_m = -cutoffP_m;

    pmax_m = cutoffP_m;


    for (int i = 0; i < 3; i++) {

        rmin_m(i) *= sigmaR_m(i);

        rmax_m(i) *= sigmaR_m(i);

        pmin_m(i) *= sigmaP_m(i);

        pmax_m(i) *= sigmaP_m(i);


        min_m(i * 2)     = rmin_m(i);

        max_m(i * 2)     = rmax_m(i);

        min_m(i * 2 + 1) = pmin_m(i);

        max_m(i * 2 + 1) = pmax_m(i);

    }


    normMin_m = 0.0;

    normMax_m = 0.0;

    double sumMin, sumMax;

    for (int i = 0; i < 6; i++) {

        sumMin = 0.0;

        sumMax = 0.0;

        for (int j = 0; j < i; j++) {

            sumMin += -L_m[i][j] * normMin_m(j);

            sumMax += -L_m[i][j] * normMax_m(j);

        }

        normMin_m(i) = (min_m(i) - sumMin) / L_m[i][i];

        normMax_m(i) = (max_m(i) - sumMax) / L_m[i][i];

    }


    for (int i = 0; i < 3; i++) {

        normRmin_m(i) = min_m(2 * i) / sigmaR_m(i);

        normRmax_m(i) = max_m(2 * i) / sigmaR_m(i);

        normPmin_m(i) = min_m(2 * i + 1) / sigmaP_m(i);

        normPmax_m(i) = max_m(2 * i + 1) / sigmaP_m(i);


        rmin_m(i) /= sigmaR_m(i);

        rmax_m(i) /= sigmaR_m(i);

        pmin_m(i) /= sigmaP_m(i);

        pmax_m(i) /= sigmaP_m(i);

    }

}


void MultiVariateGaussian::generateParticles(

        size_t& numberOfParticles, Vector_t<double, 3> /*nr*/) {

    if (emissionModel_m != "NONE")

        throw OpalException(

                "MultiVariateGaussian::generateParticles",

                "EMISSIONMODEL '" + emissionModel_m

                        + "' is not supported for MULTIVARIATEGAUSS distributions");


    // Only generate during initial sampling (t0 <= 0). For t0 > 0, this

    // distribution is time-independent and should not contribute here unless

    // explicitly triggered via emitParticles (which sets hasEmittedOnce_m).

    if (t0_m > 0.0 && !hasEmittedOnce_m) {

        return;

    }

    IpplTimings::startTimer(samplerTimer_m);


    auto rand_pool64 = randPool_m;

    // compute L using Cholesky factorization cov=L*LT

    ComputeCholeskyFactorization();


    // compute boundaries of normal random numbers

    ComputeCenteredBounds();


    const double par[6] = {0.0, 1.0, 0.0, 1.0, 0.0, 1.0};

    using Dist_t        = ippl::random::NormalDistribution<double, 3>;

    using sampling_t    = ippl::random::InverseTransformSampling<

               double, 3, Kokkos::DefaultExecutionSpace, Dist_t>;

    Dist_t dist(par);


    const int nranks = std::max(1, ippl::Comm->size());

    // Use computeLocalEmitCount to distribute particles across ranks or uniform fallback.

    size_t nlocal = pc_m ? computeLocalEmitCount(static_cast<size_t>(numberOfParticles))

                         : static_cast<size_t>(

                                   floor(numberOfParticles / nranks)

                                   + (ippl::Comm->rank() < static_cast<int>(

                                              numberOfParticles % static_cast<size_t>(nranks))

                                              ? 1

                                              : 0));


    sampling_t sampling(dist, normRmax_m, normRmin_m, normRmax_m, normRmin_m, nlocal);


    const size_t nlocalCurrent = pc_m->getLocalNum();

    pc_m->createParticles(nlocal);


    view_type RviewFull = pc_m->R.getView();

    view_type PviewFull = pc_m->P.getView();


    auto Rview = Kokkos::subview(RviewFull, std::make_pair(nlocalCurrent, nlocalCurrent + nlocal));

    auto Pview = Kokkos::subview(PviewFull, std::make_pair(nlocalCurrent, nlocalCurrent + nlocal));


    sampling.generate(Rview, rand_pool64);


    sampling.updateBounds(normPmax_m, normPmin_m, normPmax_m, normPmin_m);

    sampling.generate(Pview, rand_pool64);


    Matrix_t L;

    for (unsigned int i = 0; i < 6; i++) {

        for (unsigned int j = 0; j < 6; j++) {

            L[i][j] = L_m[i][j];

        }

    }


    // Apply Cholesky transformation

    Kokkos::parallel_for(

            nlocal, KOKKOS_LAMBDA(const size_t k) {

                double vec_old[6], vec[6] = {0.0};

                for (unsigned i = 0; i < 3; ++i) {

                    vec_old[2 * i]     = Rview(k)[i];

                    vec_old[2 * i + 1] = Pview(k)[i];

                }

                for (unsigned i = 0; i < 6; ++i) {

                    for (unsigned j = 0; j < i + 1; ++j) {

                        vec[i] += L[i][j] * vec_old[j];

                    }

                }

                for (unsigned i = 0; i < 3; ++i) {

                    Rview(k)[i] = vec[2 * i];

                    Pview(k)[i] = vec[2 * i + 1];

                }

            });


    Kokkos::fence();


    // zero mean of R

    double meanR[3], loc_meanR[3];


    if (fixMeanR_m) {

        for (size_t i = 0; i < 3; i++) {

            meanR[i]     = 0.0;

            loc_meanR[i] = 0.0;

        }


        Kokkos::parallel_reduce(

                "calc moments of particle distr.", nlocal,

                KOKKOS_LAMBDA(const size_t k, double& cent0, double& cent1, double& cent2) {

                    cent0 += Rview(k)[0];

                    cent1 += Rview(k)[1];

                    cent2 += Rview(k)[2];

                },

                Kokkos::Sum<double>(loc_meanR[0]), Kokkos::Sum<double>(loc_meanR[1]),

                Kokkos::Sum<double>(loc_meanR[2]));

        Kokkos::fence();


        MPI_Allreduce(loc_meanR, meanR, 3, MPI_DOUBLE, MPI_SUM, ippl::Comm->getCommunicator());

        ippl::Comm->barrier();


        for (size_t i = 0; i < 3; i++) {

            meanR[i] = meanR[i] / (1. * numberOfParticles);

        }


        Kokkos::parallel_for(

                nlocal, KOKKOS_LAMBDA(const size_t k) {

                    Rview(k)[0] -= meanR[0];

                    Rview(k)[1] -= meanR[1];

                    Rview(k)[2] -= meanR[2];

                });

        Kokkos::fence();

    }


    // zero mean of P

    double meanP[3], loc_meanP[3];

    if (fixMeanP_m) {

        for (size_t i = 0; i < 3; i++) {

            meanP[i]     = 0.0;

            loc_meanP[i] = 0.0;

        }

        Kokkos::parallel_reduce(

                "calc moments of particle distr.", nlocal,

                KOKKOS_LAMBDA(const size_t k, double& cent0, double& cent1, double& cent2) {

                    cent0 += Pview(k)[0];

                    cent1 += Pview(k)[1];

                    cent2 += Pview(k)[2];

                },

                Kokkos::Sum<double>(loc_meanP[0]), Kokkos::Sum<double>(loc_meanP[1]),

                Kokkos::Sum<double>(loc_meanP[2]));

        Kokkos::fence();


        MPI_Allreduce(loc_meanP, meanP, 3, MPI_DOUBLE, MPI_SUM, ippl::Comm->getCommunicator());

        ippl::Comm->barrier();


        for (size_t i = 0; i < 3; i++) {

            meanP[i] = meanP[i] / (1. * numberOfParticles);

        }


        Kokkos::parallel_for(

                nlocal, KOKKOS_LAMBDA(const size_t k) {

                    Pview(k)[0] -= meanP[0];

                    Pview(k)[1] -= meanP[1];

                    Pview(k)[2] -= meanP[2];

                });

        Kokkos::fence();

    }


    // correct the means of R and P from input

    for (size_t i = 0; i < 3; i++) {

        meanR[i] = meanR_m[i];

        meanP[i] = meanP_m[i];

    }


    Kokkos::parallel_for(

            nlocal, KOKKOS_LAMBDA(const size_t k) {

                for (size_t i = 0; i < 3; i++) {

                    Rview(k)[i] += meanR[i];

                    Pview(k)[i] += meanP[i];

                }

            });

    Kokkos::fence();


    // Apply per-emission-source offsets after all mean-fixing/corrections.

    // EMISSIONSOURCE offsets are expected to translate the generated bunch

    // without being affected by the internal "fix mean" logic.

    const Vector_t<double, 3> R0 = R0_m;

    const Vector_t<double, 3> P0 = P0_m;

    Kokkos::parallel_for(

            nlocal, KOKKOS_LAMBDA(const size_t k) {

                Rview(k) += R0;

                Pview(k) += P0;

            });


    fillPolarization(nlocalCurrent, nlocal);


    pc_m->markMomentsDirty();


    IpplTimings::stopTimer(samplerTimer_m);

}


void MultiVariateGaussian::emitParticles(double t, double dt) {

    // One-shot delayed emission for multivariate Gaussian sources.

    const double tStart = t;

    const double tEnd   = t + dt;


    if (hasEmittedOnce_m) {

        return;

    }


    if (t0_m <= 0.0) {

        return;

    }


    if (!(tStart <= t0_m && t0_m < tEnd)) {

        return;

    }


    if (!opalDist_m) {

        return;

    }

    size_t Ndist = opalDist_m->getNumParticles();

    if (Ndist == 0) {

        return;

    }


    const size_t nlocalBefore = pc_m->getLocalNum();


    hasEmittedOnce_m = true;

    Vector_t<double, 3> dummyNr(0.0);

    generateParticles(Ndist, dummyNr);


    const size_t nlocalAfter = pc_m->getLocalNum();

    const size_t nNew        = nlocalAfter - nlocalBefore;

    if (nNew > 0) {

        const double fracDt = tEnd - t0_m;

        auto dtview         = pc_m->dt.getView();

        const size_t offset = nlocalBefore;

        Kokkos::parallel_for(

                "MultiVariateGaussian_setDt", nNew,

                KOKKOS_LAMBDA(const size_t j) { dtview(offset + j) = fracDt; });

        Kokkos::fence();

    }

}


gmsg
Inform * gmsg
Definition changes.cpp:7

Vector_t
ippl::Vector< T, Dim > Vector_t
Definition DistributionMoments.h:31

view_type
typename ippl::detail::ViewType< ippl::Vector< double, Dim >, 1 >::view_type view_type
Definition Distribution.cpp:53

MultiVariateGaussian.h

Matrix_t
ippl::Vector< ippl::Vector< double, 6 >, 6 > Matrix_t
Definition MultiVariateGaussian.h:15

GeneratorPool
typename Kokkos::Random_XorShift64_Pool<> GeneratorPool
Definition MultiVariateGaussian.h:13

Dist_t
ippl::random::NormalDistribution< double, 3 > Dist_t
Definition MultiVariateGaussian.h:14

OpalException.h

Distribution
Definition Distribution.h:69

Distribution::getCutoffP
ippl::Vector< double, 3 > getCutoffP() const
Definition Distribution.h:251

Distribution::getNumParticles
size_t getNumParticles() const
Definition Distribution.h:267

Distribution::getSigmaP
ippl::Vector< double, 3 > getSigmaP() const
Definition Distribution.h:243

Distribution::getSigmaR
ippl::Vector< double, 3 > getSigmaR() const
Definition Distribution.h:241

Distribution::getAvrgpz
double getAvrgpz() const
Definition Distribution.h:265

Distribution::correlationMatrix_m
Matrix_t correlationMatrix_m
Definition Distribution.h:125

Distribution::getCutoffR
ippl::Vector< double, 3 > getCutoffR() const
Definition Distribution.h:249

MultiVariateGaussian::emitParticles
void emitParticles(double t, double dt) override
Time-stepped emission hook for one-shot delayed injection.
Definition MultiVariateGaussian.cpp:376

MultiVariateGaussian::normMax_m
Vector_t< double, 6 > normMax_m
Definition MultiVariateGaussian.h:155

MultiVariateGaussian::sigmaP_m
Vector_t< double, 3 > sigmaP_m
Definition MultiVariateGaussian.h:177

MultiVariateGaussian::samplerTimer_m
IpplTimings::TimerRef samplerTimer_m
Timer for performance profiling.
Definition MultiVariateGaussian.h:105

MultiVariateGaussian::fixMeanR_m
bool fixMeanR_m
Flag to exactly fix the mean R and P of particles after sampling.
Definition MultiVariateGaussian.h:182

MultiVariateGaussian::fixMeanP_m
bool fixMeanP_m
Definition MultiVariateGaussian.h:183

MultiVariateGaussian::meanP_m
Vector_t< double, 3 > meanP_m
Definition MultiVariateGaussian.h:130

MultiVariateGaussian::setCutoffR
void setCutoffR(const Vector_t< double, 3 > &cutoffR)
Definition MultiVariateGaussian.h:111

MultiVariateGaussian::L_m
Matrix_t L_m
Definition MultiVariateGaussian.h:140

MultiVariateGaussian::setMeanP
void setMeanP(const Vector_t< double, 3 > &meanP)
Definition MultiVariateGaussian.h:109

MultiVariateGaussian::max_m
Vector_t< double, 6 > max_m
Definition MultiVariateGaussian.h:155

MultiVariateGaussian::normPmin_m
Vector_t< double, 3 > normPmin_m
Definition MultiVariateGaussian.h:150

MultiVariateGaussian::setCutoffP
void setCutoffP(const Vector_t< double, 3 > &cutoffP)
Definition MultiVariateGaussian.h:113

MultiVariateGaussian::pmax_m
Vector_t< double, 3 > pmax_m
Definition MultiVariateGaussian.h:145

MultiVariateGaussian::ComputeCholeskyFactorization
void ComputeCholeskyFactorization()
Computes the Cholesky factorization of the covariance matrix.
Definition MultiVariateGaussian.cpp:117

MultiVariateGaussian::rmin_m
Vector_t< double, 3 > rmin_m
Definition MultiVariateGaussian.h:145

MultiVariateGaussian::rmax_m
Vector_t< double, 3 > rmax_m
Definition MultiVariateGaussian.h:145

MultiVariateGaussian::pmin_m
Vector_t< double, 3 > pmin_m
Definition MultiVariateGaussian.h:145

MultiVariateGaussian::cutoffR_m
Vector_t< double, 3 > cutoffR_m
Cutoff multipliers for position and momentum distributions.
Definition MultiVariateGaussian.h:160

MultiVariateGaussian::min_m
Vector_t< double, 6 > min_m
Min and Max bounds for all 6 dimensions (R0,P0,R1,P1,R2,P2).
Definition MultiVariateGaussian.h:155

MultiVariateGaussian::normPmax_m
Vector_t< double, 3 > normPmax_m
Definition MultiVariateGaussian.h:150

MultiVariateGaussian::MultiVariateGaussian
MultiVariateGaussian(std::shared_ptr< ParticleContainer_t > pc, std::shared_ptr< FieldContainer_t > fc, Distribution_t *opalDist)
Constructor for MultiVariateGaussian.
Definition MultiVariateGaussian.cpp:13

MultiVariateGaussian::setFixMeanR
void setFixMeanR(bool fixMeanR)
Definition MultiVariateGaussian.h:115

MultiVariateGaussian::setMeanR
void setMeanR(const Vector_t< double, 3 > &meanR)
Definition MultiVariateGaussian.h:107

MultiVariateGaussian::normMin_m
Vector_t< double, 6 > normMin_m
Definition MultiVariateGaussian.h:155

MultiVariateGaussian::initRandomPool
void initRandomPool()
Initializes the random number generator pool.
Definition MultiVariateGaussian.cpp:98

MultiVariateGaussian::cov_m
Matrix_t cov_m
Definition MultiVariateGaussian.h:135

MultiVariateGaussian::normRmax_m
Vector_t< double, 3 > normRmax_m
Definition MultiVariateGaussian.h:150

MultiVariateGaussian::generateParticles
void generateParticles(size_t &numberOfParticles, Vector_t< double, 3 > nr) override
Generates particles based on the defined Gaussian distribution.
Definition MultiVariateGaussian.cpp:190

MultiVariateGaussian::meanR_m
Vector_t< double, 3 > meanR_m
Definition MultiVariateGaussian.h:130

MultiVariateGaussian::sigmaR_m
Vector_t< double, 3 > sigmaR_m
Standard deviations for position and momentum distributions.
Definition MultiVariateGaussian.h:176

MultiVariateGaussian::setSigmaP
void setSigmaP(const Vector_t< double, 3 > &sigmaP)
Definition MultiVariateGaussian.h:120

MultiVariateGaussian::randPool_m
GeneratorPool randPool_m
Pool of random number generators for parallel sampling.
Definition MultiVariateGaussian.h:171

MultiVariateGaussian::setSigmaR
void setSigmaR(const Vector_t< double, 3 > &sigmaR)
Definition MultiVariateGaussian.h:119

MultiVariateGaussian::ComputeCenteredBounds
void ComputeCenteredBounds()
Computes centered bounds for the particle distribution.
Definition MultiVariateGaussian.cpp:142

MultiVariateGaussian::cutoffP_m
Vector_t< double, 3 > cutoffP_m
Definition MultiVariateGaussian.h:161

MultiVariateGaussian::normRmin_m
Vector_t< double, 3 > normRmin_m
Definition MultiVariateGaussian.h:150

MultiVariateGaussian::setFixMeanP
void setFixMeanP(bool fixMeanP)
Definition MultiVariateGaussian.h:117

OpalException
Definition OpalException.h:30

SamplingBase
Definition SamplingBase.hpp:15

SamplingBase::P0_m
Vector_t< double, 3 > P0_m
Definition SamplingBase.hpp:23

SamplingBase::R0_m
Vector_t< double, 3 > R0_m
Emission source offset: position R0, momentum P0, start time t0 (applied in sample step).
Definition SamplingBase.hpp:22

SamplingBase::hasEmittedOnce_m
bool hasEmittedOnce_m
For one-shot emitters (e.g. Gaussian at delayed t0): guard to avoid double sampling.
Definition SamplingBase.hpp:33

SamplingBase::computeLocalEmitCount
size_t computeLocalEmitCount(size_t totalToSample) const
Computes the number of particles this rank should emit so that the global total equals totalToSample ...
Definition SamplingBase.cpp:6

SamplingBase::emissionModel_m
std::string emissionModel_m
Definition SamplingBase.hpp:25

SamplingBase::opalDist_m
Distribution_t * opalDist_m
Definition SamplingBase.hpp:19

SamplingBase::fillPolarization
void fillPolarization(size_t startIdx, size_t count)
Definition SamplingBase.hpp:63

SamplingBase::t0_m
double t0_m
Definition SamplingBase.hpp:24

SamplingBase::pc_m
std::shared_ptr< ParticleContainer_t > pc_m
Definition SamplingBase.hpp:17

Options::seed
int seed
The current random seed.
Definition Options.cpp:37