hops/doxygen/Data_8hpp_source.html

#ifndef HOPS_DATA_HPP

#define HOPS_DATA_HPP


#include <hops/FileWriter/FileWriter.hpp>

#include <hops/FileWriter/FileWriterFactory.hpp>

#include <hops/FileWriter/FileWriterType.hpp>

#include <hops/MarkovChain/MarkovChain.hpp>

#include <hops/Statistics/ExpectedSquaredJumpDistance.hpp>

#include <hops/Statistics/EffectiveSampleSize.hpp>

#include <hops/Statistics/PotentialScaleReductionFactor.hpp>

#include <hops/Utility/ChainData.hpp>


#include <Eigen/Core>


#include <vector>

#include <memory>


namespace hops {

    class Data {

    public:

        Data(long dimension = 0) : dimension(dimension) {

            //

        }


        Data(const std::vector<std::shared_ptr<MarkovChain>>& m_markovChains, long dimension = 0) : dimension(dimension) {

            linkWithChains(m_markovChains);

        }


        void setDimension(long dimension) {

            this->dimension = dimension;

        }


        void linkWithChains(const std::vector<std::shared_ptr<MarkovChain>>& m_markovChains) {

            chains.resize(m_markovChains.size());

            for (size_t i = 0; i < m_markovChains.size(); ++i) {

                m_markovChains[i]->installDataObject(chains[i]);

            }

        }


        std::vector<const std::vector<double>*> getAcceptanceRates() {

            std::vector<const std::vector<double>*> acceptanceRates(chains.size());

            for (size_t i = 0; i < acceptanceRates.size(); ++i) {

                acceptanceRates[i] = chains[i].acceptanceRates.get();

            }

            return acceptanceRates;

        }


        std::vector<const std::vector<double>*> getNegativeLogLikelihood() {

            std::vector<const std::vector<double>*> negativeLogLikelihood(chains.size());

            for (size_t i = 0; i < negativeLogLikelihood.size(); ++i) {

                negativeLogLikelihood[i] = chains[i].negativeLogLikelihood.get();

            }

            return negativeLogLikelihood;

        }


        std::vector<const std::vector<Eigen::VectorXd>*> getStates() {

            std::vector<const std::vector<Eigen::VectorXd>*> states(chains.size());

            for (size_t i = 0; i < states.size(); ++i) {

                states[i] = chains[i].states.get();

            }

            return states;

        }


        std::vector<const std::vector<long>*> getTimestamps() {

            std::vector<const std::vector<long>*> timestamps(chains.size());

            for (size_t i = 0; i < timestamps.size(); ++i) {

                timestamps[i] = chains[i].timestamps.get();

            }

            return timestamps;

        }


        void computeTotalNumberOfSamples() {

            totalNumberOfSamples = 0;

            for (size_t i = 0; i < chains.size(); ++i) {

                totalNumberOfSamples += chains[i].getStates().size();

            }

        }


        void computeAcceptanceRate() {

            acceptanceRate = Eigen::VectorXd(chains.size());

            for (size_t i = 0; i < chains.size(); ++i) {

                acceptanceRate(i) = chains[i].getAcceptanceRates().back();

            }

        }


        void computeEffectiveSampleSize() {

            std::vector<const std::vector<Eigen::VectorXd>*> states(chains.size());

            if (!chains.size()) {

                throw EmptyChainDataException();

            }


            for (size_t i = 0; i < states.size(); ++i) {

                states[i] = chains[i].states.get();

                if (!states[i]) {

                    throw EmptyChainDataException();

                }

            }

            std::vector<double> effectiveSampleSize = ::hops::computeEffectiveSampleSize(states);

            this->effectiveSampleSize = Eigen::Map<Eigen::VectorXd>(effectiveSampleSize.data(), dimension);

        }


        void computeExpectedSquaredJumpDistance() {

            std::vector<const std::vector<Eigen::VectorXd>*> states(chains.size());

            if (!chains.size()) {

                throw EmptyChainDataException();

            }


            for (size_t i = 0; i < states.size(); ++i) {

                states[i] = chains[i].states.get();

                if (!states[i]) {

                    throw EmptyChainDataException();

                }

            }

            std::vector<double> expectedSquaredJumpDistance = ::hops::computeExpectedSquaredJumpDistance<Eigen::VectorXd, Eigen::MatrixXd>(states);

            this->expectedSquaredJumpDistance = Eigen::Map<Eigen::VectorXd>(expectedSquaredJumpDistance.data(), chains.size());

        }


        void computePotentialScaleReductionFactor() {

            std::vector<const std::vector<Eigen::VectorXd>*> states(chains.size());

            if (!chains.size()) {

                throw EmptyChainDataException();

            }


            for (size_t i = 0; i < states.size(); ++i) {

                states[i] = chains[i].states.get();

                if (!states[i]) {

                    throw EmptyChainDataException();

                }

            }

            std::vector<double> potentialScaleReductionFactor = ::hops::computePotentialScaleReductionFactor(states);

            this->potentialScaleReductionFactor = Eigen::Map<Eigen::VectorXd>(potentialScaleReductionFactor.data(), dimension);

        }


        void computeTotalTimeTaken() {

            totalTimeTaken = Eigen::VectorXd(chains.size());

            for (size_t i = 0; i < chains.size(); ++i) {

                totalTimeTaken(i) = chains[i].getTimestamps().back() - chains[i].getTimestamps().front();

            }

        }


        void reset() {

            for (size_t i = 0; i < chains.size(); ++i) {

                chains[i].reset();

            }

        }


        void write(const std::string& outputDirectory, bool discardRawData = false) const {

            if (!discardRawData) {

                for (size_t i = 0; i < chains.size(); ++i) {

                    auto fileWriter = FileWriterFactory::createFileWriter(outputDirectory + "/chain" + std::to_string(i), FileWriterType::CSV);

                    chains[i].write(fileWriter.get());

                }

            }


            auto statisticsWriter = FileWriterFactory::createFileWriter(outputDirectory + "/statistics", FileWriterType::CSV);


            if (acceptanceRate.size() > 0) {

                statisticsWriter->write("acceptanceRate", Eigen::MatrixXd(acceptanceRate.transpose()));

            }


            if (expectedSquaredJumpDistance.size() > 0) {

                statisticsWriter->write("expectedSquaredJumpDistance", Eigen::MatrixXd(expectedSquaredJumpDistance.transpose()));

            }


            if (effectiveSampleSize.size() > 0) {

                statisticsWriter->write("effectiveSampleSize", Eigen::MatrixXd(effectiveSampleSize.transpose()));

            }


            if (potentialScaleReductionFactor.size() > 0) {

                statisticsWriter->write("potentialScaleReductionFactor", Eigen::MatrixXd(potentialScaleReductionFactor.transpose()));

            }


            if (totalNumberOfSamples > 0) {

                statisticsWriter->write("totalNumberOfSamples", Eigen::MatrixXd(totalNumberOfSamples * Eigen::MatrixXd::Identity(1,1)));

            }


            if (totalTimeTaken.size() > 0) {

                statisticsWriter->write("totalTimeTaken", Eigen::MatrixXd(totalTimeTaken.transpose()));

            }


            if (totalNumberOfTuningSamples > 0) {

                auto tuningWriter = FileWriterFactory::createFileWriter(outputDirectory + "/tuning", FileWriterType::CSV);

                tuningWriter->write("totalNumberOfTuningSamples", std::vector<long>{static_cast<long>(totalNumberOfTuningSamples)});

                tuningWriter->write("stepSize", std::vector<double>{tunedStepSize});

                tuningWriter->write("objectiveValue", std::vector<double>{tunedObjectiveValue});

                tuningWriter->write("totalTimeTaken", std::vector<double>{totalTuningTimeTaken});


                if (tuningData.size() > 0) {

                    tuningWriter->write("data", tuningData);

                }


                if (tuningPosterior.size() > 0) {

                    tuningWriter->write("posterior", tuningPosterior);

                }

            }

        }


        void setTuningMethod(const std::string& tuningMethod) {

            this->tuningMethod = tuningMethod;

        }


        void setTotalNumberOfTuningSamples(unsigned long totalNumberOfTuningSamples) {

            this->totalNumberOfTuningSamples = totalNumberOfTuningSamples;

        }


        void setTunedStepSize(double tunedStepSize) {

            this->tunedStepSize = tunedStepSize;

        }


        void setTunedObjectiveValue(double tunedObjectiveValue) {

            this->tunedObjectiveValue = tunedObjectiveValue;

        }


        void setTotalTuningTimeTaken(double totalTuningTimeTaken) {

            this->totalTuningTimeTaken = totalTuningTimeTaken;

        }


        void setTuningData(const Eigen::MatrixXd& tuningData) {

            this->tuningData = tuningData;

        }


        void setTuningPosterior(const Eigen::MatrixXd& tuningPosterior) {

            this->tuningPosterior = tuningPosterior;

        }


    private:

        std::vector<ChainData> chains;


        double totalNumberOfSamples;

        Eigen::VectorXd acceptanceRate;

        Eigen::VectorXd expectedSquaredJumpDistance;

        Eigen::VectorXd effectiveSampleSize;

        Eigen::VectorXd potentialScaleReductionFactor;

        Eigen::VectorXd totalTimeTaken;


        // tuning data

        std::string tuningMethod;

        unsigned long totalNumberOfTuningSamples = 0;

        double tunedStepSize;

        double tunedObjectiveValue;

        double totalTuningTimeTaken;


        Eigen::MatrixXd tuningData;

        Eigen::MatrixXd tuningPosterior;


        std::vector<std::vector<double>> sampleVariances;

        std::vector<std::vector<double>> intraChainExpectations;

        std::vector<double> interChainExpectation;

        unsigned long numSeen = 0;


        long dimension = 0;

        friend Eigen::VectorXd computeAcceptanceRate(Data& data);

        friend Eigen::VectorXd computeExpectedSquaredJumpDistance(Data& data);

        friend Eigen::VectorXd computeEffectiveSampleSize(Data& data);

        friend Eigen::VectorXd computePotentialScaleReductionFactor(Data& data);

        friend double computeTotalNumberOfSamples(Data& data);

        friend Eigen::VectorXd computeTotalTimeTaken(Data& data);

    };


    inline Eigen::VectorXd computeAcceptanceRate(Data& data) {

        data.computeAcceptanceRate();

        return data.acceptanceRate;

    }


    inline Eigen::VectorXd computeExpectedSquaredJumpDistance(Data& data) {

        data.computeExpectedSquaredJumpDistance();

        return data.expectedSquaredJumpDistance;

    }


    inline Eigen::VectorXd computeEffectiveSampleSize(Data& data) {

        data.computeEffectiveSampleSize();

        return data.effectiveSampleSize;

    }


    inline Eigen::VectorXd computePotentialScaleReductionFactor(Data& data) {

        data.computePotentialScaleReductionFactor();

        return data.potentialScaleReductionFactor;

    }


    inline double computeTotalNumberOfSamples(Data& data) {

        data.computeTotalNumberOfSamples();

        return data.totalNumberOfSamples;

    }


    inline Eigen::VectorXd computeTotalTimeTaken(Data& data) {

        data.computeTotalTimeTaken();

        return data.totalTimeTaken;

    }

}


#endif // HOPS_DATA_HPP