scran_variances/fit__variance__trend_8hpp_source.html

#ifndef SCRAN_VARIANCES_FIT_VARIANCE_TREND_H

#define SCRAN_VARIANCES_FIT_VARIANCE_TREND_H


#include <algorithm>

#include <vector>

#include <array>

#include "WeightedLowess/WeightedLowess.hpp"


namespace scran_variances {


struct FitVarianceTrendOptions {

    double minimum_mean = 0.1;


    bool mean_filter = true;


    bool transform = true;


    double span = 0.3;


    bool use_minimum_width = false;


    double minimum_width = 1;


    int minimum_window_count = 200;


    int num_threads = 1;

};


template<typename Float_>


struct FitVarianceTrendWorkspace {

    WeightedLowess::SortBy sorter;


    std::vector<uint8_t> sort_workspace;


    std::vector<Float_> xbuffer, ybuffer;

};


template<typename Float_>


void fit_variance_trend(size_t n, const Float_* mean, const Float_* variance, Float_* fitted, Float_* residuals, FitVarianceTrendWorkspace<Float_>& workspace, const FitVarianceTrendOptions& options) {

    auto& xbuffer = workspace.xbuffer;

    xbuffer.resize(n);

    auto& ybuffer = workspace.ybuffer;

    ybuffer.resize(n);


    auto quad = [](Float_ x) -> Float_ {

        return x * x * x * x;

    };


    size_t counter = 0;

    Float_ min_mean = options.minimum_mean;

    for (size_t i = 0; i < n; ++i) {

        if (!options.mean_filter || mean[i] >= min_mean) {

            xbuffer[counter] = mean[i];

            if (options.transform) {

                ybuffer[counter] = std::pow(variance[i], 0.25); // Using the same quarter-root transform that limma::voom uses.

            } else {

                ybuffer[counter] = variance[i];

            }

            ++counter;

        }

    }


    if (counter < 2) {

        throw std::runtime_error("not enough observations above the minimum mean");

    }


    auto& sorter = workspace.sorter;

    sorter.set(counter, xbuffer.data());

    auto& work = workspace.sort_workspace;

    sorter.permute(std::array<Float_*, 2>{ xbuffer.data(), ybuffer.data() }, work);


    WeightedLowess::Options<Float_> smooth_opt;

    if (options.use_minimum_width) {

        smooth_opt.span = options.minimum_window_count;

        smooth_opt.span_as_proportion = false;

        smooth_opt.minimum_width = options.minimum_width;

    } else {

        smooth_opt.span = options.span;

    }

    smooth_opt.num_threads = options.num_threads;


    // Using the residual array to store the robustness weights as a placeholder;

    // we'll be overwriting this later.

    WeightedLowess::compute(counter, xbuffer.data(), ybuffer.data(), fitted, residuals, smooth_opt);


    // Determining the left edge before we unpermute.

    Float_ left_x = xbuffer[0];

    Float_ left_fitted = (options.transform ? quad(fitted[0]) : fitted[0]);


    sorter.unpermute(fitted, work);


    // Walking backwards to shift the elements back to their original position

    // (i.e., before filtering on the mean) on the same array. We need to walk

    // backwards to ensure that writing to the original position on this array

    // doesn't clobber the first 'counter' positions containing the fitted

    // values, at least not until each value is shifted to its original place.

    for (size_t i = n; i > 0; --i) {

        auto j = i - 1;

        if (!options.mean_filter || mean[j] >= min_mean) {

            --counter;

            fitted[j] = (options.transform ? quad(fitted[counter]) : fitted[counter]);

        } else {

            fitted[j] = mean[j] / left_x * left_fitted; // draw a y = x line to the origin from the left of the fitted trend.

        }

    }


    for (size_t i = 0; i < n; ++i) {

        residuals[i] = variance[i] - fitted[i];

    }

    return;

}


template<typename Float_>


struct FitVarianceTrendResults {

    FitVarianceTrendResults() {}


    FitVarianceTrendResults(size_t n) : fitted(n), residuals(n) {}

    std::vector<Float_> fitted;


    std::vector<Float_> residuals;

};


template<typename Float_>


FitVarianceTrendResults<Float_> fit_variance_trend(size_t n, const Float_* mean, const Float_* variance, const FitVarianceTrendOptions& options) {

    FitVarianceTrendResults<Float_> output(n);

    FitVarianceTrendWorkspace<Float_> work;

    fit_variance_trend(n, mean, variance, output.fitted.data(), output.residuals.data(), work, options);

    return output;

}


}


#endif

WeightedLowess.hpp

WeightedLowess::SortBy

WeightedLowess::compute
void compute(size_t num_points, const Data_ *x, const PrecomputedWindows< Data_ > &windows, const Data_ *y, Data_ *fitted, Data_ *robust_weights, const Options< Data_ > &opt)

scran_variances
Variance modelling for single-cell expression data.
Definition choose_highly_variable_genes.hpp:14

scran_variances::choose_highly_variable_genes_index
std::vector< Index_ > choose_highly_variable_genes_index(Index_ n, const Stat_ *statistic, const ChooseHighlyVariableGenesOptions &options)
Definition choose_highly_variable_genes.hpp:247

scran_variances::fit_variance_trend
void fit_variance_trend(size_t n, const Float_ *mean, const Float_ *variance, Float_ *fitted, Float_ *residuals, FitVarianceTrendWorkspace< Float_ > &workspace, const FitVarianceTrendOptions &options)
Definition fit_variance_trend.hpp:120

WeightedLowess::Options

WeightedLowess::Options::span
Data_ span

scran_variances::FitVarianceTrendOptions
Options for fit_variance_trend().
Definition fit_variance_trend.hpp:19

scran_variances::FitVarianceTrendOptions::num_threads
int num_threads
Definition fit_variance_trend.hpp:71

scran_variances::FitVarianceTrendOptions::minimum_width
double minimum_width
Definition fit_variance_trend.hpp:58

scran_variances::FitVarianceTrendOptions::use_minimum_width
bool use_minimum_width
Definition fit_variance_trend.hpp:51

scran_variances::FitVarianceTrendOptions::span
double span
Definition fit_variance_trend.hpp:43

scran_variances::FitVarianceTrendOptions::transform
bool transform
Definition fit_variance_trend.hpp:37

scran_variances::FitVarianceTrendOptions::minimum_window_count
int minimum_window_count
Definition fit_variance_trend.hpp:65

scran_variances::FitVarianceTrendOptions::mean_filter
bool mean_filter
Definition fit_variance_trend.hpp:31

scran_variances::FitVarianceTrendOptions::minimum_mean
double minimum_mean
Definition fit_variance_trend.hpp:25

scran_variances::FitVarianceTrendResults
Results of fit_variance_trend().
Definition fit_variance_trend.hpp:203

scran_variances::FitVarianceTrendResults::residuals
std::vector< Float_ > residuals
Definition fit_variance_trend.hpp:222

scran_variances::FitVarianceTrendResults::fitted
std::vector< Float_ > fitted
Definition fit_variance_trend.hpp:217

scran_variances::FitVarianceTrendWorkspace
Workspace for fit_variance_trend().
Definition fit_variance_trend.hpp:80