code/craam/Action_8hpp_source.html

 #pragma once

 #include "definitions.hpp"
 #include "Transition.hpp"

 #include "cpp11-range-master/range.hpp"
 #include <utility>
 #include <vector>
 #include <limits>
 #include <cassert>
 #include <string>
 #include <numeric>
 #include <limits>
 #include <algorithm>
 #include <stdexcept>
 #include <cmath>

 namespace craam {

 using namespace std;
 using namespace util::lang;

 // **************************************************************************************
 // *** Regular action
 // **************************************************************************************

 class RegularAction{
 protected:
     Transition outcome;

 public:

     RegularAction() : outcome() {};

     RegularAction(const Transition& outcome) : outcome(outcome) {};

     vector<Transition> get_outcomes() const {return vector<Transition>{outcome};};

     const Transition& get_outcome(long outcomeid) const {assert(outcomeid == 0); return outcome;};

     Transition& get_outcome(long outcomeid) {assert(outcomeid == 0);return outcome;};

     const Transition& operator[](long outcomeid) const {return get_outcome(outcomeid);}

     Transition& operator[](long outcomeid) {return get_outcome(outcomeid);}

     const Transition& get_outcome() const {return outcome;};

     Transition& get_outcome() {return outcome;};

     Transition& create_outcome(long outcomeid){assert(outcomeid == 0);return outcome;}

     void normalize() {outcome.normalize();};

     size_t outcome_count() const {return 1;};


     void to_string(string& result) const{
         result.append("1(reg)");
     };

     bool is_nature_correct(numvec oid) const {return oid.size() == outcome.size();};

     prec_t mean_reward() const { return outcome.mean_reward();};

     prec_t mean_reward(numvec natpolicy) const { return outcome.mean_reward(natpolicy);};

     Transition mean_transition() const {return outcome;};


     Transition mean_transition(numvec natpolicy) const {
         return Transition(outcome.get_indices(),natpolicy,numvec(outcome.size(),0.0));
     };

     string to_json(long actionid = -1) const{
         string result{"{"};
         result += "\"actionid\" : ";
         result += std::to_string(actionid);
         result += ",\"transition\" : ";
         result += outcome.to_json(-1);
         result += "}";
         return result;
     }
 };


 // **************************************************************************************
 //  Outcome Management (a helper class)
 // **************************************************************************************

 class OutcomeManagement{

 protected:
     vector<Transition> outcomes;

 public:
     OutcomeManagement() : outcomes() {};

     OutcomeManagement(const vector<Transition>& outcomes) : outcomes(outcomes) {};

     virtual ~OutcomeManagement() {};

     virtual Transition& create_outcome(long outcomeid){
         if(outcomeid < 0)
             throw invalid_argument("Outcomeid must be non-negative.");

         if(outcomeid >= (long) outcomes.size())
             outcomes.resize(outcomeid + 1);

         return outcomes[outcomeid];
     }

     virtual Transition& create_outcome(){return create_outcome(outcomes.size());};

     const Transition& get_outcome(long outcomeid) const {
         assert((outcomeid >= 0l && outcomeid < (long) outcomes.size()));
         return outcomes[outcomeid];};

     Transition& get_outcome(long outcomeid) {
         assert((outcomeid >= 0l && outcomeid < (long) outcomes.size()));
         return outcomes[outcomeid];};

     const Transition& operator[](long outcomeid) const {return get_outcome(outcomeid);}

     Transition& operator[](long outcomeid) {return get_outcome(outcomeid);}

     size_t outcome_count() const {return outcomes.size();};

     size_t size() const {return outcome_count();};

     void add_outcome(long outcomeid, const Transition& t){ create_outcome(outcomeid) = t; }

     void add_outcome(const Transition& t){add_outcome(outcomes.size(), t);};

     const vector<Transition>& get_outcomes() const {return outcomes;};

     void normalize(){
         for(Transition& t : outcomes)
             t.normalize();
     }

     bool is_nature_correct(numvec oid) const
         {return (oid.size() == outcomes.size());};

     void to_string(string& result) const{
         result.append(std::to_string(get_outcomes().size()));
     }
 };


 // **************************************************************************************
 //  Weighted Outcome Action
 // **************************************************************************************


 class WeightedOutcomeAction : public OutcomeManagement{

 protected:
     numvec distribution;

 public:

     WeightedOutcomeAction()
         : OutcomeManagement(), distribution(0) {};

     WeightedOutcomeAction(const vector<Transition>& outcomes)
         : OutcomeManagement(outcomes), distribution(outcomes.size(),
             1.0 / prec_t(outcomes.size())) {};

     using OutcomeManagement::create_outcome;

     Transition& create_outcome(long outcomeid) override{
         if(outcomeid < 0)
             throw invalid_argument("Outcomeid must be non-negative.");
         // 1: compute the weight for the new outcome and old ones

         size_t newsize = outcomeid + 1; // new size of the list of outcomes
         size_t oldsize = outcomes.size(); // current size of the set
         if(newsize <= oldsize){// no need to add anything
             return outcomes[outcomeid];
         }
         // new uniform weight for each element
         prec_t newweight = 1.0/prec_t(outcomeid+1);
         // check if need to scale the existing weights
         if(oldsize > 0){
             auto weightsum = accumulate(distribution.begin(), distribution.end(), 0.0);
             // only scale when the sum is not zero
             if(weightsum > 0){
                 prec_t normal = (oldsize * newweight) / weightsum;
                 transform(distribution.begin(), distribution.end(),distribution.begin(),
                           [normal](prec_t x){return x * normal;});
             }
         }
         outcomes.resize(newsize);
         // got to resize the distribution too and assign weights that are uniform
         distribution.resize(newsize, newweight);
         return outcomes[outcomeid];
     }

     Transition& create_outcome(long outcomeid, prec_t weight){
         if(outcomeid < 0)
             throw invalid_argument("Outcomeid must be non-negative.");
         assert(weight >= 0 && weight <= 1);

         if(outcomeid >= static_cast<long>(outcomes.size())){ // needs to resize arrays
             outcomes.resize(outcomeid+1);
             distribution.resize(outcomeid+1);
         }
         set_distribution(outcomeid, weight);
         return outcomes[outcomeid];
     }

     void set_distribution(const numvec& distribution){
         if(distribution.size() != outcomes.size())
             throw invalid_argument("Invalid distribution size.");
         prec_t sum = accumulate(distribution.begin(),distribution.end(), 0.0);
         if(sum < 0.99 || sum > 1.001)
             throw invalid_argument("Distribution does not sum to 1.");
         if((*min_element(distribution.begin(),distribution.end())) < 0)
             throw invalid_argument("Distribution must be non-negative.");

         this->distribution = distribution;
     }

     void set_distribution(long outcomeid, prec_t weight){
         assert(outcomeid >= 0 && (size_t) outcomeid < outcomes.size());
         distribution[outcomeid] = weight;
     }

     const numvec& get_distribution() const {return distribution;};

     void normalize_distribution(){
         auto weightsum = accumulate(distribution.begin(), distribution.end(), 0.0);

         if(weightsum > 0.0){
             for(auto& p : distribution)
                 p /= weightsum;
         }else{
             throw invalid_argument("Distribution sums to 0 and cannot be normalized.");
         }
     }

     bool is_distribution_normalized() const{
         return abs(1.0-accumulate(distribution.begin(), distribution.end(), 0.0)) < SOLPREC;
     }

     void uniform_distribution(){
         distribution.clear();
         if(outcomes.size() > 0)
             distribution.resize(outcomes.size(), 1.0/ (prec_t) outcomes.size());
     }

     void to_string(string& result) const {
         result.append(std::to_string(get_outcomes().size()));
         result.append(" / ");
         result.append(std::to_string(get_distribution().size()));
     }

     prec_t mean_reward(const numvec& outcomedist) const{
         assert(outcomedist.size() == outcomes.size());
         prec_t result = 0;
         for(size_t i = 0; i < outcomes.size(); i++){
             result += outcomedist[i] * outcomes[i].mean_reward();
         }
         return result;
     }

     prec_t mean_reward() const {
         return mean_reward(distribution);
     }

     Transition mean_transition(const numvec& outcomedist) const{
         assert(outcomedist.size() == outcomes.size());
         Transition result;
         for(size_t i = 0; i < outcomes.size(); i++)
             outcomes[i].probabilities_addto(outcomedist[i], result);
         return result;
     }

     Transition mean_transition() const{
         return mean_transition(distribution);
     }
     string to_json(long actionid = -1) const{
         string result{"{"};
         result += "\"actionid\" : ";
         result += std::to_string(actionid);
         result += ",\"outcomes\" : [";
         for(auto oi : indices(outcomes)){
             const auto& o = outcomes[oi];
             result +=o.to_json(oi);
             result +=",";
         }
         if(!outcomes.empty()) result.pop_back(); // remove last comma
         result += "],\"distribution\" : [";
         for(auto d : distribution){
             result += std::to_string(d);
             result += ",";
         }
         if(!distribution.empty()) result.pop_back(); // remove last comma
         result += "]}";
         return result;
     }
 };

 }


craam::RegularAction::get_outcome
const Transition & get_outcome() const
Returns the single outcome.
Definition: Action.hpp:60

craam::OutcomeManagement::is_nature_correct
bool is_nature_correct(numvec oid) const
Whether the provided outcomeid is correct.
Definition: Action.hpp:206

craam::OutcomeManagement::create_outcome
virtual Transition & create_outcome()
Creates a new outcome at the end.
Definition: Action.hpp:163

craam::WeightedOutcomeAction::to_json
string to_json(long actionid=-1) const
Returns a json representation of action.
Definition: Action.hpp:433

craam::RegularAction::mean_reward
prec_t mean_reward() const
Returns the mean reward from the transition.
Definition: Action.hpp:88

craam::OutcomeManagement::operator[]
Transition & operator[](long outcomeid)
Returns a transition for the outcome.
Definition: Action.hpp:179

craam::RegularAction::operator[]
Transition & operator[](long outcomeid)
Returns the outcome.
Definition: Action.hpp:57

craam::RegularAction::create_outcome
Transition & create_outcome(long outcomeid)
Adds a sufficient number of empty outcomes for the outcomeid to be a correct identifier.
Definition: Action.hpp:69

craam::OutcomeManagement::add_outcome
void add_outcome(const Transition &t)
Adds an outcome defined by the transition as the last outcome.
Definition: Action.hpp:194

craam::WeightedOutcomeAction::is_distribution_normalized
bool is_distribution_normalized() const
Checks whether the outcome distribution is normalized.
Definition: Action.hpp:382

craam::RegularAction::is_nature_correct
bool is_nature_correct(numvec oid) const
Whether the provided outcome is valid.
Definition: Action.hpp:85

craam::RegularAction::to_json
string to_json(long actionid=-1) const
Returns a json representation of the action.
Definition: Action.hpp:109

craam::WeightedOutcomeAction::get_distribution
const numvec & get_distribution() const
Returns the baseline distribution over outcomes.
Definition: Action.hpp:361

craam::RegularAction::RegularAction
RegularAction()
Creates an empty action.
Definition: Action.hpp:39

craam::OutcomeManagement::get_outcomes
const vector< Transition > & get_outcomes() const
Returns the list of outcomes.
Definition: Action.hpp:197

craam::OutcomeManagement::size
size_t size() const
Returns number of outcomes.
Definition: Action.hpp:185

craam::WeightedOutcomeAction::set_distribution
void set_distribution(const numvec &distribution)
Sets the base distribution over the outcomes.
Definition: Action.hpp:335

craam::RegularAction::mean_reward
prec_t mean_reward(numvec natpolicy) const
Returns the mean reward from the transition.
Definition: Action.hpp:94

craam::OutcomeManagement::normalize
void normalize()
Normalizes transitions for outcomes.
Definition: Action.hpp:200

craam::WeightedOutcomeAction::mean_transition
Transition mean_transition(const numvec &outcomedist) const
Returns the mean transition probabilities for the provided nature action.
Definition: Action.hpp:419

craam::RegularAction::get_outcome
Transition & get_outcome(long outcomeid)
Returns the single outcome.
Definition: Action.hpp:51

craam::Transition::get_indices
const indvec & get_indices() const
Indices with positive probabilities.
Definition: Transition.hpp:323

craam::OutcomeManagement::get_outcome
const Transition & get_outcome(long outcomeid) const
Returns a transition for the outcome.
Definition: Action.hpp:166

craam::WeightedOutcomeAction::create_outcome
Transition & create_outcome(long outcomeid) override
Adds a sufficient number (or 0) of empty outcomes/transitions for the provided outcomeid to be a vali...
Definition: Action.hpp:272

std

craam::OutcomeManagement::~OutcomeManagement
virtual ~OutcomeManagement()
Empty virtual destructor.
Definition: Action.hpp:142

lang

craam::prec_t
double prec_t
Default precision used throughout the code.
Definition: definitions.hpp:25

craam::WeightedOutcomeAction
An action in a robust MDP that allows for outcomes chosen by nature.
Definition: Action.hpp:230

craam::numvec
vector< prec_t > numvec
Default numerical vector.
Definition: definitions.hpp:28

craam::WeightedOutcomeAction::normalize_distribution
void normalize_distribution()
Normalizes outcome weights to sum to one.
Definition: Action.hpp:368

craam::OutcomeManagement::outcomes
vector< Transition > outcomes
List of possible outcomes.
Definition: Action.hpp:132

craam::OutcomeManagement::add_outcome
void add_outcome(long outcomeid, const Transition &t)
Adds an outcome defined by the transition.
Definition: Action.hpp:190

craam::Transition::to_json
string to_json(long outcomeid=-1) const
Returns a json representation of transition probabilities.
Definition: Transition.hpp:350

craam::OutcomeManagement::outcome_count
size_t outcome_count() const
Returns number of outcomes.
Definition: Action.hpp:182

craam::OutcomeManagement::to_string
void to_string(string &result) const
Appends a string representation to the argument.
Definition: Action.hpp:210

craam::RegularAction::get_outcome
Transition & get_outcome()
Returns the single outcome.
Definition: Action.hpp:63

craam::WeightedOutcomeAction::to_string
void to_string(string &result) const
Appends a string representation to the argument.
Definition: Action.hpp:397

craam::RegularAction::normalize
void normalize()
Normalizes transition probabilities.
Definition: Action.hpp:72

craam::RegularAction::operator[]
const Transition & operator[](long outcomeid) const
Returns the outcome.
Definition: Action.hpp:54

craam::Transition::size
size_t size() const
Returns the number of target states with non-zero transition probabilities.
Definition: Transition.hpp:249

craam::RegularAction::mean_transition
Transition mean_transition(numvec natpolicy) const
Returns the mean transition probabilities.
Definition: Action.hpp:103

craam::Transition
Represents sparse transition probabilities and rewards from a single state.
Definition: Transition.hpp:31

craam::RegularAction::mean_transition
Transition mean_transition() const
Returns the mean transition probabilities.
Definition: Action.hpp:97

craam::SOLPREC
constexpr prec_t SOLPREC
Default solution precision.
Definition: definitions.hpp:40

craam::RegularAction::get_outcome
const Transition & get_outcome(long outcomeid) const
Returns the single outcome.
Definition: Action.hpp:48

craam::RegularAction::to_string
void to_string(string &result) const
Appends a string representation to the argument.
Definition: Action.hpp:79

craam::WeightedOutcomeAction::create_outcome
Transition & create_outcome(long outcomeid, prec_t weight)
Adds a sufficient number of empty outcomes/transitions for the provided outcomeid to be a valid ident...
Definition: Action.hpp:315

craam::WeightedOutcomeAction::set_distribution
void set_distribution(long outcomeid, prec_t weight)
Sets weight for a particular outcome.
Definition: Action.hpp:355

craam::WeightedOutcomeAction::distribution
numvec distribution
Weights used in computing the worst/best case.
Definition: Action.hpp:234

craam::RegularAction
Action in a regular MDP.
Definition: Action.hpp:31

craam::OutcomeManagement::operator[]
const Transition & operator[](long outcomeid) const
Returns a transition for the outcome.
Definition: Action.hpp:176

craam::OutcomeManagement::OutcomeManagement
OutcomeManagement()
Empty list of outcomes.
Definition: Action.hpp:136

craam::RegularAction::outcome_count
size_t outcome_count() const
Returns number of outcomes (1).
Definition: Action.hpp:75

craam::WeightedOutcomeAction::uniform_distribution
void uniform_distribution()
Sets an initial uniform value for the distribution.
Definition: Action.hpp:390

craam::RegularAction::outcome
Transition outcome
Transition probabilities.
Definition: Action.hpp:34

craam::WeightedOutcomeAction::WeightedOutcomeAction
WeightedOutcomeAction(const vector< Transition > &outcomes)
Initializes outcomes to the provided vector.
Definition: Action.hpp:243

craam::RegularAction::get_outcomes
vector< Transition > get_outcomes() const
Returns the outcomes.
Definition: Action.hpp:45

craam::OutcomeManagement
A class that manages creation and access to outcomes to be used by actions.
Definition: Action.hpp:128

craam::WeightedOutcomeAction::mean_reward
prec_t mean_reward() const
Returns the mean reward from the transition using the nominal distribution on outcomes.
Definition: Action.hpp:414

craam::Transition::normalize
void normalize()
Normalizes the transition probabilities to sum to 1.
Definition: Transition.hpp:171

craam::OutcomeManagement::get_outcome
Transition & get_outcome(long outcomeid)
Returns a transition for the outcome.
Definition: Action.hpp:171

craam::WeightedOutcomeAction::mean_reward
prec_t mean_reward(const numvec &outcomedist) const
Returns the mean reward from the transition for the provided nature action.
Definition: Action.hpp:404

craam::OutcomeManagement::OutcomeManagement
OutcomeManagement(const vector< Transition > &outcomes)
Initializes with a list of outcomes.
Definition: Action.hpp:139

craam::WeightedOutcomeAction::mean_transition
Transition mean_transition() const
Returns the mean transition probabilities using the nominal distribution on outcomes.
Definition: Action.hpp:428

craam::OutcomeManagement::create_outcome
virtual Transition & create_outcome(long outcomeid)
Adds a sufficient number of empty outcomes for the outcomeid to be a valid identifier.
Definition: Action.hpp:150

craam
Main namespace which includes modeling a solving functionality.
Definition: Action.hpp:18

craam::RegularAction::RegularAction
RegularAction(const Transition &outcome)
Initializes outcomes to the provided transition vector.
Definition: Action.hpp:42

craam::WeightedOutcomeAction::WeightedOutcomeAction
WeightedOutcomeAction()
Creates an empty action.
Definition: Action.hpp:239

craam::Transition::mean_reward
prec_t mean_reward(const numvec &probabilities) const
Computes the mean return from this transition with custom transition probabilities.
Definition: Transition.hpp:234