bitrl_cuberl_docs/uniform__discrete__policy_8h_source.html

#ifndef UNIFORM_DISCRETE_POLICY_H

#define UNIFORM_DISCRETE_POLICY_H


#include "cuberl/base/cuberl_types.h"


#include <vector>

#include <utility>


namespace cuberl{

namespace rl {

namespace policies {


class UniformDiscretePolicy final

{

public:


    UniformDiscretePolicy(uint_t n_states, uint_t n_actions);


    UniformDiscretePolicy(uint_t n_states, uint_t n_actions, real_t val);


    std::vector<std::pair<uint_t, real_t>> operator()(uint_t sidx)const{return (*this)[sidx];}


    std::vector<std::pair<uint_t, real_t>> operator[](uint_t sidx)const;


    void update(uint_t sidx, const std::vector<std::pair<uint_t, real_t>>& vals);


    bool equals(const UniformDiscretePolicy& other)const;


    std::vector<std::vector<std::pair<uint_t, real_t>>>& state_actions_values(){return state_actions_prob_;}


    std::pair<uint_t, uint_t> shape()const{return {n_states_, n_actions_};}


    void update(const UniformDiscretePolicy& other);


    std::ostream& print(std::ostream& out)const;


private:


    uint_t n_states_;


    uint_t n_actions_;


    real_t val_;


    std::vector<std::vector<std::pair<uint_t, real_t>>> state_actions_prob_;


    void init_();

};


inline


bool operator==(const UniformDiscretePolicy& p1, const UniformDiscretePolicy& p2){

    return p1.equals(p2);

}


inline


bool operator !=(const UniformDiscretePolicy& p1, const UniformDiscretePolicy& p2){

    return !(p1 == p2);

}


}

}

}


#endif // UNIFORM_DISCRETE_POLICY_H

cuberl::rl::policies::UniformDiscretePolicy
The UniformDiscretePolicy class.
Definition uniform_discrete_policy.h:17

cuberl::rl::policies::UniformDiscretePolicy::update
void update(uint_t sidx, const std::vector< std::pair< uint_t, real_t > > &vals)
Update the policy for state with index sidx.

cuberl::rl::policies::UniformDiscretePolicy::print
std::ostream & print(std::ostream &out) const
print

cuberl::rl::policies::UniformDiscretePolicy::UniformDiscretePolicy
UniformDiscretePolicy(uint_t n_states, uint_t n_actions)
UniformDiscretePolicy.

cuberl::rl::policies::UniformDiscretePolicy::operator[]
std::vector< std::pair< uint_t, real_t > > operator[](uint_t sidx) const
operator []

cuberl::rl::policies::UniformDiscretePolicy::UniformDiscretePolicy
UniformDiscretePolicy(uint_t n_states, uint_t n_actions, real_t val)
UniformDiscretePolicy.

cuberl::rl::policies::UniformDiscretePolicy::equals
bool equals(const UniformDiscretePolicy &other) const
equals

cuberl::rl::policies::UniformDiscretePolicy::update
void update(const UniformDiscretePolicy &other)
update

cuberl::rl::policies::UniformDiscretePolicy::shape
std::pair< uint_t, uint_t > shape() const
shape
Definition uniform_discrete_policy.h:62

cuberl::rl::policies::UniformDiscretePolicy::operator()
std::vector< std::pair< uint_t, real_t > > operator()(uint_t sidx) const
operator ()
Definition uniform_discrete_policy.h:35

cuberl::rl::policies::UniformDiscretePolicy::state_actions_values
std::vector< std::vector< std::pair< uint_t, real_t > > > & state_actions_values()
state_actions_values
Definition uniform_discrete_policy.h:56

cuberl_types.h

bitrl::real_t
double real_t
real_t
Definition bitrl_types.h:23

bitrl::uint_t
std::size_t uint_t
uint_t
Definition bitrl_types.h:43

cuberl::rl::policies::operator==
bool operator==(const UniformDiscretePolicy &p1, const UniformDiscretePolicy &p2)
Definition uniform_discrete_policy.h:106

cuberl::rl::policies::operator!=
bool operator!=(const UniformDiscretePolicy &p1, const UniformDiscretePolicy &p2)
Definition uniform_discrete_policy.h:111

cuberl
Various utilities used when working with RL problems.
Definition cuberl_types.h:16