bitrl_cuberl_docs/a2c__config_8h_source.html

#ifndef A2C_CONFIG_H

#define A2C_CONFIG_H


#include "cuberl/base/cuberl_types.h"

//#include "bitrl/rlenvs_consts.h"

#include "cuberl/utils/train_enum_type.h"


#include <ostream>

#include <string>


namespace cuberl {

namespace rl {

namespace algos {


namespace pg {


//using namespace rlenvscpp::consts;


struct A2CConfig

{


    real_t gamma{0.99};


    real_t lambda{0.1};


    real_t beta{0.0};


    real_t policy_loss_weight{ 1.0};


    real_t value_loss_weight{1.0};


    bool clip_policy_grad{false};


    bool clip_critic_grad{false};


    real_t max_grad_norm_policy{1.0};


    real_t max_grad_norm_critic{1.0};


    uint_t n_episodes{100};


    uint_t max_itrs_per_episode{100};


    uint_t buffer_size{100};


    bool normalize_advantages{true};


    DeviceType device_type{DeviceType::CPU};


    std::string save_model_path{""};


    std::ostream& print(std::ostream& out)const;


    void load_from_json(const std::string& filename);

};


inline


std::ostream& operator<<(std::ostream& out, const A2CConfig& opts){

    return opts.print(out);

}


}


}

}

}


#endif

cuberl_types.h

bitrl::real_t
double real_t
real_t
Definition bitrl_types.h:23

bitrl::uint_t
std::size_t uint_t
uint_t
Definition bitrl_types.h:43

bitrl::DeviceType
DeviceType
Enumeration of various device types.
Definition bitrl_types.h:159

cuberl::rl::algos::pg::operator<<
std::ostream & operator<<(std::ostream &out, const A2CConfig &opts)
Definition a2c_config.h:115

cuberl
Various utilities used when working with RL problems.
Definition cuberl_types.h:16

cuberl::rl::algos::pg::A2CConfig
The A2CConfig struct. Configuration for A2CSolver class.
Definition a2c_config.h:22

cuberl::rl::algos::pg::A2CConfig::lambda
real_t lambda
GAE lambda.
Definition a2c_config.h:32

cuberl::rl::algos::pg::A2CConfig::save_model_path
std::string save_model_path
Definition a2c_config.h:98

cuberl::rl::algos::pg::A2CConfig::device_type
DeviceType device_type
Definition a2c_config.h:93

cuberl::rl::algos::pg::A2CConfig::beta
real_t beta
Coefficient for accounting for entropy contribution.
Definition a2c_config.h:37

cuberl::rl::algos::pg::A2CConfig::buffer_size
uint_t buffer_size
Definition a2c_config.h:83

cuberl::rl::algos::pg::A2CConfig::normalize_advantages
bool normalize_advantages
Definition a2c_config.h:88

cuberl::rl::algos::pg::A2CConfig::gamma
real_t gamma
Discount factor.
Definition a2c_config.h:27

cuberl::rl::algos::pg::A2CConfig::max_grad_norm_policy
real_t max_grad_norm_policy
The value to clip the gradient for the policy.
Definition a2c_config.h:63

cuberl::rl::algos::pg::A2CConfig::print
std::ostream & print(std::ostream &out) const
print

cuberl::rl::algos::pg::A2CConfig::clip_critic_grad
bool clip_critic_grad
Flag indicating whether to clip the critic grad.
Definition a2c_config.h:58

cuberl::rl::algos::pg::A2CConfig::clip_policy_grad
bool clip_policy_grad
Flag indicating whether to clip the policy grad.
Definition a2c_config.h:53

cuberl::rl::algos::pg::A2CConfig::value_loss_weight
real_t value_loss_weight
Definition a2c_config.h:48

cuberl::rl::algos::pg::A2CConfig::policy_loss_weight
real_t policy_loss_weight
policy_loss_weight. How much weight to give on the policy loss when forming the global loss
Definition a2c_config.h:43

cuberl::rl::algos::pg::A2CConfig::load_from_json
void load_from_json(const std::string &filename)
Load the configuration from the given json file.

cuberl::rl::algos::pg::A2CConfig::n_episodes
uint_t n_episodes
Number of training episodes.
Definition a2c_config.h:73

cuberl::rl::algos::pg::A2CConfig::max_grad_norm_critic
real_t max_grad_norm_critic
The value to clip the gradient for the actor.
Definition a2c_config.h:68

cuberl::rl::algos::pg::A2CConfig::max_itrs_per_episode
uint_t max_itrs_per_episode
Number of iterations per episode.
Definition a2c_config.h:78

train_enum_type.h