Вопрос реализации дерева решений C++: Think In Code

Я занимаюсь кодированием уже несколько лет, но до сих пор не освоил псевдокодирование и не додумывал что-то в коде. Из-за этой проблемы у меня возникли проблемы с выяснением того, что именно нужно делать при создании обучающего дерева решений.

Вот несколько сайтов, которые я просматривал, и поверьте мне, их было гораздо больше

Учебники по дереву решений

Учебники по DMS

Наряду с несколькими книгами, такими как «ИИ для игр» Яна Миллингтона, которая включает в себя приличное изложение различных алгоритмов обучения, используемых в деревьях решений, и «Поведенческая математика для программирования игр», которая в основном посвящена деревьям решений и теории. Я понимаю концепции дерева решений вместе с энтропией, ID3 и немного о том, как переплести генетический алгоритм, чтобы дерево решений определяло узлы для ГА. Они дают хорошее представление, но не то, что я действительно ищу.

У меня есть некоторый базовый код, который создает узлы для дерева решений, и я считаю, что знаю, как реализовать настоящую логику, но это бесполезно, если у меня нет цели для программы или у меня нет энтропии или алгоритма обучения.

Я спрашиваю, может ли кто-нибудь помочь мне понять, что мне нужно сделать, чтобы создать это дерево решений обучения. У меня есть свои узлы в классе собственных функций, протекающих через функции для создания дерева, но как бы я вложил в это энтропию и должен ли он иметь класс, структуру, я не уверен, как это собрать. Псевдокод и представление о том, куда я клоню со всей этой теорией и цифрами. Я мог бы собрать код, если бы только знал, что мне нужно кодировать. Любое руководство будет оценено.

Как бы я поступил об этом, в основном.

Добавление алгоритма обучения, такого как ID3 и Entropy. Как это должно быть установлено?

Как только я выясню, как это сделать, я планирую реализовать это в машине состояний, которая проходит через различные состояния в формате игры/симуляции. Все это уже настроено, я просто полагаю, что это может быть автономным, и как только я это выясню, я могу просто перенести его в другой проект.

Вот исходный код, который у меня есть на данный момент.

Заранее спасибо!

Main.cpp:

int main()
{
    //create the new decision tree object
    DecisionTree* NewTree = new DecisionTree();

    //add root node   the very first 'Question' or decision to be made
    //is monster health greater than player health?
    NewTree->CreateRootNode(1);

    //add nodes depending on decisions
    //2nd decision to be made
    //is monster strength greater than player strength?
    NewTree->AddNode1(1, 2);

    //3rd decision
    //is the monster closer than home base?
    NewTree->AddNode2(1, 3);

    //depending on the weights of all three decisions, will return certain node result
    //results!
    //Run, Attack, 
    NewTree->AddNode1(2, 4);
    NewTree->AddNode2(2, 5);
    NewTree->AddNode1(3, 6);
    NewTree->AddNode2(3, 7);

    //Others: Run to Base ++ Strength, Surrender Monster/Player, 
    //needs to be made recursive, that way when strength++ it affects decisions second time around DT

    //display information after creating all the nodes
    //display the entire tree, i want to make it look like the actual diagram!
    NewTree->Output();

    //ask/answer question decision making process
    NewTree->Query();

    cout << "Decision Made. Press Any Key To Quit." << endl;

    //pause quit, oh wait how did you do that again...look it up and put here

    //release memory!
    delete NewTree;

    //return random value
    //return 1;
}

Дерево решений.h:

//the decision tree class
class DecisionTree
{
public:
    //functions
    void RemoveNode(TreeNodes* node);
    void DisplayTree(TreeNodes* CurrentNode);
    void Output();
    void Query();
    void QueryTree(TreeNodes* rootNode);
    void AddNode1(int ExistingNodeID, int NewNodeID);
    void AddNode2(int ExistingNodeID, int NewNodeID);
    void CreateRootNode(int NodeID);
    void MakeDecision(TreeNodes* node);

    bool SearchAddNode1(TreeNodes* CurrentNode, int ExistingNodeID, int NewNodeID);
    bool SearchAddNode2(TreeNodes* CurrentNode, int ExistingNodeID, int NewNodeID);

    TreeNodes* m_RootNode;

    DecisionTree();

    virtual ~DecisionTree();
};

Decisions.cpp:

int random(int upperLimit);

//for random variables that will effect decisions/node values/weights
int random(int upperLimit)
{
    int randNum = rand() % upperLimit;
    return randNum;
}

//constructor
//Step 1!
DecisionTree::DecisionTree()
{
    //set root node to null on tree creation
    //beginning of tree creation
    m_RootNode = NULL;
}

//destructor
//Final Step in a sense
DecisionTree::~DecisionTree()
{
    RemoveNode(m_RootNode);
}

//Step 2!
void DecisionTree::CreateRootNode(int NodeID)
{
    //create root node with specific ID
    // In MO, you may want to use thestatic creation of IDs like with entities. depends on how many nodes you plan to have
    //or have instantaneously created nodes/changing nodes
    m_RootNode = new TreeNodes(NodeID);
}

//Step 5.1!~
void DecisionTree::AddNode1(int ExistingNodeID, int NewNodeID)
{
    //check to make sure you have a root node. can't add another node without a root node
    if(m_RootNode == NULL)
    {
        cout << "ERROR - No Root Node";
        return;
    }

    if(SearchAddNode1(m_RootNode, ExistingNodeID, NewNodeID))
    {
        cout << "Added Node Type1 With ID " << NewNodeID << " onto Branch Level " << ExistingNodeID << endl;
    }
    else
    {
        //check
        cout << "Node: " << ExistingNodeID << " Not Found.";
    }
}

//Step 6.1!~ search and add new node to current node
bool DecisionTree::SearchAddNode1(TreeNodes *CurrentNode, int ExistingNodeID, int NewNodeID)
{
    //if there is a node
    if(CurrentNode->m_NodeID == ExistingNodeID)
    {
        //create the node
        if(CurrentNode->NewBranch1 == NULL)
        {
            CurrentNode->NewBranch1 = new TreeNodes(NewNodeID);
        }
        else 
        {
            CurrentNode->NewBranch1 = new TreeNodes(NewNodeID);
        }
        return true;
    }
    else
    {
        //try branch if it exists
        //for a third, add another one of these too!
        if(CurrentNode->NewBranch1 != NULL)
        {
            if(SearchAddNode1(CurrentNode->NewBranch1, ExistingNodeID, NewNodeID))
            {
                return true;
            }
            else
            {
                //try second branch if it exists
                if(CurrentNode->NewBranch2 != NULL)
                {
                    return(SearchAddNode2(CurrentNode->NewBranch2, ExistingNodeID, NewNodeID));
                }
                else
                {
                    return false;
                }
            }
        }
        return false;
    }
}

//Step 5.2!~    does same thing as node 1.  if you wanted to have more decisions, 
//create a node 3 which would be the same as this maybe with small differences
void DecisionTree::AddNode2(int ExistingNodeID, int NewNodeID)
{
    if(m_RootNode == NULL)
    {
        cout << "ERROR - No Root Node";
    }

    if(SearchAddNode2(m_RootNode, ExistingNodeID, NewNodeID))
    {
        cout << "Added Node Type2 With ID " << NewNodeID << " onto Branch Level " << ExistingNodeID << endl;
    }
    else
    {
        cout << "Node: " << ExistingNodeID << " Not Found.";
    }
}

//Step 6.2!~ search and add new node to current node
//as stated earlier, make one for 3rd node if there was meant to be one
bool DecisionTree::SearchAddNode2(TreeNodes *CurrentNode, int ExistingNodeID, int NewNodeID)
{
    if(CurrentNode->m_NodeID == ExistingNodeID)
    {
        //create the node
        if(CurrentNode->NewBranch2 == NULL)
        {
            CurrentNode->NewBranch2 = new TreeNodes(NewNodeID);
        }
        else 
        {
            CurrentNode->NewBranch2 = new TreeNodes(NewNodeID);
        }
        return true;
    }
    else
    {
        //try branch if it exists
        if(CurrentNode->NewBranch1 != NULL)
        {
            if(SearchAddNode2(CurrentNode->NewBranch1, ExistingNodeID, NewNodeID))
            {
                return true;
            }
            else
            {
                //try second branch if it exists
                if(CurrentNode->NewBranch2 != NULL)
                {
                    return(SearchAddNode2(CurrentNode->NewBranch2, ExistingNodeID, NewNodeID));
                }
                else
                {
                    return false;
                }
            }
        }
        return false;
    }
}

//Step 11
void DecisionTree::QueryTree(TreeNodes* CurrentNode)
{
    if(CurrentNode->NewBranch1 == NULL)
    {
        //if both branches are null, tree is at a decision outcome state
        if(CurrentNode->NewBranch2 == NULL)
        {
            //output decision 'question'
            ///////////////////////////////////////////////////////////////////////////////////////
        }
        else
        {
            cout << "Missing Branch 1";
        }
        return;
    }
    if(CurrentNode->NewBranch2 == NULL)
    {
        cout << "Missing Branch 2";
        return;
    }

    //otherwise test decisions at current node
    MakeDecision(CurrentNode);
}

//Step 10
void DecisionTree::Query()
{
    QueryTree(m_RootNode);
}

////////////////////////////////////////////////////////////
//debate decisions   create new function for decision logic

// cout << node->stringforquestion;

//Step 12
void DecisionTree::MakeDecision(TreeNodes *node)
{
    //should I declare variables here or inside of decisions.h
    int PHealth;
    int MHealth;
    int PStrength;
    int MStrength;
    int DistanceFBase;
    int DistanceFMonster;

    ////sets random!
    srand(time(NULL));

    //randomly create the numbers for health, strength and distance for each variable
    PHealth = random(60);
    MHealth = random(60);
    PStrength = random(50);
    MStrength = random(50);
    DistanceFBase = random(75);
    DistanceFMonster = random(75);

    //the decision to be made string example: Player health: Monster Health:  player health is lower/higher
    cout << "Player Health: " << PHealth << endl;
    cout << "Monster Health: " << MHealth << endl;
    cout << "Player Strength: " << PStrength << endl;
    cout << "Monster Strength: " << MStrength << endl;
    cout << "Distance Player is From Base: " << DistanceFBase << endl;
    cout << "Disntace Player is From Monster: " << DistanceFMonster << endl;

    //MH > PH
    //MH < PH
    //PS > MS
    //PS > MS
    //DB > DM
    //DB < DM

    //good place to break off into different decision nodes, not just 'binary'

    //if statement lower/higher query respective branch
    if(PHealth > MHealth)
    {
    }
    else
    {
    }
    //re-do question for next branch. Player strength: Monster strength: Player strength is lower/higher
    //if statement lower/higher query respective branch
    if(PStrength > MStrength)
    {
    }
    else
    {
    }

    //recursive question for next branch. Player distance from base/monster. 
    if(DistanceFBase > DistanceFMonster)
    {
    }
    else
    {
    }
    //DECISION WOULD BE MADE
    //if statement?
    // inside query output decision?
    //cout <<  << 

        //QueryTree(node->NewBranch2);

        //MakeDecision(node);
}

//Step.....8ish?
void DecisionTree::Output()
{
    //take repsective node
    DisplayTree(m_RootNode);
}

//Step 9
void DecisionTree::DisplayTree(TreeNodes* CurrentNode)
{
    //if it doesn't exist, don't display of course
    if(CurrentNode == NULL)
    {
        return;
    }

    //////////////////////////////////////////////////////////////////////////////////////////////////
    //need to make a string to display for each branch
    cout << "Node ID " << CurrentNode->m_NodeID << "Decision Display: " << endl;

    //go down branch 1
    DisplayTree(CurrentNode->NewBranch1);

    //go down branch 2
    DisplayTree(CurrentNode->NewBranch2);
}

//Final step at least in this case. A way to Delete node from tree. Can't think of a way to use it yet but i know it's needed
void DecisionTree::RemoveNode(TreeNodes *node)
{
    //could probably even make it to where you delete a specific node by using it's ID
    if(node != NULL)
    {
        if(node->NewBranch1 != NULL)
        {
            RemoveNode(node->NewBranch1);
        }

        if(node->NewBranch2 != NULL)
        {
            RemoveNode(node->NewBranch2);
        }

        cout << "Deleting Node" << node->m_NodeID << endl;

        //delete node from memory
        delete node;
        //reset node
        node = NULL;
    }
}

TreeNodes.h:

using namespace std;
//tree node class
class TreeNodes
{
public:
    //tree node functions
    TreeNodes(int nodeID/*, string QA*/);
    TreeNodes();

    virtual ~TreeNodes();

    int m_NodeID;

    TreeNodes* NewBranch1;
    TreeNodes* NewBranch2;
};

TreeNodes.cpp:

//contrctor
TreeNodes::TreeNodes()
{
    NewBranch1 = NULL;
    NewBranch2 = NULL;

    m_NodeID = 0;
}

//deconstructor
TreeNodes::~TreeNodes()
{ }

//Step 3! Also step 7 hah!
TreeNodes::TreeNodes(int nodeID/*, string NQA*/)
{
    //create tree node with a specific node ID
    m_NodeID = nodeID;

    //reset nodes/make sure! that they are null. I wont have any funny business #s -_-
    NewBranch1 = NULL;
    NewBranch2 = NULL;
}

person CodingImagination    schedule 13.04.2011    source источник
comment
Хороший вопрос, поэтому я проголосовал. В зависимости от того, чего вы пытаетесь достичь, библиотека, такая как castor, которая позволяет вам реализовать некоторые вещи парадигмы логического программирования на С++, может представлять интерес. mpprogramming.com/cpp   -  person shuttle87    schedule 13.04.2011
comment
Боже мой, это слишком много кода, чтобы ожидать, что случайные добровольцы прочитают его...   -  person ildjarn    schedule 13.04.2011
comment
Да, но это показывает, что я в каком-то смысле знаю, что делаю. Многие из вопросов, которые я рассматривал, не имели достаточных оснований или не показывали, что они действительно работают. Я работал! хаха. Я не ожидаю, что многие будут проходить через каждую мелочь, просто чтобы понять, что происходит.   -  person CodingImagination    schedule 13.04.2011
comment
И это не выглядит таким уж большим в программе, ха!   -  person CodingImagination    schedule 13.04.2011
comment
Я не понимаю, как вы создаете код узла в searchAddNode. Он делает то же самое независимо от if..   -  person Jonas Bötel    schedule 13.04.2011
comment
@CodingImagination: C++ - это не Java, вам не нужно new все (например, нет необходимости new NewTree в main), просто не используйте указатель для начала.   -  person Matthieu M.    schedule 13.04.2011
comment
Мое предложение: напишите несколько тестов (входные данные и ожидаемые результаты дерева решений) и вернитесь, когда вы обнаружите, что все ваши усилия дают неправильный результат. В противном случае лучшее, что исходит от этого вопроса, это эталонная реализация.   -  person Andres Jaan Tack    schedule 13.04.2011


Ответы (3)


Пожалуйста, поправьте меня, если я ошибаюсь, но судя по изображениям на http://dms.irb.hr/tutorial/tut_dtrees.php и http://www.decisiontrees.net/?q=node/21 фактическая логика принятия решения должна идти в узлах, а не в дереве. Вы можете смоделировать это, имея полиморфные узлы, по одному для каждого решения, которое необходимо принять. С небольшими изменениями в структуре дерева и незначительными незначительными изменениями для делегирования решений ваш код должен быть в порядке.

person Jonas Bötel    schedule 13.04.2011

По сути, вам нужно разбить все на этапы, а затем разбить на модули каждую часть алгоритма, который вы пытаетесь реализовать.

Вы можете сделать это в псевдокоде или в самом коде, используя функции/классы и заглушки.

Каждую часть алгоритма вы затем можете закодировать в какой-то функции и даже протестировать эту функцию, прежде чем складывать все вместе. В основном вы получите различные функции или классы, которые используются для определенных целей в реализации алгоритма. Таким образом, в вашем случае для построения дерева у вас будет одна функция, которая вычисляет энтропию в узле, другая, которая разбивает данные на подмножества в каждом узле и т. д.

Я говорю здесь в общем случае, а не конкретно в отношении построения дерева решений. Прочтите книгу Митчелла по машинному обучению, если вам нужна конкретная информация об алгоритмах дерева решений и необходимых шагах.

person indigo    schedule 18.05.2012

Псевдокод для реализации дерева решений выглядит следующим образом.

createdecisiontree(data, attributes)

Select the attribute a with the highest information gain

for each value v of the attribute a

    Create subset of data where data.a.val==v ( call it data2)

    Remove the attribute a from the attribute list resulting in attribute_list2

    Call CreateDecisionTree(data2, attribute_list2)

Вам нужно будет хранить узлы на каждом уровне с помощью некоторого кода, например

дерево решений[attr][val]=new_node

person MARK    schedule 26.01.2014