¿Que son los Árboles de Decisión?

por | 23 septiembre, 2013

El árbol de decisión es una de las técnicas de Data Mining más utilizada en todo el mundo. Se encuentra dentro de las técnicas de clasificación, sumamente útil en las áreas de negocios de las principales compañías.
Su gran utilización se debe a que es muy fácil la interpretación de los resultados obtenidos.
Otra ventaja de los árboles de decisión es que las opciones posibles de una determinada condición son excluyentes. Esto permite que luego de analizar la situación se pueda tomar una acción o decisión especifica.
Por ejemplo si deseamos tomar una decisión con respecto a otorgar un crédito o no en una institución de microfinanzas. Según el árbol debemos tomar en cuenta en primera instancia el ingreso del cliente, si el sueldo es menor a S/. 2,000 presenta un alto riesgo, por lo que la decisión será no otorgar el crédito. Si en cambio tiene ingresos mayores a S/. 5,000 y tiene una buena historia crediticia, la decisión será de otorgar el crédito.

arbol_decision

Como se puede ver la aplicación de un árbol de decisión es muy sencilla. Para cada nuevo cliente se deberá de seguir la secuencia lógica realizando las preguntas y tomando un camino según cada respuesta. De esta manera el árbol de decisión funciona como un clasificador para tomar una decisión, otorgar o no el crédito.
Este mismo árbol puede expresarse como un algoritmo de reglas que puede ser implementado en cualquier sistema de información, base de datos, data mart o data warehouse.
Por ejemplo el siguiente algoritmo refleja los resultados del árbol de decisión:

Si Ingreso < 2000 Entonces No Si Ingreso > 2000 Y Perfil Creditico = Sin Historia Entonces No
Si Ingreso > 5000 Y Perfil Creditico = Mala Entonces Si
En otro Caso No

La tarea para un profesional en analítica no solamente será el de interpretar correctamente el árbol de decisión, lo cual es sencillo, sino también el poder construirlo a partir de los datos. Para esto existen métodos y algoritmos de aprendizaje de árboles de decisión:

  • CHAID. CHi-squared Automatic Interaction Detection
  • C4.5. y C5, Etc.

¿Alguna vez has utilizado un árbol de decisión? Recomiendo llevar el curso Taller de Data Mining para profundizar este y otros temas.

  • Twitter
  • del.icio.us
  • Digg
  • Facebook
  • Technorati
  • Reddit
  • Yahoo Buzz
  • StumbleUpon

2 pensamientos en “¿Que son los Árboles de Decisión?

  1. Pingback: El Principio de Parsimonia en la Análitica | Perú Analítica

  2. Pingback: Como Netflix utiliza la Analítica | Perú Analítica

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

42 + = 46