C4.5

C4.5 es un algoritmo usado para generar un árbol de decisión desarrollado por Ross Quinlan.

[1]​ C4.5 es una extensión del algoritmo ID3 desarrollado anteriormente por Quinlan.

Los árboles de decisión generados por C4.5 pueden ser usados para clasificación, y por esta razón, C4.5 está casi siempre referido como un clasificador estadístico.

Los datos de entrenamiento son un grupo

representan los atributos o características del ejemplo.

Los datos de entrenamiento son aumentados con un vector

representan la clase a la que pertenece cada muestra.

En cada nodo del árbol, C4.5 elige un atributo de los datos que más eficazmente dividen el conjunto de muestras en subconjuntos enriquecidos en una clase u otra.

El atributo con la mayor ganancia de información normalizada se elige como parámetro de decisión.

El algoritmo C4.5 divide recursivamente en sublistas más pequeñas.

Este algoritmo tiene unos pocos casos base.

En C4.5 se hicieron un número de mejoras a ID3.

Algunas de ellas son: Quinlan continuó con la creación del C5.0 y el See5 (C5.0 para Unix / Linux, See5 para Windows) con fines comerciales.

También se encuentra disponible una implementación del algoritmo en R

Extracto alemán del árbol de decisión C4.5.