从 Scikit-Learn 决策树中提取决策规则
决策树是一种广泛使用的机器学习算法,通过建模决策提供见解流程作为规则的层次结构。然而,明确提取这些决策规则可能具有挑战性。本文概述了从经过训练的 Scikit-Learn 决策树中提取文本决策规则的综合方法。
用于决策规则提取的 Python 代码
以下 Python 代码片段使用Scikit-Learn 决策树的底层数据结构,用于遍历并生成人类可读的决策路径:
from sklearn.tree import _tree def tree_to_code(tree, feature_names): tree_ = tree.tree_ feature_name = [ feature_names[i] if i != _tree.TREE_UNDEFINED else "undefined!" for i in tree_.feature ] print("def tree({}):".format(", ".join(feature_names))) def recurse(node, depth): indent = " " * depth if tree_.feature[node] != _tree.TREE_UNDEFINED: name = feature_name[node] threshold = tree_.threshold[node] print("{}if {} <= {}:".format(indent, name, threshold)) recurse(tree_.children_left[node], depth + 1) print("{}else: # if {} > {}".format(indent, name, threshold)) recurse(tree_.children_right[node], depth + 1) else: print("{}return {}".format(indent, tree_.value[node])) recurse(0, 1)
创建有效的 Python 函数
此代码遍历递归树,打印出每个条件分割和阈值。结果是一个有效的 Python 函数,它有效地模拟了经过训练的决策树的决策过程。
示例输出
例如,考虑一棵树,它尝试返回其输入,一个 0 到 10 之间的数字。生成的 Python 函数如下所示:
def tree(f0): if f0 <= 6.0: if f0 <= 1.5: return [[ 0.]] else: # if f0 > 1.5 if f0 <= 4.5: if f0 <= 3.5: return [[ 3.]] else: # if f0 > 3.5 return [[ 4.]] else: # if f0 > 4.5 return [[ 5.]] else: # if f0 > 6.0 if f0 <= 8.5: if f0 <= 7.5: return [[ 7.]] else: # if f0 > 7.5 return [[ 8.]] else: # if f0 > 8.5 return [[ 9.]]
优点和注意事项
此方法提供了清晰且树的决策规则的可测试表示。但是,请注意,代码假设树中的每个节点都是二元决策节点。如果您的决策树包含非二元决策节点,您将需要相应地调整代码。
以上是如何从 Scikit-Learn 决策树中提取决策规则?的详细内容。更多信息请关注PHP中文网其他相关文章!