简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类。
k-近邻算法
k-近邻算法(kNN)的工作原理
实例说明:使用k-近邻算法分类爱情片和动作片
k-近邻算法的一般流程
首先,创建名为 的 Python 模块,本章使用的所有代码都在这个文件中。
在构造完整的k-近邻算法之前,我们还需要编写一些基本的通用函数,在 文件中增加下面的代码:
import numpy as np # 导入第一个模块:科学计算包NumPy
from numpy import *
import operator # 导入第二个模块:运算符模块,k-近邻算法执行排序操作时将使用这个模块提供的函数
def createDataSet(): # 为了方便使用 createDataSet() 函数,它创建数据集和标签
group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]])
labels = ['A', 'A', 'B', 'B']
return group, labels
打开 ipython 进行交互式开发环境。
进入 IPython 开发环境之后,输入下列命令导入上面编辑的程序模块:
# 这里首先要把环境切换到存放 KNN.py 处
# 由于我存放的位置为桌面,所以首先使用 cd C:\Users\fangz\Desktop
In [1]: import KNN # 导入kNN模块。
为了确保输入相同的数据集,KNN 模块中定义了函数 createDataSet,在 IPython 命令提示符下输入下列命令:
# 创建了变量 group 和 labels
In [2]: group, labels = KNN.createDataSet()
在 IPython 命令提示符下,输入变量的名字以检验是否正确地定义变量:
In [3]: group
Out[3]:
array([[ 1. , 1.1],
[ 1. , 1. ],
[ 0. , 0. ],
[ 0. , 0.1]])
I
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- nryq.cn 版权所有 赣ICP备2024042798号-6
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务