Scikit learn(sklearn),是机器学习领域中最经典的 python 模块之一;也是通过python实现数据处理必装的库之一。这篇笔记记录了我与python库们的安装之战,各种路径错误、报错、不兼容问题,折腾了一下午才弄好。
在安装sklearn之前,还需要安装numpy—scipy—matlotlib—scikit-learn,此外还推荐安装pandas+lightGBM的库。
GBDT和RF等都是很经典的算法,XGboost的出现替代了传统算法们,不过微软新推出的开源boosting框架传说非常的好用,所以这次笔记算是作为前提铺垫吧。
首先是
1. 安装前的配置准备
本文的库均采用pip安装,在安装前先确保你的电脑已经安装了pip和wheel(python3.x很多都打包了),如果不清楚自己电脑是否已经安装这些,在命令窗口输入“pip install wheel”,看提示即可。
出现Requirement already satified,则配置准备完成。
2. 下载Numpy—Scipy—Matlotlib—Scikit-learn库
安装的方法有很多,经过不断的尝试,给出报错率最低的方案。
首先下载与电脑匹配的库文件:Numpy Scipy Matlotlib Scikit-learn (点击字母进入下载页面)
链接中可以找到各种版本的各种库文件,不过有些下载速度非常慢,耐心等待。(PS:最好都从这个网站下载保证版本一致)
其中,cp35指python版本为python 3.5,win32/64指电脑操作系统。按照自己的情况,下载统一的库文件即可。
3. 安装这些库。
这一步要比想象中麻烦的多,为了避免路径冲突,统一将下载好的库文件移动到:C:\Windows\System32文件夹下。
并对库文件的名字进行改写: scipy-1.0.0-cp35-none-win_amd64.whl,matplotlib-2.1.1-cp35-none-win_amd64.whl等。
其中的none很重要,这是python能识别的格式。否则会出现:
这是因为下载的库文件名称一般为:numpy-1.31.0+mkl-cp35-cp35m-win64_amd64.whl
所以会出现报错:*** is not a supported wheel on this platform。
改好名字,并确定所有的库文件都已经移动到指定的位置后,打开命令窗口,输入“pip install numpy”指令,回车确认,开始安装。
安装完成后提示successfully installed即可。如果后期想查询自己电脑是否安装该库,再次输入pip install numpy即可,如:
随后按照同样的方法,依次安装:
“pip install scipy”、“pip install matplotlib”和“pip install scikit-learn”即可。
3.2 判断是否安装成功。
依次输入下列代码,如果没有报错,恭喜你可以开始用了。
>>>
import numpy as np
>>> import matplotlib.pyplot as plt
>>> import sklearn as sk
测试运行环境的爱心小程序:测试numpy和matplotlib。
来自:Windows 下 Python easy_install 的安装 - KingsLanding
import numpy as npimport matplotlib.pyplot as plt
X = np.arange(-5.0, 5.0, 0.1)
Y = np.arange(-5.0, 5.0, 0.1)
x, y = np.meshgrid(X, Y)
f = 17 * x ** 2 - 16 * np.abs(x) * y + 17 * y ** 2 - 225fig = plt.figure()
cs = plt.contour(x, y, f, 0, colors = 'r')
plt.show()
运行结果:Python环境:
VScode 环境:
4. lightGBM与pandas安装
这两个库文件的难点在于下载的地址不太好找,贴出来方便大家:
Pandas: https://pypi.python.org/pypi/pandas/#downloads
LightGBM : https://pypi.python.org/pypi/lightgbm#downloads
这两个库文件安装方法与上述完全相同,我还没开始使用所以详细的测试放在以后再写。
My Prey Is Near.
参考文章:
安装numpy+scipy+matplotlib+scikit-learn的问题