Python机器学习环境搭建
由于导师的学习小组在学习数据挖掘算法,于是开始真正看Python。不是有句话说得好:人生苦短,快学Python……好了先搁置个人觉得蛋疼无比的Py2的类,先安装上numpy、scipy、matplotlib、scikit-learn吧。
各个库简介:
- numpy:NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。它将常用的数学函数都进行数组化,使得这些数学函数能够直接对数组进行操作,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地提高了程序的运算速度。
- scipy:SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包。包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等。
- matplotlib:这是类似于Matlab的画图工具一样的一个画图的库。
- scikit-learn:开源机器学习工具,里面包含了许多机器学习算法。
我就只在Windows下面装了,就介绍下Windows下面的安装。先是各个工具的地址:
这个网站包含了很全的Py扩展,非官方:http://www.lfd.uci.edu/~gohlke/pythonlibs/
上面四个工具都可以在上面的网址下载,安装whl包方式见下。另外scipy和matplotlib可以在下面的地址下载exe的安装版:
- scipy: http://sourceforge.net/projects/scipy/files/
- matplotlib: http://sourceforge.net/projects/matplotlib/files/matplotlib/
需要注意的是scikit-learn的需求,先看其官网上介绍:
Scikit-learn requires:
- Python (>= 2.6 or >= 3.3),
- NumPy (>= 1.6.1),
- SciPy (>= 0.9).
除此之外还有一个需要注意的地方是,Scikit-learn需要的是numpy MKL版,所以这个需要在第一个地址下,如果装成exe版或者unoptimized版是安装不了Scikit-learn的。
安装whl包
whl就是是Python Wheels,是Python的扩展包标准(我觉得这个名字不错啊,就是指别人造的轮子),我们使用pip来安装whl包。
pip在Python 2.7.9 及Py2以后版本和 Python 3.4 及以后版本是默认包含的,很可惜我的事2.7.8还是需要安装……
安装pip
先获取 get-pip.py 文件。执行下面语句
1 |
python get-pip.py |
等待安装过程,完成后就可以使用了。
使用pip
下载whl文件,在windows下面执行
1 |
python -m pip install -U pip文件 |
如果是Linux 或 OS X,执行
1 |
pip install -U pip文件 |
然后继续安装完所有的工具并测试一下。