Tensorflow配置GPU

GPU版本搭建教程

Tensorflow配置GPU

个人感觉最难安装的开发环境,没有之一。

安装tensorflow-GPU之前,首先需要知道自己电脑配置。我的电脑配置为R5 3600+2060s,可以去某些网站查看自己的PC能否支持。

安装版本列表:Win10+Anaconda+CUDA10.2+cuDNN7.6.5+RTX2060S+Tensorflow1.14

首先,在安装之前需要查看显卡所能支持的最高CUDA版本,打开【NVIDIA控制面板】,选择左下角的【系统信息】选项,并点击【组件】

问题

安装过程中出现了以下问题

  1. 版本不对
  2. 网络超时
  3. CUDnn需要注册账号下载
  4. DLL问题

准备

需要安装的软件如下包括

  • Anaconda
  • CUDA
  • CUDnn

Anaconda

首先下载Anaconda,去官网就可以下载但是速度会慢。这里可以去清华源下载。

安装一路next,在环境变量那里记得勾选。

CUDA

进入CUDA官网下载: Link。直接下载exe文件,然后双击运行,跟随向导安装,安装我选的精简。

下载的有两个版本network和local,前一个是需要的时候再下载相关,后面一个就是完整版,建议下载完整版。

安装完成后打开cmd,输入nvcc -V可以查看版本。没有保存证明安装成功

版本:通常这个链接地址给的都是CUDA的最新版本,我现在这个时间最新版本是10.2,需要其他版本可以点击。

CUDnn

CUDA相当于显卡的一个驱动,CUDnn就相当于补丁。下载时候需要注意对应的版本问题,不然会出现异常。

同时下载CUDnn需要注册英伟达developer的账号,因为网络原因,可能无法注册,这个时候可以去CSDN这样的论坛查一下资源。我下载使用的版本是7.6.5,对应的是CUDA10.2的版本。

下载的CUDnn是一个zip压缩包,解压之后将里面的bin,include和lib拷贝到CUDA的安装目录下。

注意的是一定要和CUDA的版本对应

Tensorflow安装

打开Anaconda Prompt,新建虚拟环境,新建完成后切换进入环境。

1
2
conda create -n tensoflow-gpu python=3.7.4
activate tensorflow_gpu

在新环境使用conda安装Tensorflow(这里要说一下最好不要使用pip,因为pip可能会出现版本不匹配的问题,而且安装Tensorflow最好指明版本,不然也会出现不匹配)。

安装完之后补齐该虚拟环境缺失的其他库。

1
2
conda install tensorflow-gpu==1.14.0
conda install anaconda

安装完成后,进入jupyter出现下面结果证明安装成功。

问题说明

版本不对

安装之前可以参考一下别人的安装版本配置。我这里列举了一些别人的版本配置。都是windows10系统。

CUDA CUDnn Tensorflow python
10.2 7.6.5 1.14 3.7.4
10.1 - - 3.6
10.2 - 1.14 3.6
10.0 7.0 2.0.0-beta0 -

需要注意的是,版本尽量多试几次看看容错,不行就换。

网络超时

网络问题出现在两个地方,第一个就是CUDnn下载的部分,官方的下载链接需要注册账号,但是著猜测账号的系统可能崩掉了,解决方法是去论坛找资源下载。

第二个就是Anaconda在安装新环境以及下载包的地方容易出现HTTP错误或者timeout,可以使用更换清华源加速下载。要是清华源也有下载问题,可以试试更换源列表再试试。

这里是最需要耗时的地方很容易耗费耐心。

DLL问题

在安装完成之后,当我们进入python,在import tensorflow很可能会出现DLL问题,这说明版本没有匹配上,需要更换tensorflow版本重新安装,用conda先卸载当前版本,再重新安装指定版本即可解决。

参考链接

https://blog.csdn.net/DavidKabuda/article/details/103884597

https://blog.csdn.net/abbott_zb/article/details/103361220

https://blog.csdn.net/fangsfdavid/article/details/93665654