实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

在Linux环境下从头安装tensorflow_gpu版本

本周,开始了实习,为了新的项目,让我在新的Linux环境下从头开始安装tensorflow——gpu版本。之前没有接触过,然后踩了许多坑,所以这里记录一下,同时这次安装也提高了我在使用Linux方面的熟练度,若下面的记录有问题,请及时提出,我会马上更改。

Step1. Anaconda下载及安装

1、官网下载anaconda3Linux版本

2、上传后,用bash命令安装文件

  • bash FileName

3、安装细节

  • a、在标红框处输入yes和安装目标路径

    实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

  • b、继续选择yes

    实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

  • c、等待安装完成。安装完成后,输入conda --version如果显示版本信息则安装成功。

    • 如果如下图所示无法显示

      实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

      • 输入source ~/.bashrc

        实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

Anaconda安装完成。

Step2.安装tensorflow_gpu

1、建立虚拟环境

  • conda create -n <环境名称> python=<python版本>

2、激活虚拟环境

  • conda activate <环境名称>

3、在虚拟环境中安装tensorflow-gpu版本

  • pip install tensorflow-gpu==1.15 -i http://mirrors.aliyun.com/pypi/simple/

4、查看列表是否安装成功

  • conda list
    • 实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

      • 一定是只要有tensorflow-gpu版本,若出现tensorflow-base版本记得卸载掉

TensorFlow GPU版本安装完成

Step3.安装cuda

这里的cuda指的是cudatoolkti,不是驱动,如果没有安装驱动的话,先安装一下驱动,再进行下面的操作。

1、下载cuda

  • 下载前的注意事项

    • 查找与驱动匹配的cuda版本

      • 查看驱动

        • cat /proc/driver/nvidia/version
      • 版本对应表

        • 实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本
    • 查看LInux安装的操作系统

      • 实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本
    • 查看系统的版本(以Centos为例)

      • cat /etc/redhat-release 查看CentOS版本

        • 实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本
      • cat /proc/version

        • 实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本
  • 下载地址

2、安装cuda

  • 安装指令

    • sh <cuda文件名字>
  • 安装过程

    • 实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

    • 安装界面可能不同,但是选项基本相同

      • 第一个选 accept

      • 第二个安装驱动选no

        • 因为我们之前已经安装过了驱动
      • 第三个安装Toolkit 选yes

      • 第四个选地址,默认的是/usr/local/cuda-10.0

      • 第五个都可以

      • 第六个安装sample也都可以

3、添加环境变量

  • A、打开文件

    • vim ~/.bashrc
  • B、添加环境变量,在文件的最后三行

    • export PATH="/usr/local/cuda-10.0/bin:$PATH"
    • export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH"
    • export CUDA_HOME="/usr/local/cuda-10.0"
  • C、激活一下~/.bushrc文件,使刚才的添加生效

    • source ~/.bashrc

4、验证cuda安装是否成功

  • 验证指令

    • nvcc -V
      • 注意是大V,若输出cuda的版本号、则说明安装成功。若是未出现,则是之前的某一步出现了问题,建议仔细查一遍,若是都没有只能卸载重新来过。

Step4.安装cudnn

1、下载cudnn

2、上传及解压

  • 下载的文件是.solitairetheme8 文件,所以我们先转一下,然后再解压。

    • cp <FileName>.solitairetheme8 <FileName>.tgz
    • tar -xvf <FileName>.tgz

3、复制其中文件,粘贴到刚才的cuda-10.0文件夹中。

  • cp cudnn/include/cudnn.h /usr/local/cuda-10.0/include/
  • cp cudnn/lib64/libcudnn* /usr/local/cuda-10.0/lib64
  • chmod a+r /usr/local/cuda-10.0/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*

Step5.验证安装成功

1、进入之前安装tensorflow的环境

  • conda activate <env_name>

2、进入python环境

  • python

3、验证

  • import tensorflow as tf
  • print(tf.test.is_gpu_available())
  • 最后显示True就成功了。

可能失败的原因

cuda版本问题

  • 1、cuda指的不是驱动,驱动已经是安装好的,这里cuda的下载注意两件事

    • 不要安装的版本太极限,低版本也可以使用,比如我安装的驱动为10.1,但是我cuda的版本选择是cuda-10.0也可以成功。
    • 选择cuda版本下载时要先查好自己电脑的系统版本啥的,之前已经提过了。
  • 2、安装时

    • 他说要安装驱动的时候选择no,因为我们之前已经装过了。
  • 3、添加环境变量

    • 这部分可能会出问题,要仔细,地址可能由于不完整出错,若是没成功,可以在这里多试试。

tensorflow问题

  • 这边还是建议使用pip指令安装,然后要保证conda list中只有tensorflow-gpu。

实习Learing记录(一)——在Linux环境下从头安装tensorflow_gpu版本

上一篇:VMware搭建hadoop分布式集群


下一篇:awk_shell三剑客