Ubuntu16.04 配置GPU 深度學習環境

NO IMAGE

本文主要記錄如何在 Google 雲伺服器上配置遠端深度學習環境,對於單機同樣也適用。 

本文翻譯自: TensorFlow_GPU ubuntu16.04

伺服器環境:

系統環境:  Ubuntu 16.04

硬體環境:  Intel(R) Xeon(R) CPU @ 2.30GHz   記憶體 : 16G  GPU: Tesla K80

安裝完後具備的環境: 

1. Ubuntu 16.04 

2. cuda 9.0 驅動

3. miniconda 環境 (python 3.6) 

4. Tensorflow_gpu 版本 

Step 0 :  在開始之前需要關閉 NVIDIA 驅動 nouveau 

Method 1: 

SSH 連線到伺服器後,建立檔案:

 vi /etc/modprobe.d/nouveau 

在建立的檔案中鍵入:

blacklist nouveau
options nouveau modeset=0

之後 重啟系統 reboot 

系統啟動後,確認 nouveau 已經關閉 (當輸入以下命令後,沒有任何反應,則表示已經關閉該驅動): 

lsmod | grep nouveau

Method 2:

在命令列中輸入以下命令刪除原生NVIDIA 驅動: 

sudo apt-get purge nvidia*  
sudo reboot   

Step 1   安裝 Cuda 9.0

     1)進行系統升級: 

sudo apt-get update

    2)安裝相關依賴包

sudo apt-get install openjdk-8-jdk git python-dev python3-dev python-numpy python3-numpy build-essential python-pip python3-pip python-virtualenv swig python-wheel libcurl3-dev curl   

    3)安裝NVIDIA 驅動 

     3.1 下載驅動: 

curl -O http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb

    3.2 下載安裝 key:

sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub

    3.3 安裝下載的deb包:

sudo dpkg -i ./cuda-repo-ubuntu1604_9.0.176-1_amd64.deb

    3.4  採用 apt 方式安裝cuda 9.0:

sudo apt-get update
sudo apt-get install cuda-9-0 

    3.5 安裝完成後重啟系統:

reboot

    3.6 檢測NVIDIA 顯示卡驅動是否安裝:  如果安裝完成,則會看到GPU列表 

nvidia-smi  

Step 2   安裝 Cudnn 9.0

    1)     獲得安裝包 :

wget https://s3.amazonaws.com/open-source-william-falcon/cudnn-9.0-linux-x64-v7.1.tgz  

    2)    解壓

sudo tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz  

    3)   將cudnn 檔案拷貝到 cuda 安裝目錄 :

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

    4) 將cuda目錄新增到 ~/.bashrc 中 :

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda

    5)更新 ~/.bashrc :

source ~/.bashrc

Step 3   安裝 Miniconda 並 建立 conda 環境

1)    下載miniconda 並安裝 :

wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh   
# press s to skip terms   
# Do you approve the license terms? [yes|no]
# yes
# Miniconda3 will now be installed into this location:
# accept the location
# Do you wish the installer to prepend the Miniconda3 install location
# to PATH in your /home/ghost/.bashrc ? [yes|no]
# yes    

2)   更新 ~/.bashrc :

source ~/.bashrc
3) 建立conda環境:
conda create -n tensorflow python=3.6

      啟用 conda 環境:

source activate tensorflow 

4)安裝 GPU 版本 TensorFlow:

pip install tensorflow-gpu

到這裡基本上就安裝完畢了,現在進行測試一下:

5) 測試:

python 
import tensorflow as tf 
constant = tf.constant('Hello Tensorflow')
with tf.Session() as sess:
print(sess.run(constant))

如果沒有彈出錯誤,則表明該環境安裝成功!