astron最近一直很忙,搭建实验环境的事情从11月一拖再拖,每次只能搞几个小时就得等几周才能回归,终于有两天时间来搞自己的深度学习环境了。之前安装各个版本的软件,都遇到了兼容性问题。特此记录下。
z270
这个主板上面可以安装单gpu。1080ti只能安装一台,两台据说有带宽问题,没有验证。
操作系统方面,至少需要ubuntu1610。因为1604的驱动里面不太兼容z270。
今天就是先用1604刻录了镜像,安装过程就报了pci的错误。索性直接放弃了。
操作系统
因此1610是最低的版本。1704和1710都是可以的。我之前一直是用1710做的,最后一步安装tensorflow-gpu的时候出了问题,是cuda的问题,但是重装cuda8或者cuda9后,都找不到/usr/local/cuda和/usr/local/cuda8.0的安装目录,最后就重装了系统,同时操作系统改成1610,现在想起来1710和1704也是可以的。
cuda9和cudnn7安装上后,可以编译sample通过,这个让astron很高兴。但是安装tensorflow就出现麻烦了。因为tensorflow1.4都不支持cuda9。
看了网上的说明,说是要自己下载tf源码编译。没有继续考虑这步。今天是1月6日,google搜了下2018年1月4日,tf1.5出来了,tf支持cuda9了,于是astron去清华镜像上下载了whl文件。但是安装后tf还是报错啊,说什么6.0.so找不到。想着赶紧做实验,怕后面还出些幺蛾子,就用的cuda8+cudnn6的组合了。