是否有没有为AVX指令编译的TensorFlow版本?
python
tensorflow
10
0

我正在尝试在我的Chromebook上安装TensorFlow,这不是最好的地方,但是我只是想对此有所了解。我在Python开发环境中或在任何开发环境中都没有做很多工作,所以请多多包涵。弄清楚pip之后,我安装了TensorFlow并尝试将其导入,收到此错误:

Python 3.5.2 (default, Nov 23 2017, 16:37:01) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import tensorflow as tf
2018-12-11 06:09:54.960546: F tensorflow/core/platform/cpu_feature_guard.cc:37] The TensorFlow library was compiled to use AVX instructions, but these aren't available on your machine.
Aborted (core dumped)

经过一番研究,我发现我的处理器(Intel Celeron N2840(Bay Trail-M架构))不支持AVX指令,因此我想知道是否有办法使用为其他指令集编译的版本。 Cog告诉我,我可以使用MMX和各种SSE(无论什么意思)。

PS这是在Linux上使用AVX指令时TensorFlow错误的重现, 而在同一台计算机上的Windows上却并非完全如此。另外,我没有评论,因为我没有50个声誉。

PPS我研究了如何使用SSE4.2和AVX指令编译Tensorflow?感到害怕

参考资料:
Stack Overflow
收藏
评论
共 1 个回答
高赞 时间 活跃

peter-cordes建议的最佳实践方法是通过发出以下命令来查看gcc对“ cpu具有的功能”的影响:

gcc -O3 -fverbose-asm -march=native -xc /dev/null -S -o- | less

该命令将从gcc的角度(将要进行构建)提供有关您cpu功能的信息(全部),因此gcc的观点很重要。

什么时候出现?当某个程序根据您的cpu量身定制时。 ang我对我的CPU有什么了解。好吧,以上一行将告诉您所有您需要了解的内容。

就是说,通常,正在推广基于cpu的功能的人员/开发人员将陈述或建议一系列列表,如果您的cpu带有*,则这些列表会更快/更好/更强。以上将为您提供*。仔细阅读您所看到的内容。如果没有它,就不要它,即

-mno-avx(whatever you don't want;in my case it was avx)

Mikael Fernandez Simalango针对Ubuntu 16.04 LTS提供了有关在较旧cpu上支持CPU的安装的良好概述。它假定使用python2.7环境,但可以轻松转换为python3。问题的核心是通过/ proc / cpuinfo提取除-march = native之外将在您的特定cpu上使用的cpu指令扩展,(但请注意,它似乎仅限于它接受的标志,因此可能是更好地阅读上面的说明并进行反思)

grep flags -m1 /proc/cpuinfo | cut -d ":" -f 2 | tr '[:upper:]' 
'[:lower:]' | { read FLAGS; OPT="-march=native"; for flag in $FLAGS; 
do case "$flag" in "sse4_1" | "sse4_2" | "ssse3" | "fma" | "cx16" | 
"popcnt" | "avx" | "avx2") OPT+=" -m$flag";; esac; done; 
MODOPT=${OPT//_/\.}; echo "$MODOPT"; }

在我的旧盒子输出上运行此命令:

-march=native -mssse3 -mcx16 -msse4.1 -msse4.2 -mpopcnt

它到达那里。目前尚不清楚如何说“不是这个”和“不是那个”,对于老CPU,这很可能是-mno-avx。

对于一个旧的cpu来说,-march很重要,而Nephanth非常有用地解决了这个问题:

gcc -march=native -Q --help=target|grep march

产生

-march=                             westmere

这意味着我对./compile问题的回答应该是或可能是,并注意gcc文档中的引号“ westmere”,因此“”必定是有原因的

-march='westmere' -mssse3 -mcx16 -msse4.1 -msse4.2 -mpopcnt -mno-avx

但这可能更好(请参见下面的讨论):

-march=native -mssse3 -mcx16 -msse4.1 -msse4.2 -mpopcnt -mno-avx

-mno-avx是gcc的选项,许多小时后,结果是

Python 3.5.2 (default, Nov 23 2017, 16:37:01) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more 
information.
>>> import tensorflow as tf
>>> 
>>> tf.__version__
'2.0.0-alpha0'

看起来很成功。

重述:以任一顺序,找出您的CPU支持(或不支持)哪些指令,并明确说明这些指令。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号