TensorFlow,为什么选择python语言?
c++
machine-learning
python
tensorflow
5
0

我最近开始研究深度学习和其他ML技术,并开始寻找简化构建网络并对其进行培训的框架,然后我发现TensorFlow在该领域经验不足,对我来说,速度似乎是一种如果与深度学习一起工作,那么使大型机器学习系统变得更大的重要因素,那么为什么Google选择python来制造TensorFlow?在可以编译且无法解释的语言上进行翻译会更好吗?

使用Python而不是像C ++这样的语言进行机器学习有什么优势?

参考资料:
Stack Overflow
收藏
评论
共 3 个回答
高赞 时间 活跃

Python允许您使用C和C ++创建扩展模块,与本机代码接口,并且仍然获得Python给您带来的优势。

TensorFlow使用Python,是的,但是它也包含大量的C ++

这样就可以使用一个更简单的界面来进行实验,从而减少了用Python进行的人工操作,并通过对C ++中最重要的部分进行编程来提高性能。

收藏
评论

TF不是用python编写的。它是用C ++编写的(并使用高性能的数字CUDA代码),您可以通过查看他们的github进行检查。因此,核心不是用python编写的,而是TF提供了许多其他语言( python,C ++,Java,Go )的接口

在此处输入图片说明

如果您来自数据分析领域,则可以像numpy(不是用python编写,但提供了Python的接口)那样考虑它,或者如果您是Web开发人员,则可以将其视为数据库(PostgreSQL,MySQL,可以从Java,Python,PHP调用)


由于许多 原因, Python前端(人们使用TF编写模型的语言)最受欢迎。在我看来,主要原因是历史原因:大多数ML用户已经在使用它(另一个流行的选择是R),因此,如果您不提供python的接口,那么您的库很可能注定会变得晦涩难懂。


但是用python编写并不意味着您的模型是用python执行的。相反,如果您以正确的方式编写模型,则在评估TF图期间绝不会执行Python( tf.py_func()除外,该存在于调试中,应完全在实际模型中避免使用,因为它是在Python方面)。

例如,这与numpy不同。例如,如果执行np.linalg.eig(np.matmul(A, np.transpose(A))eig(AA') ),则该操作将以某种快速语言(C ++或fortran)计算转置,返回它到python,与A一起从python中获取,然后以某种快速语言计算一个乘法,然后将其返回给python,然后计算特征值,然后将其返回给python。尽管如此,像matmul和eig这样的昂贵运算却得到了有效的计算,但您仍然会损失通过将结果移回python并强制执行TF不会这样做 ,一旦定义了图,张量就不在python中,而是在C ++ / CUDA /其他东西中流动。

收藏
评论

关于TensorFlow的最重要的认识是,在大多数情况下, 内核不是用Python编写的 :它是由高度优化的C ++和CUDA(Nvidia用于GPU编程的语言)结合而成。反过来,大部分情况是通过使用Eigen (高性能C ++和CUDA数值库)和NVidia的cuDNN (为NVidia GPU进行了非常优化的DNN库,用于诸如卷积之类的功能)而发生的。

TensorFlow的模型是程序员使用“某种语言”(很可能是Python!)来表达模型。该模型以TensorFlow构造编写,例如:

h1 = tf.nn.relu(tf.matmul(l1, W1) + b1)
h2 = ...

在运行Python时实际上并未执行。相反,实际上创建的是一个数据流图 ,该表示接受特定的输入,应用特定的操作,将结果作为输入提供给其他操作,等等。 该模型由快速的C ++代码执行,并且在大多数情况下,操作之间传递的数据永远不会复制回Python代码

然后,程序员通过拉上节点来“驱动”该模型的执行-通常在Python中进行训练,并在Python中有时在原始C ++中进行服务:

sess.run(eval_results)

这个Python(或C ++函数调用)使用对C ++的进程内调用或针对分布式版本的RPC来调用C ++ TensorFlow服务器以使其执行,然后将结果复制回去。

因此,话虽如此,让我们重新表述一下这个问题:为什么TensorFlow选择Python作为表达和控制模型训练的第一种得到良好支持的语言?

答案很简单:对于许多数据科学家和机器学习专家来说,Python可能最舒适的语言,它也易于集成并控制C ++后端,同时在内部和外部也广泛使用。和开放源代码。鉴于使用TensorFlow的基本模型,Python的性能并不那么重要,因此很自然。 NumPy的巨大优势还在于它可以在Python中轻松进行预处理-同样具有高性能-然后再将其馈入TensorFlow进行真正占用大量CPU的工作。

在表达执行模型时不使用的模型也有很多复杂性-形状推断(例如,如果您做matmul(A,B),结果数据的形状是什么?)和自动梯度计算。事实证明,能够用Python表达这些内容真是太好了,尽管我认为从长远来看,它们可能会转移到C ++后端,从而使添加其他语言变得更加容易。

(当然,希望是将来支持其他语言来创建和表达模型。使用其他几种语言来运行推理已经非常简单了-C ++现在可以工作了,Facebook的某人提供了我们正在审查的Go绑定等)

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号