Keras正式从TensorFlow分离:结束API混乱与耗时编译

新闻 前端
以后在本地运行 Keras Bazel 测试将不再花费几小时,只需要几分钟。

 [[405983]]

对于深度学习领域的从业者而言,Keras 肯定不陌生,它是深度学习的主流框架之一。2015 年 3 月 27 日,谷歌软件工程师、Keras 之父 Francois Chollet 在其 GitHub 上提交并公布了 Keras 的首个版本。作为使用纯 Python 编写的深度学习框架,Keras 的代码更加简单方便,适用于初学者。此外,Keras 具有很强的易扩展性,能够直观地定义神经网络,函数式 API 的使用令用户可以将层定义为函数。

[[405984]]

Keras 官网地址:https://keras.io/

为了训练自定义神经网络,Keras 需要一个后端,在 v1.1.0 版本之前,Keras 的默认后端都是 Theano。2015 年 11 月 9 日,谷歌发布了 TensorFlow。Keras 开始支持 TensorFlow 作为后端。渐渐地,TensorFlow 成为最受欢迎的后端,并从 Keras v1.1.0 发行版开始成为它的默认后端。tf.keras 正是在 TensorFlow v1.10.0 中引入的,这是将 Keras 直接集成到 TensorFlow 包中的第一步。

当谷歌在 2019 年 6 月发布 TensorFlow 2.0 时,他们宣布 Keras 成为 TensorFlow 的官方高级 API。并且,在 Keras 2.3.0 版本发布时,Francois 表示这是 Keras 首个与 tf.keras 同步的版本,也是 Keras 支持 Theano 等多个后端的最终版本。所有深度学习从业者都应将其代码转换成 TensorFlow 2.0 和 tf.keras 软件包。这意味着二者的合并,但看似双赢的决定,很多开发者却不买账。API 的混乱与割裂不仅令开发者不知所措,也加大了开发者寻找教程的难度。

是时候做出改变了!近日,Keras 之父 Francois Chollet 在其推特宣布一项重要决定:他们已经将 Keras 的代码从 TensorFlow 代码库中分离出来,移回到了自己的 repo。

Keras正式从TensorFlow分离:结束API混乱与耗时编译

对于 Keras 从 TensorFlow 分离后有哪些好处?Francois 表示:「这将提升开源贡献者的开发体验。对于用户而言,这将使他们可以在本地运行测试,不再需要编译 TF 来测试 Keras 了,并且还将改善 CI 时间。」

Keras 正式从 TensorFlow 代码库中分离

此次 Keras 分离过程的负责人是谷歌高级软件工程师 Scott Zhu,他代表 Keras 团队向所有 Keras 用户发表了公开声明,解释了 Keras 从 TensorFlow 代码库中分离出来的缘由以及分离后为用户带来的诸多便利之处。

开发团队花费了很多精力使 TensorFlow 更加模块化,并优化了 Keras 和 TensorFlow 之间的依赖关系。最终 Keras 从 TensorFlow 代码库中分离出来,并拥有了自己独立的代码库。这使 Keras 能够使用 Tensorflow Python API 作为 PIP 包依赖项,且无需在构建和测试时编译 TensorFlow。因此现在在本地运行 Keras Bazel 测试只需要几分钟,而不是几小时。

变更之后,当前 TensorFlow 代码库中的 Keras 部分将很快被删除。这意味着:

1. Keras 开源代码库的访问地址将发生变更;

原地址:
https://github.com/tensorflow/tensorflow

新地址:
https://github.com/keras-team/keras

Keras正式从TensorFlow分离:结束API混乱与耗时编译

2. 用于代码库管理的 git 工具。

3. 任何在先前代码库中未解决的 Keras 相关活跃问题将在现有的 ticket 线程中处理,并将通过提交到新代码库进行修复;

4. 与原代码库相关的陈旧问题将被关闭。如果你认为仍然是有价值的问题,请随时在新代码库中重新打开该问题;

5. 新 Keras 代码库在此次变更前未完成的任何 PR/issue 都被认为是陈旧的,将被关闭。

用户想要提交贡献,如何做?

用户在提交自己的代码以供审查并获得批准时,必须签署谷歌个人贡献者许可协议(CLA),这样才可以将代码放入 Keras 代码库中。此外,在提交更多的贡献时,用户也应首先通过问题跟踪器(issue tracker)与 Keras 联系沟通。

包括项目成员在内所有用户的提交都必须接受审查。为此,Keras 使用 GitHub 拉取请求(pull request, PR),并建议用户在创建 PR 之前阅读相关指南。

完成本地更改并通过测试验证后,用户可以在 keras-team/keras 项目中打开并发送 PR,之后会经过一系列的测试来验证它的正确性。一旦 PR 被审查者测试和批准,PR 将被镜像到谷歌内部存储库。一旦合并到 Google 内部存储库成功完成,PR 还将被标记为已合并(merged)。这与 Tensorflow OSS 的贡献流程相同,相关示例如下图所示:

Keras正式从TensorFlow分离:结束API混乱与耗时编译

在做任何更改之前,Keras 团队建议用于打开 issue,并在上面讨论。Keras 也会给予反馈并对用户提出的更改进行验证。如果更改很小,如文档修复中简单的 bug 修复,则只需打开 PR 无需讨论。

与个人用户不同,企业用户提交的贡献需要遵守《谷歌软件授权与企业贡献者许可协议》。

开发所需的工具

使用 Keras 开发所需要的工具主要包括如下:

用于创建和测试 Keras 项目的 Bazel 工具和 Python;

用于代码库管理的 git 工具。

设置和检查本地工作区

以苹果 Mac 电脑(Linux 系统的配置非常相似)为例,使用如下命令设置并检查本地工作区的配置:

Keras正式从TensorFlow分离:结束API混乱与耗时编译

下载 Keras 代码和设置虚拟环境

Python 虚拟环境是创建独立环境的强大工具,可以将任何系统级配置的更改隔离开来。因此,Keras 强烈建议避免出现任何意外的依赖或版本问题。

本地运行测试

在本地运行一个测试的代码如下:

  1. (venv_dir) scottzhu-macbookpro2:keras scottzhu$ bazel test -c opt keras:backend_test 
  2. WARNING: The following configs were expanded more than once: [v2]. For repeatable flags, repeats are counted twice and may lead to unexpected behavior. 
  3. INFO: Options provided by the client: 
  4.   Inherited 'common' options: --isatty=1 --terminal_columns=147 
  5. INFO: Reading rc options for 'test' from /Users/scottzhu/workspace/keras/.bazelrc: 
  6.   Inherited 'build' options: --apple_platform_type=macos --define open_source_build=true --define=use_fast_cpp_protos=false --define=tensorflow_enable_mlir_generated_gpu_kernels=0 --define=allow_oversize_protos=true --spawn_strategy=standalone -c opt --announce_rc --define=grpc_no_ares=true --config=short_logs --config=v2 
  7. INFO: Reading rc options for 'test' from /Users/scottzhu/workspace/keras/.bazelrc: 
  8.   'test' options: --define open_source_build=true --define=use_fast_cpp_protos=false --config=v2 
  9. INFO: Found applicable config definition build:short_logs in file /Users/scottzhu/workspace/keras/.bazelrc: --output_filter=DONT_MATCH_ANYTHING 
  10. INFO: Found applicable config definition build:v2 in file /Users/scottzhu/workspace/keras/.bazelrc: --define=tf_api_version=2 --action_env=TF2_BEHAVIOR=1 
  11. INFO: Found applicable config definition build:v2 in file /Users/scottzhu/workspace/keras/.bazelrc: --define=tf_api_version=2 --action_env=TF2_BEHAVIOR=1 
  12. INFO: Analyzed target //keras:backend_test (0 packages loaded, 0 targets configured). 
  13. INFO: Found 1 test target... 
  14. Target //keras:backend_test up-to-date: 
  15.   bazel-bin/keras/backend_test 
  16. INFO: Elapsed time: 45.535s, Critical Path: 45.26s 
  17. INFO: 19 processes: 19 local. 
  18. INFO: Build completed successfully, 20 total actions 
  19. //keras:backend_test                                                     PASSED in 45.2s 
  20.   Stats over 4 runs: max = 45.2s, min = 40.0s, avg = 41.5s, dev = 2.1s 
  21.  
  22.  
  23. INFO: Build completed successfully, 20 total actions 

最后为大家推荐一篇 Keras 的中文教程,它由 Keras 团队软件工程师金海峰翻译自官网教程,详细介绍了 Keras 和 TensorFlow 的基本用法和核心概念,并通过变分自编码器(Variational Autoencoder)和超网络(Hypernetwork)这两个完整的例子展示了如何在实践中使用 Keras。

教程知乎链接:
https://zhuanlan.zhihu.com/p/380472423

 

责任编辑:张燕妮 来源: 机器之心Pro
相关推荐

2017-08-25 10:26:04

业务逻辑程序员

2011-10-28 10:04:18

API

2017-06-06 10:14:55

KerasTensorFlow深度学习

2020-10-23 07:39:39

深度学习PyTorch代码

2012-09-18 09:50:39

PC时代

2022-06-29 09:00:00

前端图像分类模型SQL

2012-07-09 08:57:10

云安全身份访问和控制

2022-08-24 09:00:00

深度可分离卷积运算模型

2021-02-03 13:56:09

KerasAPI深度学习

2017-10-11 06:04:04

2017-10-30 13:34:22

深度学习KerasAPI

2021-11-05 15:28:55

TensorFlow数据机器学习

2022-10-20 11:30:38

VMware

2019-08-06 08:20:07

编译器工具开发者

2018-10-15 10:08:53

程序员技能深度学习

2018-05-15 08:44:44

TensorFlowKeras内存

2023-05-14 22:35:24

TensorFlowKeras深度学习

2024-11-08 09:06:16

agentJava探针

2009-12-09 09:15:47

从Java走进ScalTwitter API

2017-07-24 13:37:42

深度学习KerasTensorFlow
点赞
收藏

51CTO技术栈公众号