如何在Linux上将HTML页面转化成Png图片?

运维 系统运维
本文中将分享如何将一个HTML网页使用CutyCapt转化成png图片的方法。将一个特定页面抓取为一张png图片的最简单的方法是使用CutyCapt,这是一种在Linux下的方便地将HTML网页转化成矢量图形和位图图像格式的命令行工具。

将一个特定页面抓取为一张png图片的最简单的方法是使用CutyCapt,这是一种在Linux下的方便地将HTML网页转化成矢量图形和位图图像格式的命令行工具(比如,SVG, PDF, PS, PNG, JPEG, TIFF, GIF)。CutyCapt内部使用WebKit渲染引擎来导出网页渲染输出到图片文件中。它使用Qt构建,CutyCapt实际上是一个也可以在Windows上使用的跨平台应用。(译注:也有一个基于IE内核的 IECapt 可以作此用途)

在本篇教程中,我会描述如何将一个HTML网页使用CutyCapt转化成png图片。

在Linux上安装 CutyCapt

这是在特定Linux发行版上的安装命令。

在Debian, Ubuntu 或者 Linux Mint 安装 CutyCapt

  1. $ sudo apt-get install cutycapt  

在Fedora上安装 CutyCapt

  1. $ sudo yum install subversion qt-devel qtwebkit-devel gcc-c++ make 
  2. $ svn co svn://svn.code.sf.net/p/cutycapt/code/ cutycapt 
  3. $ cd cutycapt/CutyCapt  

在Fedora上编译前,你需要在源码上打上补丁。

使用文本编辑器打开CutyCapt.hpp,并且加入在文件的开头加上下面的两行。

  1. #include <QNetworkReply> 
  2. #include <QSslError> 

***,如下编译并安装CutyCapt。

  1. $ qmake-qt4 
  2. $ make 
  3. $ sudo cp CutyCapt /usr/local/bin/cutycapt  

在CentOS 或者 RHEL安装 CutyCapt

首先在你的Linux上启用EPEL仓库。接着和在Fedora上一样使用相同的步骤编译安装。

使用CutyCapt将 HTML 转化成 PNG

将一个HTML页面截图成一个png图片,只要使用下面的格式运行CutyCapt。

  1. $ cutycapt --url=http://www.cnn.com --out=cnn.png 

要将HTML页面保存成不同的格式(比如,PDF),只要适当地指定输出文件。

  1. $ cutycapt --url=http://www.cnn.com --out=cnn.pdf 

下图显示了CutyCapt命令选项。

在一台不含X的服务器上使用CutyCapt将HTML转换成PNG

虽然CutyCapt是一个命令行工具,但是它需要X服务运行。如果你尝试在不含X服务的机器上运行,你会得到下面这个错误:

  1. cutycapt: cannot connect to X server :0 

如果你要不含X的服务器上运行CutyCapt,你可以在服务器上安装Xvfb(轻量级“假的”X11 服务)。这样CutyCapt就不会报错了。

要在Debian, Ubuntu 或者 Linux Mint 上安装Xvfb:

  1. $ sudo apt-get install xvfb  

要在Fedora, CentOS 或者 RHEL 上安装Xvfb:

  1. $ sudo yum install xvfb  

在安装Xvfb之后,接下来像这样运行CutyCapt。

  1. $ xvfb-run --server-args="-screen 0, 1280x1200x24" cutycapt --url=http://www.cnn.com --out=cnn.png  

它首先会运行Xbfb服务,接着使用CutyCapt来抓取网页。因此它可能会花费更长的时间。如果你想要截图多张截图,你可能事先需要将Xvfb作为后台守护进程启动。


via: http://xmodulo.com/2014/02/convert-html-web-page-png-image-linux.html

译者:geekpi 校对:wxy

责任编辑:黄丹 来源: linux.cn
相关推荐

2024-09-26 09:12:35

vueOCR前端

2011-09-07 15:38:33

Ubuntuccd2isonrg2iso

2017-07-25 15:09:48

Linux地址转化

2022-12-25 16:15:38

HTMLJava可视化文档

2020-06-08 17:00:52

LinuxUSBexFAT

2015-06-05 11:24:17

WPS金山软件

2009-08-28 14:54:20

C# byte数组

2010-03-30 16:56:01

Oracle函数

2010-07-01 12:09:46

UML类图

2019-09-23 11:10:31

HTML静态页面互联网

2018-10-19 05:03:25

2018-04-11 14:47:03

Windows 10iPhoneiTunes

2010-08-02 10:35:19

Flex3教程

2018-03-25 08:44:07

iPhonePDF网页

2021-10-08 13:45:23

大数据数据科学家货币

2018-05-29 09:33:55

Linux终端显示图片

2011-08-27 11:01:10

精益扫描仪

2010-11-23 17:04:54

MySQL字符集

2010-08-10 15:55:20

FlexHTML页面

2022-07-05 10:09:18

exceljson文件
点赞
收藏

51CTO技术栈公众号