前端文件数据格式那些事儿

开发 前端
在 Web 开发中,当我们处理文件时(创建,上传,下载),经常会遇到二进制数据。另一个典型的应用场景是图像处理。

 前言

[[434624]]

在 Web 开发中,当我们处理文件时(创建,上传,下载),经常会遇到二进制数据。另一个典型的应用场景是图像处理。

在 JavaScript 中有很多种二进制数据格式,比如ArrayBuffer,Uint8Array,DataView,Blob,File 等等,不过 JavaScript 中的二进制数据是以非标准方式实现的。

下面我们来了解下这些数据格式及相互转换。

本文涉及到File,Blob,TypedArray,data url(Base64),blob url等等。

File

首先,我们还是拿前文的例子来看,显示用户选择的图片。

 

我们创建一个页面。提供选择图片功能。

  1. <!DOCTYPE html> 
  2. <html> 
  3.     <head> 
  4.         <title>test</title> 
  5.     </head> 
  6.  
  7.     <body> 
  8.         <input type="file" id="fileInput" name="选择图片"/> 
  9.         <div class="wrap-image"
  10.             <canvas id="canvas"></canvas> 
  11.         </div> 
  12.         <script type="text/javascript"
  13.  
  14.         </script> 
  15.     </body> 
  16. </html> 

选择图片后,需要将图片显示到canvas中,我们在上面的script标签中加入下面的代码:

 

  1. const fileInput = document.getElementById('fileInput'
  2. const canvas = document.getElementById('canvas'
  3. fileInput.addEventListener('change', (e) => { 
  4.     let img = new Image 
  5.     const file = e.target.files[0] 
  6.     img.src = URL.createObjectURL(file) 
  7.     img.onload = () => { 
  8.         canvas.width = img.width 
  9.         canvas.height = img.height 
  10.         const context = canvas.getContext('2d'
  11.         context.drawImage(img, 0, 0) 
  12.     } 
  13. }, false

 

选择一张图片后,change事件中获取到选择的文件e.target.files[0]:

 

前端文件数据格式那些事儿

 

File 对象是特殊类型的 Blob,可以用在任意的 Blob 类型的 context 中。

比如 FileReader, URL.createObjectURL(), createImageBitmap(), 及 XMLHttpRequest.send() 都能处理 Blob 和 File。

File 接口也继承了 Blob 接口的属性。上图的Prototype展开可以看到继承自Blob:

 

前端文件数据格式那些事儿

 

上面是最常见的file获取方式————从<input type="file">中获取。

 

  1. new File(fileParts, fileName, [options]) 
  • fileParts —— Blob/BufferSource/String 类型值的数组
  • fileName —— 文件名字符串
  • options —— 可选对象

FileReader

FileReader 的用途是从 Blob(因此也从 File)对象中读取数据。

它使用事件来传递数据,因为从磁盘读取数据可能比较费时间。

可以读取为3种格式:

 

前端文件数据格式那些事儿

 

比如将 Blob 读取为 base64:

 

  1. const reader = new FileReader() 
  2. reader.readAsDataURL(file) // 将 Blob 读取为 base64 

 

使用时选择哪一种,要看如何使用数据。

读取过程中有下列事件:

1、loadstart: 开始加载

2、progress: 在读取过程中出现

3、load: 读取完成,没有 error

4、abort: 调用了 abort()取消操作

5、error: 出现 error

6、loadend: 读取完成,无论成功还是失败

使用最广泛的是load和error,比如下面的例子:

  1. <input type="file" onchange="readFile(this)"
  2.  
  3. <script> 
  4. const readFile = (input) => { 
  5.   const file = input.files[0] 
  6.   const reader = new FileReader() 
  7.   reader.readAsText(file) 
  8.   reader.onload = () => { 
  9.     console.log(reader.result) // 结果 
  10.   } 
  11.  
  12.   reader.onerror = () => { 
  13.     console.log(reader.error) // error 
  14.   } 
  15. </script> 

不过大多数情况下,我们不需要读取Blob,通过网络发送一个File很容易,像 XMLHttpRequest 或 fetch 等 API 本身就接受 File 对象。或者用URL.createObjectURL(file) 创建一个短的 url,并将其赋给 。这样,文件便可以下载文件或者将其呈现为图像,作为 canvas 等的一部分。

 

Blob

用URL.createObjectURL创建了一个url:

 

  1. img.src = URL.createObjectURL(file) 

这里,URL.createObjectURL 取一个 Blob,并为其创建一个唯一的 URL,形式为 blob:/

本例中创建的url如下:

 

  1. blob:null/a05be8a9-78b4-4470-bdfe-5fca427781c2 

浏览器内部为每个通过 URL.createObjectURL 生成的URL存储了一个 URL → Blob 映射。可以通过URL访问 Blob。

但 Blob 本身只保存在内存中的。浏览器无法释放它。

关闭页面时会自动释放内存中的Blob,也可以手动释放,通过URL.revokeObjectURL(url) 从内部映射中移除引用,Blob 被删除,并释放内存。

映射被删除后该 URL 也就不再起作用了,也就无法通过URL再访问Blob。

现在,我们了解了Blob作为URL的应用,那Blob到底是什么呢?

Blob 由一个可选的字符串 type(通常是 MIME 类型)和 blobParts 组成,blobParts是 一系列其他 Blob 对象,字符串和 BufferSource。

 

前端文件数据格式那些事儿

 

我们可以通过构造函数创建一个Blob:

 

  1. new Blob(blobParts, options) 
  • blobParts是 Blob/BufferSource/String 类型的值的数组
  • options 可选对象:

type: Blob 类型,通常是 MIME 类型,例如 image/png

endings:是否转换换行符,使 Blob 对应于当前操作系统的换行符(\r\n 或 \n)。默认为 “transparent”(啥也不做),不过也可以是 “native”(转换)

比如从字符串创建 Blob:

 

  1. // 注意:第一个参数必须是一个数组 [...] 
  2. const blob = new Blob(['<html>…</html>'], {type: 'text/html'}) 

 

图片 to Blob

图像操作是通过canvas来实现的:

1、使用 canvas.drawImage 在 canvas 上绘制图像(绘制后可以做一些图像处理,比如旋转、裁剪等等);

2、调用 canvas 的 toBlob(callback, format, quality)方法 创建一个 Blob。

比如,在上面的context.drawImage(img, 0, 0);后,我们把canvas转成Blob:

 

  1. canvas.toBlob((blob) => { 
  2.   console.log('blob', blob) 
  3. }, 'image/png'

 

 

前端文件数据格式那些事儿

 

或者,更喜欢同步的写法:

 

  1. img.onload = async () => { 
  2.   ... 
  3.   context.drawImage(img, 0, 0) 
  4.   const blob = await new Promise(resolve => canvas.toBlob(resolve, 'image/png')) 
  5.   console.log('blob', blob) 

 

Blob to Base64

URL.createObjectURL 的一个替代方法是,将 Blob 转换为 base64。

base64编码将二进制数据表示为一个由 0 到 64 的 ASCII 码组成的字符串,非常安全且可读。

我们可以在 data-url 中使用base64编码,data-url就像下面这样:

  1. data:[<mediatype>][;base64],<data> 

我们可以像常规url一样使用data-url 。

比如一张支持alpha透明度的webp的图片:

  1. <img src="data:image/webp;base64,UklGRkoAAABXRUJQVlA4WAoAAAAQAAAAAAAAAAAAQUxQSAwAAAARBxAR/Q9ERP8DAABWUDggGAAAABQBAJ0BKgEAAQAAAP4AAA3AAP7mtQAAAA=="

我们可以用 FileReader 将 Blob 转换为 base64:

 

  1. // img.src = URL.createObjectURL(file) 
  2. const reader = new FileReader() 
  3. reader.readAsDataURL(file) // 将 Blob 转换为 base64 并调用 onload 
  4.  
  5. reader.onload = () => { 
  6.   img.src = reader.result 

 

现在我们可以从Blob创建2种url,一种是blob url,一种是data url,下面我们对比下这2种方式:

 

前端文件数据格式那些事儿

 

所以要使用哪种url,需要具体情况再分析。

ArrayBuffer

基本的二进制对象 ArrayBuffer是对固定长度的连续内存空间的引用,是一个内存区域,一个原始的二进制数据。

我们可以这样创建一个长度为 16 的 buffer:

 

  1. let buffer = new ArrayBuffer(16); // 创建一个长度为 16 的 buffer 
  • 注意:ArrayBuffer 和 Array 没有任何关系

我们可以通过 FileReader 的 readAsArrayBuffer 读取 Blob 的二进制数据:

 

  1. const reader = new FileReader() 
  2. reader.readAsArrayBuffer(file) 
  3. reader.onload = () => { 
  4.     const buffer = reader.result 

 

 

前端文件数据格式那些事儿

 

或者用Blob的arrayBuffer方法:

 

  1. const buffer = await file.arrayBuffer() 

上面我们看到了Int8Array、Uint8Array、Int16Array,它们的通用术语是TypedArray,此外,还有其他的TypedArray。

 

前端文件数据格式那些事儿

 

总结

现在回顾一下:

1、<input type="file">是最常见的File获取方式;

2、File对象是特殊类型的 Blob;

3、Blob可以生成blob url;

4、FileReader可以读取Blob为3种格式,二进制格式的 ArrayBuffer,给定编码的字符串,base64编码的 data url;

5、blob url和data url都可以作为url使用;

6、Blob对象的arrayBuffer方法可以读取Blob的ArrayBuffer;

7、canvas.toBlob(callback, format, quality)可以把canvas读取为Blob;

下图可以很直观的看到它们之间的相关转换关系:

 

前端文件数据格式那些事儿

 

 

 

 

责任编辑:华轩 来源: 今日头条
相关推荐

2022-05-23 08:34:08

微前端微服务开发

2021-04-29 10:30:58

MySQL数据迁移

2018-02-02 13:58:59

数据存储

2018-10-22 09:22:53

2016-08-31 10:55:30

蚂蚁金服前端

2021-06-02 08:33:31

TPCTPC-H系统

2022-02-08 17:39:04

MySQL服务器存储

2011-02-25 14:35:00

2018-09-26 06:50:19

2021-06-09 13:28:40

密码安全身份认证数据安全

2013-12-26 14:23:03

定位系统GPS监测

2019-12-25 15:20:48

前端脚手架命令

2022-06-20 05:40:25

数据库MySQL查询

2019-05-13 08:36:22

无文件恶意软件

2024-02-06 08:33:54

文件系统SSD

2021-10-26 08:42:27

7EUART串行

2023-04-11 07:34:40

分布式系统算法

2022-02-18 19:24:15

性能优化代码

2013-09-09 10:54:24

2021-03-18 09:01:53

软件开发软件选型
点赞
收藏

51CTO技术栈公众号