从此不再惧怕URI编码:JavaScript及C# URI编码详解

开发 前端
JavaScript中编码有三种方法:escape、encodeURI、encodeURIComponent。JavaScript中的还好,只提供了三个,C#中主要用的就有这么多,还没有列出其他编码(HTML),一多就弄不明白,弄不明白就心生恐惧,心生恐惧就变得苦逼,本文就向大家详细解释在JavaScript及C#中如何对URI进行编码的方法(注:本文不涉及到其他编码)。

混乱的URI编码

JavaScript中编码有三种方法:escape、encodeURI、encodeURIComponent

C#中编码主要方法:HttpUtility.UrlEncode、Server.UrlEncode、Uri.EscapeUriString、Uri.EscapeDataString

JavaScript中的还好,只提供了三个,C#中主要用的就有这么多,还没有列出其他编码(HTML),一多就弄不明白,弄不明白就心生恐惧,心生恐惧就变得苦逼,本文就向大家详细解释在JavaScript及C#中如何对URI进行编码的方法(注:本文不涉及到其他编码)。

escape:不推荐使用

原因:eacape是BOM中的方法,只能对ASCII符号正确编码,而encodeURI、encodeURIComponent可以对所有的Unicode符号编码。ECMAScript v3 反对使用该方法,应用使用 decodeURI() 和 decodeURIComponent() 替代它。

escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z

encodeURI:用于对网址编码(不包含参数)

encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z

encodeURI就是为这个而设计的。encodeURI不对URI中的特殊字符进行编码,如冒号(:)、斜杠(/)。下面看个示例:

  1. encodeURI("http://www.cnblogs.com/a file with spaces.html")  
  2. // outputs http://www.cnblogs.com/a%20file%20with%20spaces.html 

可以看到仅仅把空格替换成了20%,所以此方法可用于对网址进行编码。

由于encodeURI不对冒号(:)、斜杠(/)进行编码,所以如果参数(如把网址作为参数)中包含冒号(:)、斜杠(/),就会解析出错,所以此方法不能对参数进行编码。

encodeURIComponent:用于对网址参数进行编码

encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z,A-Z

可以看到此方法对:/都进行了编码,所以不能用它来对网址进行编码。由于此方法对中文,空格,井号(#),斜线(/),冒号(:)都进行了编码,所以适合对URI中的参数进行编码。看下面的示例:

  1. var param="博客";  
  2. var url="http://www.cnblogs.com/?key="+encodeURIComponent(param)+"&page=1";  
  3. console.log(url);//outputs http://www.cnblogs.com/?key=%E5%8D%9A%E5%AE%A2%E5%9B%AD&page=1 

可以看到,这正是我们想要的结果(这里只对需要编码的参数(page=1不需要编码)进行了编码)。

Server.UrlEncode && HttpUtility.UrlEncode:不推荐

把这两个放到一起说是因为这两个方法在绝大多数情况下是一样的。它们的区别是HttpUtility.UrlEncode默认使用UTF8格式编码,而Server.UrlEncode是使用系统预设格式编码,Server.UrlEncode使用系統预设编码做为参数调用HttpUtility.UrlEncode编码,所以如果系统全局都用UTF8格式编码,这两个方法就是一样的。

这两个方法是怎么编码的呢,我们来看个示例:

  1. string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=博客#abc";  
  2. Response.Write(HttpUtility.UrlEncode(url1) );  
  3.  
  4. //output  
  5. http%3a%2f%2fwww.cnblogs.com%2fa+file+with+spaces.html%3fa%3d1%26b%3d%e5%8d%9a%e5%ae%a2%e5%9b%ad%23abc 

由上面的例子我们可以看出,HttpUtility.UrlEncode对冒号(:)和斜杠(/)进行了编码,所以不能用来对网址进行编码。

那么能不能对参数进行编码呢,答案也是否定的。因为在参数中空格应该被编码为%20而不是被HttpUtility.UrlEncode编码为加号(+),所以不推荐用这两个方法对URI进行编码。

Uri.EscapeUriString:用于对网址编码(不包含参数)

我们还是用例子说话:

  1. string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=博客园#abc";  
  2. Response.Write( Uri.EscapeUriString(url1));  
  3. //outputs:  
  4. http://www.cnblogs.com/a%20file%20with%20spaces.html?a=1&b=%E5%8D%9A%E5%AE%A2%E5%9B%AD#abc 

可以看出,Uri.EscapeUriString对空格进行了编码,也对中文进行了编码,但对冒号(:)、斜杠(/)和井号(#)未编码,所以此方法可以用于网址进行编码,但不能对参数进行编码,作用类似JavaScript中的encodeURI方法。

Uri.EscapeDataString:用于对网址参数进行编码

仍然用例子说话:

  1. string url1 = "http://www.cnblogs.com/a file with spaces.html?a=1&b=博客#abc";  
  2. Response.Write(Uri.EscapeDataString(url1));  
  3. //outputs:  
  4. http%3A%2F%2Fwww.cnblogs.com%2Fa%20file%20with%20spaces.html%3Fa%3D1%26b%3D%E5%8D%9A%E5%AE%A2%E5%9B%AD%23abc 

可以看出,Uri.EscapeDataString对冒号(:)、斜杠(/)、空格、中文、井号(#)都进行了编码,所以此方法不可以用于网址进行编码,但可以用于对参数进行编码,作用类似JavaScript中的encodeURIComponent方法。

小结

在JavaScript中推荐的做法是用encodeURI对URI的网址部分编码,用encodeURIComponent对URI中传递的参数进行编码。

在C#中推荐的做法是用Uri.EscapeUriString对URI的网址部分编码,用Uri.EscapeDataString对URI中传递的参数进行编码。

解码部分就不说了,与编码方法相对应。

原文:http://www.cnblogs.com/artwl/archive/2012/03/07/2382848.html

【编辑推荐】

  1. 再谈JavaScript面向对象编程
  2. 5个***的JavaScript调试工具
  3. JavaScript的过去、现在和未来
  4. 早该知道的7个JavaScript技巧
  5. JavaScript MVC框架backbone.js初探
责任编辑:陈贻新 来源: Artwl的博客
相关推荐

2009-06-24 10:49:16

JavaScript

2009-08-04 14:14:11

C#编码标准

2009-09-01 17:04:47

C#编码标准

2009-08-25 17:46:50

C#生成汉字编码原理

2014-02-20 10:28:28

JavaScriptBase64

2011-03-25 09:08:49

C#

2009-12-29 13:43:26

WPF URI

2013-05-06 09:30:47

2012-01-13 12:21:45

Java

2009-09-07 05:50:59

C# Timer用法

2013-04-17 14:47:19

Windows PhoWindows Pho

2023-12-22 15:36:42

Python编程语言编码技巧

2012-05-25 13:54:18

JavaScript

2010-01-05 09:35:07

.Net Framew

2010-03-01 09:19:10

WCF编码规范

2009-08-12 17:59:48

C#读取文本文

2009-12-24 10:12:02

Linux查看文件编码

2011-09-26 10:50:16

JavaScript

2011-08-04 09:35:09

Objective-C 编码规范

2010-01-25 13:43:09

C++算术编码
点赞
收藏

51CTO技术栈公众号