正确理解Ruby String用法

开发 开发工具
Ruby String不向JAVA和C#中的String一样,它是操纵同一个对象。其中参数len是Ruby String的长度,而ptr则是一个char类型的指针。

Ruby语言是一个运用灵活的编程语言,通常都会被人们理解为一款解释型脚本语言。在接下来的文章中,我们将会了解到一些关于Ruby String的相关知识。#t#

Ruby语言中的String是mutable的,不像java、C#中的String是immutable的。比如

 

  1. str1="abc" 
  2. str2="abc" 

在java中,对于字面量的字符串,jvm内部维持一张表,因此如果在java中,str1和str2是同一个String对象。而在Ruby中, str1和str2是完全不同的对象。同样,在java中对于String对象的操作都将产生一个新的对象,而Ruby则是操纵同一个对象,比如:

 

  1. str="abc" 
  2. str.concat("cdf") 

此时str就是"abccdf"。Ruby String是怎么处理的呢?我们只谈谈c ruby中的实现,有兴趣的先看看这篇文章《管窥Ruby——对象基础》。在ruby.h中我们可以看到String对象的结构,Ruby中的对象(包括类也是对象)都是一个一个的struct,String也不能例外:

 

  1. struct RString {  
  2. struct RBasic basic;  
  3. long len;  
  4. char *ptr;  
  5. union {  
  6. long capa;  
  7. VALUE shared;  
  8. } aux;  
  9. };  
  10. //ruby.h 

显然,len是String的长度;ptr是一个char类型的指针,指向实际的字符串;然后是一个联合,这个稍后再说。如果你看看ruby.h可以发 现,几乎所有定义的对象结构都有一个struct RBasic。显然,struct RBasic包含由所有对象结构体共享的一些重要信息的。看看RBasic:

 

  1. struct RBasic {   
  2. unsigned long flags;   
  3. VALUE klass;   
  4. }; 

其中的flags是一个多用途的标记,大多数情况下用于记录结构体的类型,ruby.h中预定义了一些列的宏,比如T_STRING(表示struct RString),T_ARRAY(表示struct RArray)等。Klass是一个VALUE类型,VALUE也是unsigned long,可以地将它当成指针(一个指针4字节,绰绰有余了),它指向的是一个Ruby对象,这里以后再深入。

那么联合aux中的capa和shared是干什么用的呢?因为Ruby的String是可变的,可变意味着len可以改变,我们需要每次都根据len的 变换来增减内存(使用c中的realloc()函数),这显然是一个很大的开销,解决办法就是预留一定的空间,ptr指向的内存大小略大于len,这样就 不需要频繁调用realloc了,aux.capa就是一个长度,包含额外的内存大小。那么aux.shared是干什么的呢?这是一个VALUE类型, 说明它是指向某个对象。aux.shared其实是用于加快字符串的创建速度,在一个循环中。

每次都重新创建一个"str"对象,内部就是重复创建一个char[],这是相当奢侈,aux.shared就是用于共享char[],以字面量创建的字符串会共享一个char[],当要发生变化时,将字符串复制到一个非共享的内存中,变化针对这个新拷贝进行,这就是所谓的“copy-on-write"技术。解释了String的内部构造,貌似还没有介绍String是怎么实现mutable,我们写一个Ruby扩展测试下,我们想写这样一个Ruby类:

classTestdefteststr="str"str.concat("ing")endend

对应的c语言代码就是:

  1. #include  
  2. #include"ruby.h"staticVALUEt_test(VALUEself){  
  3. VALUEstr;str=rb_str_new2("str");  
  4. printf("beforeconcat:str:%p,  
  5. str.aux.shared:%p,str.ptr:%s"n",str,
    (RSTRING(str)-
    >aux).shared,RSTRING(str)->ptr);  
  6. rb_str_cat2(str,"ing");  
  7. printf("afterconcat:str:%p,str.aux.
    shared:%p,str.ptr:%s"n",  
  8. str,(RSTRING(str)->aux).shared,RSTRING
    (str)-
    >ptr);returnself;  
  9. }  
  10. VALUEcTest;  
  11. voidInit_string_hack(){  
  12. cTest=rb_define_class("Test",rb_cObject);  
  13. rb_define_method(cTest,"test",t_test,0);  
  14. }//string_hack.c 

在t_test中,通过rb_str_new2每次生成一个RString结构,然后通过rb_str_cat2将str与"ing"连接起来,添加
了一些打印用于跟踪。利用mkmf产生Makefile,写一个extconf.rb

require'mkmf'create_makefile("string_hack");

执行ruby extconf.rb,将产生一个Makefile,执行make,生成一个string_hack.so的链接库。扩展写完了,通过
ruby调用:

require'string_hack"t=Test.new(1..3).each{|i|t.test}

输出:

before concat: str:0x40098a40, str.aux.shared:0x3, str.ptr:str
after concat: str:0x40098a40, str.aux.shared:0x8, str.ptr:string
before concat: str:0x40098a2c, str.aux.shared:0x3, str.ptr:str
after concat: str:0x40098a2c, str.aux.shared:0x8, str.ptr:string
before concat: str:0x40098a18, str.aux.shared:0x3, str.ptr:str
after concat: str:0x40098a18, str.aux.shared:0x8, str.ptr:string

从结果可以看出,在str concat之前之后,str指向的位置没有改变,改变的仅仅是str中ptr指向的字符串的值,看看rb_str_cat2函数的实现就一目了然了:

  1. VALUErb_str_cat(str,ptr,len)VALUEstr;  
  2. constchar*ptr;  
  3. longlen;  
  4. {  
  5. if(len<0){rb_raise(rb_eArgError,
    "negativestringsize(orsizetoobig)");  
  6. }  
  7. if(FL_TEST(str,STR_ASSOC))  
  8. {  
  9. rb_str_modify(str);  
  10. REALLOC_N(RSTRING(str)->ptr,char,
    RSTRING(str)-
    >len+len);  
  11. memcpy(RSTRING(str)->ptr+RSTRING
    (str)-
    >len,ptr,len);  
  12. RSTRING(str)->len+=len;  
  13. RSTRING(str)->ptr[RSTRING(str)->len]='"0';  
  14. /*sentinel*/  
  15. returnstr;  
  16. }  
  17. returnrb_str_buf_cat(str,ptr,len);  
  18. }  
  19. VALUErb_str_cat2(str,ptr)VALUEstr;  
  20. constchar*ptr;  
  21. {  
  22. returnrb_str_cat(str,ptr,strlen(ptr));  
  23. }  
  24. //string.c 

 

责任编辑:曹凯 来源: 68design.net
相关推荐

2009-12-17 11:36:55

Ruby输入输出

2009-12-16 10:33:31

Ruby更新文件

2009-12-16 17:00:43

Ruby on Rai

2009-06-18 10:29:24

Hibernate I

2020-01-07 15:10:32

Linuxinode命令

2010-07-20 12:35:33

SQL Server索

2010-02-01 10:54:37

C++框架

2009-12-04 18:00:46

PHP开发MVC模型

2024-01-29 00:35:00

Go并发开发

2023-12-27 19:52:08

Go模块命令

2009-12-03 18:07:47

PHP转义

2009-12-09 14:04:45

PHP include

2010-01-18 17:29:35

VB.NET函数调用

2010-02-04 15:05:00

C++ cpuid指令

2013-08-06 10:40:38

大数据数据

2009-12-04 17:16:41

PHP析构函数

2009-12-07 14:53:13

PHP抽象类应用

2010-08-05 15:40:07

DB2快照函数

2010-02-23 17:55:24

WCF双向通信

2010-01-05 14:01:27

JSON.NET
点赞
收藏

51CTO技术栈公众号