Python PyString Object传入的参数必须是以NULL结尾的字符数组的指针,而PyString_FromStringAndSize不会有这样的要求,因为通过传入的size参数就可以确定需要拷贝的字符的个数。
Python PyStringObject中的ob_shash变量其作用是缓存该对象的HASH值,这样可以避免每一次都重新计算该字符串对象的HASH值。如果一个PyStringObject对象还没有被计算过HASH值,那么ob_shash的初始值是-1。在计算一个对象的HASH值时,采用如下的算法:
- [stringobject.c]static long string_hash(PyStringObject *a){
- register int len;
- register unsigned char *p;
- register long x;
- if (a->ob_shash != -1)
- return a->ob_shash;
- len = a->ob_size;
- p = (unsigned char *) a->ob_sval;
- x = *p << 7;
- while (--len >= 0)
- x = (1000003*x) ^ *p++;
- x ^= a->ob_size;
- if (x == -1)
- x = -2;
- a->ob_shash = x;
- return x;}
Python PyString Object对象的ob_sstate变量该对象是否被Intern的标志,关于PyStringObject的Intern机制,在后面会详细介绍,下面看一下PyStringObject对应的类型对象:
- [stringobject.c]
- PyTypeObject PyString_Type = {
- PyObject_HEAD_INIT(&PyType_Type)
- 0, "str",
- sizeof(PyStringObject),
- sizeof(char), …… (reprfunc)string_repr,
- /* tp_repr */ &string_as_number,
- /* tp_as_number */ &string_as_sequence,
- /* tp_as_sequence */ &string_as_mapping,
- /* tp_as_mapping */ (hashfunc)string_hash,
- /* tp_hash */ 0, /* tp_call */ …… string_new,
- /* tp_new */ PyObject_Del,
- /* tp_free */};
可以看到,在Python PyString Object的类型对象中,tp_itemsize被设置为sizeof(char),即一个字节。对于Python中的任何一种变长对象,tp_itemsize这个域是必须设置的,tp_itemsize指明了由变长对象保存的元素的单位长度,所谓单位长度即是指一个对象在内存中的长度。这个tp_itemsize和ob_size共同决定了应该额外申请的内存的总大小是多少。
【编辑推荐】