说 HashTable 是PHP的灵魂,一点也不为过。在Zend引擎中,比如变量表、常量表、函数表、数组,以及资源管理、线程安全等,其实现都有HashTable的身影。HashTable 是一种查找性能极高的数据结构,理想情况下其算法复杂度是O(1)。
PHP 版本:php-5.6.17
头文件: Zend/zend_hash.h,
源文件: Zend/zend_hash.c
注意:说明中使用了伪代码形式,只有代码块中的代码才可以执行
有两部分组成,Bucket 和 HashTable,而且均为结构体(struct)。
Bucket 是存储数据的单元,用于保存具体的数据内容;HashTable 用于保存整个哈希表需要的基本信息。
二者关系可以简单理解为:HashTable = Array(); HashTable['arBuckets'] = [Bucket1, Bucket2, Bucket3, …]。
HashTable 的目的就是通过索引把每个Bucket元素分散到唯一的位置。
PHP 内核通过HashTable 结构管理Bucket 数组。
相比普通HashTable,PHP的HashTable同时维护一个双向链表。在HashTable.arBuckets 存储的是包含多个Bucket指针的向量,每个指针又指向一个双向链表(多个bucket组成)。
HashTable 源码展示
在Zend/zend_hash.h的line 55~83 中定义了结构体 Bucket 和 HashTable。注意 Bucket 和 HashTable 是别名,分别对应结构体 bucket 和 _hashtable。
typedef struct bucket { ulong h; /* Used for numeric indexing */ uint nKeyLength; void *pData; void *pDataPtr; struct bucket *pListNext; struct bucket *pListLast; struct bucket *pNext; struct bucket *pLast; const char *arKey; } Bucket; typedef struct _hashtable { uint nTableSize; uint nTableMask; uint nNumOfElements; ulong nNextFreeElement; Bucket *pInternalPointer; /* Used for element traversal */ Bucket *pListHead; Bucket *pListTail; Bucket **arBuckets; dtor_func_t pDestructor; zend_bool persistent; unsigned char nApplyCount; zend_bool bApplyProtection; #if ZEND_DEBUG int inconsistent; #endif } HashTable;
Bucket 解析说明
先分析一下Bucket 结构体成员变量的作用:
说明
一. pData 和 pDataPtr 的关系,
pData 指向的是保存数据的内存块地址,一般通过malloc等分配;
pDataPtr 如果是指针数据,此值会指向真正的value,同时pData 会指向该值
疑问 内存块地址,不也是指针吗?和pDataPtr什么区别??
二. h 成员保存的是HashTable key 哈希后的值,而非HashTable中的索引值,为什么?
索引值和HashTable的容量有关系,如果HashTable扩容,那么这些索引还得重新进行哈希,再进行索引映射
数字索引直接就可以作为哈希表的索引,数字也无需进行哈希处理
HashTable 解析说明
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/6533/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料