日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

PHP哈希表實現算法原理解析

瀏覽:157日期:2022-09-08 14:38:28

在PHP內核中,其中一個很重要的數據結構就是HashTable。我們常用的數組,在內核中就是用HashTable來實現。那么,PHP的HashTable是怎么實現的呢?最近在看HashTable的數據結構,但是算法書籍里面沒有具體的實現算法,剛好最近也在閱讀PHP的源碼,于是參考PHP的HashTable的實現,自己實現了一個簡易版的HashTable,總結了一些心得,下面給大家分享一下。

HashTable的介紹

哈希表是實現字典操作的一種有效數據結構。

定義

簡單地說,HashTable(哈希表)就是一種鍵值對的數據結構。支持插入,查找,刪除等操作。在一些合理的假設下,在哈希表中的所有操作的時間復雜度是O(1)(對相關證明感興趣的可以自行查閱)。

實現哈希表的關鍵

在哈希表中,不是使用關鍵字做下標,而是通過哈希函數計算出key的哈希值作為下標,然后查找/刪除時再計算出key的哈希值,從而快速定位元素保存的位置。

在一個哈希表中,不同的關鍵字可能會計算得到相同的哈希值,這叫做“哈希沖突”,就是處理兩個或多個鍵的哈希值相同的情況。解決哈希沖突的方法有很多,開放尋址法,拉鏈法等等。

因此,實現一個好的哈希表的關鍵就是一個好的哈希函數和處理哈希沖突的方法。

Hash函數

判斷一個哈希算法的好壞有以下定義:

一致性,等價的鍵必然產生相等的哈希值; 高效性,計算簡便; 均勻性,均勻地對所有的鍵進行哈希。 哈希函數建立了關鍵值與哈希值的對應關系,即:h = hash_func(key)。對應關系見下圖:

hash-exam

設計一個完美的哈希函數就交由專家去做吧,我們只管用已有的較成熟的哈希函數就好了。PHP內核使用的哈希函數是time33函數,又叫DJBX33A,其實現如下:

static inline ulong zend_inline_hash_func(const char *arKey, uint nKeyLength){ register ulong hash = 5381; /* variant with the hash unrolled eight times */ for (; nKeyLength >= 8; nKeyLength -= 8) { hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; hash = ((hash << 5) + hash) + *arKey++; } switch (nKeyLength) { case 7: hash = ((hash << 5) + hash) + *arKey++; /* fallthrough... */ case 6: hash = ((hash << 5) + hash) + *arKey++; /* fallthrough... */ case 5: hash = ((hash << 5) + hash) + *arKey++; /* fallthrough... */ case 4: hash = ((hash << 5) + hash) + *arKey++; /* fallthrough... */ case 3: hash = ((hash << 5) + hash) + *arKey++; /* fallthrough... */ case 2: hash = ((hash << 5) + hash) + *arKey++; /* fallthrough... */ case 1: hash = ((hash << 5) + hash) + *arKey++; break; case 0: break; EMPTY_SWITCH_DEFAULT_CASE() } return hash;}

注:函數使用了一個8次循環+switch來實現,是對for循環的優化,減少循環的運行次數,然后在switch里面執行剩下的沒有遍歷到的元素。

拉鏈法

將所有具有相同哈希值的元素都保存在一條鏈表中的方法叫拉鏈法。查找的時候通過先計算key對應的哈希值,然后根據哈希值找到對應的鏈表,最后沿著鏈表順序查找相應的值。

PHP的HashTable結構

簡單地介紹了哈希表的數據結構之后,繼續看看PHP中是如何實現哈希表的。

PHP內核hashtable的定義:

typedef struct _hashtable { uint nTableSize; uint nTableMask; uint nNumOfElements; ulong nNextFreeElement; Bucket *pInternalPointer; Bucket *pListHead; Bucket *pListTail; Bucket **arBuckets; dtor_func_t pDestructor; zend_bool persistent; unsigned char nApplyCount; zend_bool bApplyProtection; #if ZEND_DEBUGint inconsistent; #endif} HashTable; nTableSize,HashTable的大小,以2的倍數增長 nTableMask,用在與哈希值做與運算獲得該哈希值的索引取值,arBuckets初始化后永遠是nTableSize-1 nNumOfElements,HashTable當前擁有的元素個數,count函數直接返回這個值 nNextFreeElement,表示數字鍵值數組中下一個數字索引的位置 pInternalPointer,內部指針,指向當前成員,用于遍歷元素 pListHead,指向HashTable的第一個元素,也是數組的第一個元素 pListTail,指向HashTable的最后一個元素,也是數組的最后一個元素。與上面的指針結合,在遍歷數組時非常方便,比如reset和endAPI arBuckets,包含bucket組成的雙向鏈表的數組,索引用key的哈希值和nTableMask做與運算生成 pDestructor,刪除哈希表中的元素使用的析構函數 persistent,標識內存分配函數,如果是TRUE,則使用操作系統本身的內存分配函數,否則使用PHP的內存分配函數 nApplyCount,保存當前bucket被遞歸訪問的次數,防止多次遞歸 bApplyProtection,標識哈希表是否要使用遞歸保護,默認是1,要使用

舉一個哈希與mask結合的例子:

例如,”foo”真正的哈希值(使用DJBX33A哈希函數)是193491849。如果我們現在有64容量的哈希表,我們明顯不能使用它作為數組的下標。取而代之的是通過應用哈希表的mask,然后只取哈希表的低位。

hash | 193491849 | 0b1011100010000111001110001001& mask | & 63 | & 0b0000000000000000000000111111----------------------------------------------------------------------= index | = 9| = 0b0000000000000000000000001001

因此,在哈希表中,foo是保存在arBuckets中下標為9的bucket向量中。

bucket結構體的定義

typedef struct bucket { ulong h; uint nKeyLength; void *pData; void *pDataPtr; struct bucket *pListNext; struct bucket *pListLast; struct bucket *pNext; struct bucket *pLast; const char *arKey;} Bucket; h,哈希值(或數字鍵值的key nKeyLength,key的長度 pData,指向數據的指針 pDataPtr,指針數據 pListNext,指向HashTable中的arBuckets鏈表中的下一個元素 pListLast,指向HashTable中的arBuckets鏈表中的上一個元素 pNext,指向具有相同hash值的bucket鏈表中的下一個元素 pLast,指向具有相同hash值的bucket鏈表中的上一個元素 arKey,key的名稱

PHP中的HashTable是采用了向量加雙向鏈表的實現方式,向量在arBuckets變量保存,向量包含多個bucket的指針,每個指針指向由多個bucket組成的雙向鏈表,新元素的加入使用前插法,即新元素總是在bucket的第一個位置。由上面可以看到,PHP的哈希表實現相當復雜。這是它使用超靈活的數組類型要付出的代價。

HashTable相關API

zend_hash_init zend_hash_add_or_update zend_hash_find zend_hash_del_key_or_index

zend_hash_init

函數執行步驟

設置哈希表大小

設置結構體其他成員變量的初始值 (包括釋放內存用的析構函數pDescructor)詳細代碼注解點擊:zend_hash_init源碼

注:

1、pHashFunction在此處并沒有用到,php的哈希函數使用的是內部的zend_inline_hash_func

2、zend_hash_init執行之后并沒有真正地為arBuckets分配內存和計算出nTableMask的大小,真正分配內存和計算nTableMask是在插入元素時進行CHECK_INIT檢查初始化時進行。

zend_hash_add_or_update

函數執行步驟

檢查鍵的長度 檢查初始化 計算哈希值和下標 遍歷哈希值所在的bucket,如果找到相同的key且值需要更新,則更新數據,否則繼續指向bucket的下一個元素,直到指向bucket的最后一個位置 為新加入的元素分配bucket,設置新的bucket的屬性值,然后添加到哈希表中

如果哈希表空間滿了,則重新調整哈希表的大小

zend_hash_add_or_update

CONNECT_TO_BUCKET_DLLIST是將新元素添加到具有相同hash值的bucket鏈表。

CONNECT_TO_GLOBAL_DLLIST是將新元素添加到HashTable的雙向鏈表。

詳細代碼和注解請點擊:zend_hash_add_or_update代碼注解。

zend_hash_find

函數執行步驟

計算哈希值和下標 遍歷哈希值所在的bucket,如果找到key所在的bucket,則返回值,否則,指向下一個bucket,直到指向bucket鏈表中的最后一個位置

詳細代碼和注解請點擊:zend_hash_find代碼注解。

zend_hash_del_key_or_index

函數執行步驟

計算key的哈希值和下標 遍歷哈希值所在的bucket,如果找到key所在的bucket,則進行第三步,否則,指向下一個bucket,直到指向bucket鏈表中的最后一個位置 如果要刪除的是第一個元素,直接將arBucket[nIndex]指向第二個元素;其余的操作是將當前指針的last的next執行當前的next 調整相關指針 釋放數據內存和bucket結構體內存

詳細代碼和注解請點擊:zend_hash_del_key_or_index代碼注解。

性能分析

PHP的哈希表的優點:PHP的HashTable為數組的操作提供了很大的方便,無論是數組的創建和新增元素或刪除元素等操作,哈希表都提供了很好的性能,但其不足在數據量大的時候比較明顯,從時間復雜度和空間復雜度看看其不足。

不足如下:

保存數據的結構體zval需要單獨分配內存,需要管理這個額外的內存,每個zval占用了16bytes的內存; 在新增bucket時,bucket也是額外分配,也需要16bytes的內存; 為了能進行順序遍歷,使用雙向鏈表連接整個HashTable,多出了很多的指針,每個指針也要16bytes的內存; 在遍歷時,如果元素位于bucket鏈表的尾部,也需要遍歷完整個bucket鏈表才能找到所要查找的值

PHP的HashTable的不足主要是其雙向鏈表多出的指針及zval和bucket需要額外分配內存,因此導致占用了很多內存空間及查找時多出了不少時間的消耗。

后續

上面提到的不足,在PHP7中都很好地解決了,PHP7對內核中的數據結構做了一個大改造,使得PHP的效率高了很多,因此,推薦PHP開發者都將開發和部署版本更新吧。看看下面這段PHP代碼:

<?php$size = pow(2, 16); $startTime = microtime(true);$array = array();for ($key = 0, $maxKey = ($size - 1) * $size; $key <= $maxKey; $key += $size) { $array[$key] = 0;}$endTime = microtime(true);echo ’插入 ’, $size, ’ 個惡意的元素需要 ’, $endTime - $startTime, ’ 秒’, 'n'; $startTime = microtime(true);$array = array();for ($key = 0, $maxKey = $size - 1; $key <= $maxKey; ++$key) { $array[$key] = 0;}$endTime = microtime(true);echo ’插入 ’, $size, ’ 個普通元素需要 ’, $endTime - $startTime, ’ 秒’, 'n';

上面這個demo是有多個hash沖突時和無沖突時的時間消耗比較。筆者在PHP5.4下運行這段代碼,結果如下

插入 65536 個惡意的元素需要 43.72204709053 秒

插入 65536 個普通元素需要 0.009843111038208 秒

而在PHP7上運行的結果:

插入 65536 個惡意的元素需要 4.4028408527374 秒

插入 65536 個普通元素需要 0.0018510818481445 秒

可見不論在有沖突和無沖突的數組操作,PHP7的性能都提升了不少,當然,有沖突的性能提升更為明顯。至于為什么PHP7的性能提高了這么多,值得繼續深究。

最后再安利一下,筆者github上有一個簡易版的HashTable的實現:HashTable實現

另外,我在github有對PHP源碼更詳細的注解。感興趣的可以圍觀一下,給個star。PHP5.4源碼注解。可以通過commit記錄查看已添加的注解。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: PHP
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
国产精品av久久久久久麻豆网| 蜜桃视频在线网站| 欧美日韩视频| 国产成人精品亚洲线观看| 亚洲精品在线二区| 精品一区毛片| 国产精品观看| 久久在线免费| 9999国产精品| 中文一区一区三区免费在线观 | 在线观看免费一区二区| 超碰99在线| 一区在线观看| 蜜臀av免费一区二区三区| 亚洲一区二区成人| 久久婷婷亚洲| 久久精品99国产国产精| 久久久久黄色| 性感美女一区二区在线观看| 91久久中文| 欧美视频二区| av亚洲一区二区三区| 老司机久久99久久精品播放免费| 男人的天堂久久精品| 日本不卡一区二区| 国产伦理一区| 中文字幕一区久| 亚洲一级淫片| 国产精品毛片久久| 亚洲五月综合| 久久影院午夜精品| 日韩中文字幕一区二区三区| 国产激情一区| 美女网站一区| 欧美有码在线| 欧美 日韩 国产一区二区在线视频 | 欧美精选一区二区三区| 香蕉成人久久| 国产精品久久久免费| 久久男女视频| 国产亚洲一区二区三区不卡| 国产91一区| 国产精品高清一区二区| 欧美美女一区| 精品国产一区二区三区噜噜噜| 一区免费视频| 成午夜精品一区二区三区软件| 免费看日韩精品| av免费不卡国产观看| 日本三级亚洲精品| 久久国产精品亚洲77777| 国产成人精品一区二区三区免费| 蜜臀精品久久久久久蜜臀| 国产精品99一区二区三区| 中文字幕日韩高清在线| 成人羞羞视频播放网站| 国产精品白丝av嫩草影院| 男人的天堂久久精品| 久久精品亚洲人成影院| 精品入口麻豆88视频| 欧美日韩伊人| 中文视频一区| 五月天久久网站| 国产 日韩 欧美一区| 你懂的国产精品永久在线| 天堂久久一区| 亚洲在线网站| 久久久久久久久丰满| 久久久久伊人| 国产视频一区二区在线播放| 免费看的黄色欧美网站| 久久久久欧美精品| 在线看片国产福利你懂的| 国产精品欧美在线观看| 色8久久久久| 亚洲欧美日韩一区在线观看| 91精品一区二区三区综合在线爱| 国产成人精品一区二区免费看京| 欧美日韩亚洲三区| 欧美一区网站| 国产探花一区二区| 欧美日韩一视频区二区| 久久大逼视频| 性欧美长视频| 国产模特精品视频久久久久| 亚洲精品一二三区区别| 99精品在线观看| 999国产精品视频| 精品日韩视频| 国产91精品对白在线播放| 日韩激情一区| 天堂√中文最新版在线| 精品一级视频| 精品久久福利| 日产精品一区二区| 日韩精品第一区| 欧美午夜精品一区二区三区电影| av资源亚洲| 精品捆绑调教一区二区三区| 中文av在线全新| 国产精品国产一区| 欧美sss在线视频| 亚洲欧美综合| 久久香蕉精品| 欧美久久香蕉| 久久精品国产精品亚洲毛片| 麻豆一区二区在线| 国产精品一区二区三区av麻| 国产伦一区二区三区| 国产高清亚洲| 中文在线免费视频| 日韩精品欧美精品| 精品视频一区二区三区在线观看| 欧美一区二区三区免费看| 久久久91麻豆精品国产一区| 欧美肉体xxxx裸体137大胆| 性欧美69xoxoxoxo| 国产传媒在线| 在线日韩中文| 国产亚洲激情| 日韩中文av| 精品三级久久久| 国产成人精品亚洲日本在线观看| 欧美性感美女一区二区| 美美哒免费高清在线观看视频一区二区| 免费一区二区视频| 91精品美女| 日韩在线看片| 亚洲成人av观看| 亚洲精品大全| 国产一区二区三区日韩精品| 欧美精品羞羞答答| 欧美亚洲专区| sm捆绑调教国产免费网站在线观看| 99成人超碰| 少妇精品久久久一区二区| 老司机免费视频一区二区| 四虎4545www国产精品 | 综合国产精品| 精品一区二区男人吃奶| 日韩一级不卡| 国产欧美69| 米奇777超碰欧美日韩亚洲| 日韩超碰人人爽人人做人人添| 亚洲精品成人图区| 天海翼亚洲一区二区三区| 麻豆理论在线观看| 中文一区一区三区免费在线观 | 欧美日韩亚洲一区二区三区在线 | 精品国产乱码久久久久久樱花| 蜜桃国内精品久久久久软件9| 亚洲欧美高清| 美女视频网站久久| 日韩视频精品在线观看| 久久超级碰碰| 日韩在线a电影| 国产黄大片在线观看| 日韩激情av在线| 国产综合精品| 精品理论电影在线| 亚洲精品国产日韩| 亚洲婷婷在线| 国产精品黄色片| 蜜臀久久99精品久久久久宅男| 国产中文在线播放| 91精品日本| 欧美色图一区| 丰满少妇一区| 日本va欧美va精品发布| 红桃视频国产精品| 亚洲精品在线影院| 国产精品宾馆| 亚洲人成在线影院| 午夜日韩av| 色吊丝一区二区| 精品午夜视频| 欧美私人啪啪vps| 亚洲精品婷婷| 国产色综合网| 91精品国产调教在线观看| 欧美国产另类| 亚洲青青久久| 激情偷拍久久| 日韩在线视频精品| 福利片在线一区二区| 国产调教一区二区三区| 亚洲精品在线二区| 午夜一级久久| 亚洲va中文在线播放免费| 成人三级高清视频在线看| 国产精品黄网站| 日韩av二区在线播放| 亚洲精品看片| 亚洲精品免费观看| 综合国产在线| 六月天综合网| 午夜精品一区二区三区国产| 久久天堂成人| 欧美中文字幕一区二区| av亚洲一区二区三区|