偽共享¶

可能的緩解措施¶

偽共享並不總是需要緩解。偽共享緩解措施應平衡效能提升與複雜性和空間消耗。有時，較低的效能是可以接受的，沒有必要過度最佳化每個很少使用的資料結構或冷資料路徑。

隨著核心數量的增加，越來越多地看到偽共享損害效能的情況。由於這些不利影響，已經提出了各種子系統（如網路和記憶體管理）的許多補丁並已合併。一些常見的緩解措施（帶有示例）是

將熱全域性資料分離到其自身的專用快取行中，即使它只是一個 ‘short’ 型別。缺點是會消耗更多的記憶體、快取行和 TLB 條目。
- 提交 91b6d3256356 (“net: cache align tcp_memory_allocated, tcp_sockets_allocated”)
重新組織資料結構，將相互干擾的成員分離到不同的快取行中。一個缺點是它可能會引入其他成員的新偽共享。
- 提交 802f1d522d5f (“mm: page_counter: re-layout structure to reduce false sharing”)
儘可能用 ‘read’ 替換 ‘write’，尤其是在迴圈中。例如，對於一些全域性變數，使用 compare(read)-then-write 代替無條件寫入。例如，使用
```
if (!test_bit(XXX))
        set_bit(XXX);
```
代替直接 “set_bit(XXX);”，對於 atomic_t 資料也是如此
```
if (atomic_read(XXX) == AAA)
        atomic_set(XXX, BBB);
```
- 提交 7b1002f7cfe5 (“bcache: fixup bcache_dev_sectors_dirty_add() multithreaded CPU false sharing”)
- 提交 292648ac5cf1 (“mm: gup: allow FOLL_PIN to scale in SMP”)
儘可能將熱全域性資料轉換為 ‘per-cpu data + global data’，或合理地增加將 per-cpu 資料同步到全域性資料的閾值，以減少或推遲對該全域性資料的 ‘write’。
- 提交 520f897a3554 (“ext4: use percpu_counters for extent_status cache hits/misses”)
- 提交 56f3547bfa4d (“mm: adjust vm_committed_as_batch according to vm overcommit policy”)

當然，應仔細驗證所有緩解措施，以避免產生副作用。為了在編碼時避免引入偽共享，最好

最好添加註釋說明偽共享的考慮。

需要注意的是，有時即使在檢測到並解決了嚴重的偽共享之後，效能也可能沒有明顯的改善，因為熱點會轉移到新的位置。

一個懸而未決的問題是，核心有一個可選的資料結構隨機化機制，該機制也會隨機化資料成員之間快取行共享的情況。