<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=us-ascii">
<META content="MSHTML 6.00.6000.16945" name=GENERATOR></HEAD>
<BODY 
style="WORD-WRAP: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space">
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>Vladimir,</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>Reading the paper, it appears that my suggestion of 
segments is called "distributed locks" in this paper and the authors 
suggests:</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT 
size=2></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT size=2>&gt; For 
example, the algorithms<SPAN class=661490010-08012010> </SPAN>that need to 
detect sequence of accesses cannot retain their<SPAN class=661490010-08012010> 
</SPAN>performance advantages when pages in the same sequence<SPAN 
class=661490010-08012010> </SPAN>have been distributed into multiple partitions 
and cannot be<SPAN class=661490010-08012010> </SPAN>identified as a 
sequence.</FONT></DIV></SPAN>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>Overall, I like the approach outlined in the paper.&nbsp; 
It takes the concept of batching further than what we did, but in much the same 
spirit.&nbsp; In our implementation, we only batched evictions.&nbsp; They are 
also batching the updates to the replacement policy ordering which is still a 
bottleneck for us.</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>Concerning the FIFO queue, t</FONT></SPAN><SPAN 
class=661490010-08012010><FONT face="Courier New" color=#0000ff size=4>he paper 
(page 372) considers both per-thread queues or global queues.&nbsp; They dismiss 
global queues for batching updates primarily because certain cache replacement 
policies need to detect sequences of operations.&nbsp; Can such sequences of 
operations be meaningfully detected within infinispan?&nbsp; Is there any 
thread-affinity for a transaction?&nbsp; If not, then segmented queues might be 
an alternative for infinispan.</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>Also, for java,&nbsp;i</FONT></SPAN><SPAN 
class=661490010-08012010><FONT face="Courier New" color=#0000ff size=4>f the 
hash map uses weak values then cache entries then any entries on the FIFO queues 
will remain pinned in the hash map&nbsp;even if they would have otherwise been 
evicted by the cache policy which is a nice touch.&nbsp; That way you can 
continue to access an object which remains accessible to the JVM held even if 
the cache replacement policy would have discarded the cache 
entry.</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>The experiment in the paper compared several cache 
replacement policies, but the data were all hot in cache and the cache was large 
enough to avoid all cache misses, so I am not clear why they bothered to compare 
different cache replacement policies -- none of them did any evictions for their 
tests.&nbsp;</FONT></SPAN><SPAN class=661490010-08012010><FONT 
face="Courier New" color=#0000ff size=4>While "prefetching" did reduce the lock 
contention slightly, it had no meaningful effect on either throughput or 
response time.&nbsp; The authors posit that it might have more effect on 
machines with many more cores, depending on the CPU architecture.&nbsp; It seems 
easily enough to ignore the prefetch dimension for now and just concentrate on 
batching.</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>So, I think that the batching approach per this paper makes 
sense and could be combined with LRU or LIRS easily since the cache replacement 
policy is encapsulated (which might not be true with prefetch) and seems overall 
like a good idea and an improvement on what we were already doing.&nbsp; For our 
application, I think that we would use a hash map with weak values (per above) 
to gain the benefit of the actual retention time of the object by the JVM.&nbsp; 
I would also like to explore the use of segmented queues as well as per-thread 
queues to control the #of queues in the system separately from the #of 
threads.&nbsp; By batching updates to the access order, you are also effectively 
batching evictions since they are driven by updates.&nbsp; When combined with a 
weak value caches, the thread running the updates should also clear entries from 
the cache on the weak reference queue, thereby batching the clearing of stale 
cache entries (those with cleared references) at the same time it is batching 
updates to the access order and inserts to the cache.</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010></SPAN><SPAN 
class=661490010-08012010><FONT face="Courier New" color=#0000ff 
size=4></FONT></SPAN>&nbsp;</DIV>
<DIV dir=ltr align=left><SPAN class=661490010-08012010><FONT face="Courier New" 
color=#0000ff size=4>Bryan</FONT></SPAN></DIV><BR>
<BLOCKQUOTE dir=ltr 
style="PADDING-LEFT: 5px; MARGIN-LEFT: 5px; BORDER-LEFT: #0000ff 2px solid; MARGIN-RIGHT: 0px">
  <DIV class=OutlookMessageHeader lang=en-us dir=ltr align=left>
  <HR tabIndex=-1>
  <FONT face=Tahoma size=2><B>From:</B> infinispan-dev-bounces@lists.jboss.org 
  [mailto:infinispan-dev-bounces@lists.jboss.org] <B>On Behalf Of </B>Vladimir 
  Blagojevic<BR><B>Sent:</B> Friday, January 08, 2010 4:42 AM<BR><B>To:</B> 
  infinispan -Dev List<BR><B>Subject:</B> Re: [infinispan-dev] Implementing LIRS 
  eviction policy [ISPN-299]<BR></FONT><BR></DIV>
  <DIV></DIV>Hey Bryan,
  <DIV><BR>
  <DIV>
  <DIV>On 2010-01-08, at 2:09 AM, Bryan Thompson wrote:</DIV><BR 
  class=Apple-interchange-newline>
  <BLOCKQUOTE type="cite">
    <DIV 
    style="WORD-WRAP: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space">
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4>Valdimir,</FONT></SPAN></DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4>I have used a similar approach to 
    "batching" evictions with good success.&nbsp; It reduced contention for the 
    lock to handle eviction by about twenty 
  percent.</FONT></SPAN></DIV></DIV></BLOCKQUOTE>
  <DIV><BR></DIV>
  <DIV>How different, if at all, was your batching implementation from the one I 
  referred to in my previous mail?&nbsp;</DIV><BR>
  <BLOCKQUOTE type="cite">
    <DIV 
    style="WORD-WRAP: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space">
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4>For this cache, which was not 
    realized using infinispan, I did NO eviction until the cache reached a 
    target percentage of the JVM heap (this kept the cache hot).&nbsp; For our 
    case, this was easy as the objects entered in the cache were database 
    records coded as byte[]s so have a good measure for their memory 
    footprint.&nbsp; Once adding another record to the cache would push the 
    cache size over the target memory limit, that thread would gain a lock and 
    then evict a batch of records (in an LRU fashion) until the cache size had 
    been driven down by a threashold (e.g., 5% of the target memory was 
    recovered).</FONT></SPAN></DIV></DIV></BLOCKQUOTE>
  <BLOCKQUOTE type="cite">
    <DIV 
    style="WORD-WRAP: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space">
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4>Let me suggest an alternative 
    approach.&nbsp; Neither LIRS nor LRU need to be strong orderings.&nbsp; It 
    is enough that a cache eviction policy be "approximately" LRU (or 
    LIRS).&nbsp; As long as the least desirable entries wind up getting evicted, 
    it does not matter what the precise eviction order 
    is.</FONT></SPAN></DIV></DIV></BLOCKQUOTE>
  <DIV><BR></DIV>
  <DIV>Can you clarify "need to be strong orderings"? Aha, you are referring to 
  eviction order?&nbsp;</DIV><BR>
  <BLOCKQUOTE type="cite">
    <DIV 
    style="WORD-WRAP: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space">
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4>If you accept "approximate" eviction 
    orders, then striped locks could be used to reduce thread contention.&nbsp; 
    Evictions could be driven on each segment of the cache independently.&nbsp; 
    If we hash the cache entry key to choose the segment, then each cache entry 
    will only appear in one segment and all segments should be driven more or 
    less equally by the application workload (assuming a decent hash 
    function).&nbsp; So using 16 segments / locks, you have 1/16th the 
    contention.</FONT></SPAN></DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff size=4></FONT></SPAN>&nbsp;</DIV>
    <DIV dir=ltr align=left><SPAN class=427114300-08012010><FONT 
    face="Courier New" color=#0000ff 
  size=4>Thoughts?</FONT></SPAN></DIV></DIV></BLOCKQUOTE></DIV><BR>
  <DIV>So what you are basically saying is that we implement LIRS and LRU per 
  Segment of ConcurrentHashMap, is that right?&nbsp;Interesting 
idea!&nbsp;</DIV>
  <DIV><BR></DIV>
  <DIV>Does your proposal still contain batching? If so, how would you fit it in 
  this new design? You would have to keep batched record of cache entry accesses 
  in a queue per segment?&nbsp;</DIV>
  <DIV><BR></DIV>
  <DIV>Regards,</DIV>
  <DIV>Vladimir</DIV>
  <DIV><BR></DIV>
  <DIV><BR></DIV></DIV></BLOCKQUOTE></BODY></HTML>