<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Oct 9, 2014 at 9:54 PM, Dan McDonald <span dir="ltr"><<a href="mailto:danmcd@omniti.com" target="_blank">danmcd@omniti.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><span class=""><br>
On Oct 9, 2014, at 10:23 PM, Schweiss, Chip <<a href="mailto:chip@innovates.com">chip@innovates.com</a>> wrote:<br>
<br>
> Just tried my 2nd system.   r151010 nlockmgr starts after clearing maintenance mode.   r151012 it will not start at all.  nfs/status was enabled and online.<br>
><br>
> The commonality I see on the two systems I have tried is they are both part of an HA cluster.   So they don't import the pool at boot, but RSF-1 imports it with cache mapped to a different location.<br>
<br>
</span>That could be something HA Inc. needs to further test.  We don't directly support RSF-1, after all.<br>
<span class=""><br></span></blockquote><div><br></div><div>I there really isn't anything different than an auto imported pool.  I'm suspecting using an alternate cache location my be triggering something else to go wrong in the nlockmgr.   <br><br></div><div>Here's the command RSF-1 uses to import the pool:<br>zpool import -c /opt/HAC/RSF-1/etc/volume-cache/nrgpool.cache -o cachefile=/opt/HAC/RSF-1/etc/v<br>olume-cache/nrgpool.cache-live -o failmode=panic  nrgpool<br><br></div><div>After the pool import it  puts the ip addresses back and is done.   That happens in less than 1 second.<br><br></div><div>In the mean time NFS services auto start and nlockmgr starts spinning.<br></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><span class="">
> nlockmgr is becoming a real show stopper.<br>
<br>
</span>svcadm disable nlockmgr nfs/status<br>
svcadm enable nfs/status<br>
svcadm enable nlockmgr<br>
<br>
You may wish to discuss this on illumos as well, I'm not sure who all else is seeing this save me one time, and you seemingly a lot of times.<br></blockquote><div><br></div><div>I did that this time, no joy.   Today I'm working on a virtual setup with HA to see if I can get this reproduced on r151012.   <br><br></div><div>I thought this nlockmgr propblem was related to lots of nfs exports until, I ran into this on my SSD pool.  It used to be able to fail over in about 3-5 seconds.   It takes nlockmgr now sits in a spinning state for a few minutes and fails every time.   A clear of the maintenance mode, brings it back nearly instantly.   This is on r151010.  On r151012 it fails every time.   <br><br></div><div>Hopefully I can reproduce and I'll start a new thread copying Illumos too.<br><br></div><div>-Chip</div><br></div><br></div></div>