<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body>
<div id="compose" contenteditable="true" style="padding-left: 16px; padding-right: 16px; padding-bottom: 8px;">
<div>BTW I left off that it has the same LSI controller chipset<br>
<br>
<div class="acompli_signature">Sent from <a href="https://aka.ms/qtex0l">Outlook Mobile</a></div>
<br>
</div>
</div>
<div class="gmail_quote">_____________________________<br>
From: John Barfield <john.barfield@bissinc.com><br>
Sent: Tuesday, January 12, 2016 10:17 PM<br>
Subject: Re: [OmniOS-discuss] [discuss] COMSTAR hanging<br>
To: <discuss@lists.illumos.org>, omnios-discuss <omnios-discuss@lists.omniti.com><br>
<br>
<br>
<meta content="text/html; charset=Windows-1252">
<meta content="Microsoft Exchange Server" name="Generator">
<style><!-- .EmailQuote { margin-left: 1pt; padding-left: 4pt; border-left: #800000 2px solid; } --></style>
<div>
<div>My input may or may not be valid but Im going to throw it out there anyway :)
</div>
<div><br>
</div>
<div>do you have any Mpt disconnect errors in /var/adm/messages? </div>
<div><br>
</div>
<div>Also do you have smartmontools installed? </div>
<div><br>
</div>
<div>I ran into similiar issues just booting a sunfire x4540 recently off of OmniOS live, i/o would just hang while probing device nodes.
</div>
<div><br>
</div>
<div>I found the drive that was acting up and pulled it. </div>
<div><br>
</div>
<div>All of a sudden everything miraculously worked amazing. </div>
<div><br>
</div>
<div>I compiled smartmontools after I got it to boot and found 10 drives out of 48 with bad sectors in prefail state.
</div>
<div><br>
</div>
<div>I dont know if this happens with SAS drives or not but Im using SATA and saw this was a common issue in old opensolaris threads.
<br>
<br>
-barfield <br>
<br>
<div class="x_acompli_signature">Sent from <a href="https://aka.ms/qtex0l">Outlook Mobile</a>
</div>
<br>
</div>
<br>
<br>
<br>
<div class="x_gmail_quote">On Tue, Jan 12, 2016 at 8:08 PM -0800, "Brian Hechinger"
<span dir="ltr"><<a href="mailto:wonko@4amlunch.net">wonko@4amlunch.net</a>></span> wrote:
<br>
<br>
</div>
</div>
<font size="2"><span style="font-size:10pt;">
<div class="PlainText">In the meantime I’ve removed the SLOG and L2ARC just in case. I don’t think that’s it though. At least will have some sort of data point to work with here. :)
<br>
<br>
-brian <br>
<br>
> On Jan 12, 2016, at 10:55 PM, Brian Hechinger <wonko@4amlunch.net> wrote: <br>
> <br>
> Ok, it has happened. <br>
> <br>
> Checking this here, the pool seems to be fine. I can read and write files. <br>
> <br>
> except ‘zpool status’ is now currently hanging. I can still read/write from the pool, however.
<br>
> <br>
> I can telnet to port 3260, but restarting target services has hung. <br>
> <br>
> root@basket1:/tank/Share# svcs -a | grep stmf <br>
> online         Jan_05   svc:/system/stmf:default <br>
> root@basket1:/tank/Share# svcs -a | grep target <br>
> disabled       Jan_05   svc:/system/fcoe_target:default <br>
> online         Jan_05   svc:/network/iscsi/target:default <br>
> online         Jan_05   svc:/system/ibsrp/target:default <br>
> root@basket1:/tank/Share# svcadm restart /system/ibsrp/target <br>
> root@basket1:/tank/Share# svcadm restart /network/iscsi/target <br>
> root@basket1:/tank/Share# svcadm restart /system/stmf <br>
> root@basket1:/tank/Share# svcs -a | grep target <br>
> disabled       Jan_05   svc:/system/fcoe_target:default <br>
> online*        22:43:03 svc:/system/ibsrp/target:default <br>
> online*        22:43:13 svc:/network/iscsi/target:default <br>
> root@basket1:/tank/Share# svcs -a | grep stmf <br>
> online*        22:43:18 svc:/system/stmf:default <br>
> root@basket1:/tank/Share# <br>
> <br>
> I’m doing a crash dump reboot. I’ll post the output somewhere. <br>
> <br>
> The output of echo '$<threadlist' | mdb -k is attached. <br>
> <br>
> <threadlist.out> <br>
> <br>
>> On Jan 8, 2016, at 3:11 PM, Matej Zerovnik <matej@zunaj.si> wrote: <br>
>> <br>
>> Is the pool usable during comstar hang? <br>
>> Can you write and read from the pool (test both, in my case, when pool froze, I wasn’t able to write to the pool, but I could read).
<br>
>> <br>
>> Again, this might not be connected with Comstar, but in my case, Comstar and pool hang were exchanging.
<br>
>> <br>
>> Matej <br>
>> <br>
>>> On 08 Jan 2016, at 20:11, Brian Hechinger <wonko@4amlunch.net> wrote: <br>
>>> <br>
>>> Yeah, I’m using the 1068E to boot from (this has been supported since before Illumos) but that doesn’t have anything accessed by COMSTAR.
<br>
>>> <br>
>>> It’s the ICH10R SATA that hosts the disks that COMSTAR shares out space from.
<br>
>>> <br>
>>> -brian <br>
>>> <br>
>>>> On Jan 8, 2016, at 1:31 PM, Richard Jahnel <rjahnel@ellipseinc.com> wrote: <br>
>>>> <br>
>>>> First off, love SuperMicro good choice IMHO. <br>
>>>> <br>
>>>> This board has two on board controllers. <br>
>>>> <br>
>>>> LSI SAS1068E (not 100% sure there are working illumos drivers for this one) <br>
>>>> <br>
>>>> And <br>
>>>> <br>
>>>> Intel ICH10R SATA (So I'm guessing your using this one.) <br>
>>>> <br>
>>>> -----Original Message----- <br>
>>>> From: OmniOS-discuss [ <a href="mailto:omnios-discuss-bounces@lists.omniti.com">
mailto:omnios-discuss-bounces@lists.omniti.com</a>] On Behalf Of Brian Hechinger <br>
>>>> Sent: Friday, January 08, 2016 12:16 PM <br>
>>>> To: Matej Zerovnik <matej@zunaj.si> <br>
>>>> Cc: omnios-discuss <omnios-discuss@lists.omniti.com> <br>
>>>> Subject: Re: [OmniOS-discuss] [discuss] COMSTAR hanging <br>
>>>> <br>
>>>> <br>
>>>>> Which controller exactly do you have? <br>
>>>> <br>
>>>> Whatever ACHI stuff is built into the motherboard. Motherboard is X8DTL-3F. <br>
>>>> <br>
>>>>> Do you know firmware version? <br>
>>>> <br>
>>>> I’m assuming this is linked to the BIOS version? <br>
>>>> <br>
>>>>> Which hard drives? <br>
>>>> <br>
>>>> Hitachi-HUA723030ALA640-MKAOAA50-2.73TB <br>
>>>> <br>
>>>>> It might not tell much, but it’s good to have as much information as possible.
<br>
>>>>> <br>
>>>>> When comstar hangs, can you telnet to the iSCSI port? <br>
>>>>> What does svcs says, is the service running? <br>
>>>>> What happens in you try to restart it? <br>
>>>>> How do you restart it? <br>
>>>> <br>
>>>> I’ll try all these things next time. <br>
>>>> <br>
>>>>> In my case, svcs reported service running, but when I tried to telnet, there was no connection as well as there was no listening port opened when checking with 'netstat -an'. If I tried to restart target and stmf service, but stmf service got stucked
 in online* state and would not start. Reboot was the only solution in my case, but as I said, latest 014 release is working OK (but then again, load got reduced).
<br>
>>>> <br>
>>>> All good info. Thanks! <br>
>>>> <br>
>>>> -brian <br>
>>>> <br>
>>>>> <br>
>>>>> Matej <br>
>>>>> <br>
>>>>>> On 08 Jan 2016, at 17:50, Dave Pooser <dave-oo@pooserville.com> wrote: <br>
>>>>>> <br>
>>>>>>>> On Jan 8, 2016, at 11:22 AM, Brian Hechinger <wonko@4amlunch.net> wrote:
<br>
>>>>>>>> <br>
>>>>>>>> No, ZFS raid10 <br>
>>>>>>> <br>
>>>>>>> Saw the HW-RAID term, and got concerned.  That's what, raidz2 in ZFS-ese?
<br>
>>>>>> <br>
>>>>>> It's a zpool with multiple mirror vdevs. <br>
>>>>>> <br>
>>>>>> -- <br>
>>>>>> Dave Pooser <br>
>>>>>> Cat-Herder-in-Chief, Pooserville.com <br>
>>>>>> <br>
>>>>>> <br>
>>>>>> _______________________________________________ <br>
>>>>>> OmniOS-discuss mailing list <br>
>>>>>> OmniOS-discuss@lists.omniti.com <br>
>>>>>> <a href="http://lists.omniti.com/mailman/listinfo/omnios-discuss">http://lists.omniti.com/mailman/listinfo/omnios-discuss</a>
<br>
>>>>> <br>
>>>>> _______________________________________________ <br>
>>>>> OmniOS-discuss mailing list <br>
>>>>> OmniOS-discuss@lists.omniti.com <br>
>>>>> <a href="http://lists.omniti.com/mailman/listinfo/omnios-discuss">http://lists.omniti.com/mailman/listinfo/omnios-discuss</a>
<br>
>>>> <br>
>>>> _______________________________________________ <br>
>>>> OmniOS-discuss mailing list <br>
>>>> OmniOS-discuss@lists.omniti.com <br>
>>>> <a href="http://lists.omniti.com/mailman/listinfo/omnios-discuss">http://lists.omniti.com/mailman/listinfo/omnios-discuss</a>
<br>
>>> <br>
>> <br>
> <br>
<br>
<br>
<br>
<a href="http://www.listbox.com">http://www.listbox.com</a> <br>
</div>
</span></font>
<div bgcolor="#ffffff" id="listbox-footer" style="width:auto;margin:0;padding:5px;background-color:#fff;clear:both;border-top: 1px solid #ccc;">
<table bgcolor="#ffffff" border="0" cellpadding="0" cellspacing="0" style="background-color:#fff" width="100%">
<tbody>
<tr>
<td><font color="#333333" size="1" style="font-family:helvetica, sans-serif;"><strong>illumos-discuss</strong> |
<a href="https://www.listbox.com/member/archive/182180/=now" style="text-decoration:none;color:#669933;border-bottom: 1px solid #444444" title="Go to archives for illumos-discuss">
Archives</a> <a border="0" href="https://www.listbox.com/member/archive/rss/182180/26677440-40b316d8" style="text-decoration:none;color:#669933" title="RSS feed for illumos-discuss">
<img border="0" src="http://postlink.www.listbox.com/2033704/833487e62783d55fe81f119fb93ef644/26677440/3044d385.jpg?uri=aHR0cHM6Ly93d3cubGlzdGJveC5jb20vaW1hZ2VzL2ZlZWQtaWNvbi0xMHgxMC5qcGc"></a> |
<a href="https://www.listbox.com/member/?member_id=26677440&id_secret=26677440-8fd7f4fe" style="text-decoration:none;color:#669933;border-bottom: 1px solid #444444" title="">
Modify</a> Your Subscription</font></td>
<td align="right" valign="top"><a href="http://www.listbox.com" style="border-bottom:none;"><img border="0" src="http://postlink.www.listbox.com/2033705/3379085af0f1cf7fc3708f04b4471ae2/26677440/3044d385.png?uri=aHR0cHM6Ly93d3cubGlzdGJveC5jb20vaW1hZ2VzL2xpc3Rib3gtbG9nby1zbWFsbC5wbmc" title="Powered by Listbox"></a></td>
</tr>
</tbody>
</table>
</div>
<br>
<br>
</div>
</body>
</html>