<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal">Hi,<o:p></o:p></p>
<p class="MsoNormal">&nbsp; I&#8217;m running on SLES 11 SP3 <o:p></o:p></p>
<p class="MsoNormal">pacemaker-1.1.11-0.7.53<o:p></o:p></p>
<p class="MsoNormal">lvm2-clvm-2.02.98-0.25.4<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">I&#8217;ve created a base-group with dlm and clvm and made it a clone group.&nbsp; Both systems are able to start dlm and seem to connect, but the start of clvm on the second system always times out, stops and restarts.&nbsp; The monitor in the restart
 sees the pid and reports the resource as running.&nbsp; <o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">I&#8217;ve diagnosed the issue to be that the &#8220;start_daemon /usr/sbin/clvmd&#8221; is not returning in the start code.&nbsp; Any idea on what could be wrong?<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">My cluster defs:<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">primitive p_clvm ocf:lvm2:clvmd \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op monitor timeout=&quot;20&quot; interval=&quot;20&quot; \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op start timeout=&quot;90&quot; interval=&quot;0&quot; \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op stop timeout=&quot;100&quot; interval=&quot;0&quot; \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; meta target-role=&quot;Started&quot;<o:p></o:p></p>
<p class="MsoNormal">primitive p_dlm ocf:pacemaker:controld \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op monitor timeout=&quot;20&quot; interval=&quot;10&quot; start-delay=&quot;0&quot; \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op start timeout=&quot;90&quot; interval=&quot;0&quot; \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op stop timeout=&quot;100&quot; interval=&quot;0&quot; \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; meta target-role=&quot;Started&quot;<o:p></o:p></p>
<p class="MsoNormal">primitive stonith-sbd stonith:external/sbd \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; op start start-delay=&quot;10s&quot; interval=&quot;0&quot;<o:p></o:p></p>
<p class="MsoNormal">group base_group p_dlm p_clvm<o:p></o:p></p>
<p class="MsoNormal">clone base_clone base_group \<o:p></o:p></p>
<p class="MsoNormal">&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;meta interleave=&quot;true&quot;<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">my syslog:<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 clvmd(p_clvm)[16336]: INFO: calling start_daemon<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 crmd[15791]:&nbsp;&nbsp; notice: process_lrm_event: LRM operation p_dlm_monitor_10000 (call=16, rc=0, cib-update=50, confirmed=false) ok<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 clvmd[16357]: CLVMD started<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: process_uevent: uevent: add@/kernel/dlm/clvmd<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: process_uevent: kernel: add@ clvmd<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: process_uevent: uevent: online@/kernel/dlm/clvmd<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: process_uevent: kernel: online@ clvmd<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 kernel: [ 3532.121548] dlm: Using TCP for communications<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: log_config: dlm:ls:clvmd conf 2 1 0 memb 16850860 16916396 join 16916396 left<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: add_change: clvmd add_change cg 1 joined nodeid 16916396<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: add_change: clvmd add_change cg 1 we joined<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: add_change: clvmd add_change cg 1 counts member 2 joined 1 remove 0 failed 0<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: check_fencing_done: clvmd check_fencing done<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: check_quorum_done: clvmd check_quorum disabled<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: check_fs_done: clvmd check_fs none registered<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: send_info: clvmd send_start cg 1 flags 1 data2 0 counts 0 2 1 0 0<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: receive_start: clvmd receive_start 16916396:1 len 80<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: match_change: clvmd match_change 16916396:1 matches cg 1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: wait_messages_done: clvmd wait_messages cg 1 need 1 of 2<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: receive_start: clvmd receive_start 16850860:2 len 80<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: match_change: clvmd match_change 16850860:2 matches cg 1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: wait_messages_done: clvmd wait_messages cg 1 got all 2<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: start_kernel: clvmd start_kernel cg 1 member_count 2<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: do_sysfs: write &quot;1090842362&quot; to &quot;/sys/kernel/dlm/clvmd/id&quot;<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: set_configfs_members: set_members mkdir &quot;/sys/kernel/config/dlm/cluster/spaces/clvmd/nodes/16850860&quot;<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: set_configfs_members: set_members mkdir &quot;/sys/kernel/config/dlm/cluster/spaces/clvmd/nodes/16916396&quot;<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: do_sysfs: write &quot;1&quot; to &quot;/sys/kernel/dlm/clvmd/control&quot;<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: do_sysfs: write &quot;0&quot; to &quot;/sys/kernel/dlm/clvmd/event_done&quot;<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: set_plock_ckpt_node: clvmd set_plock_ckpt_node from 0 to 16850860<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: receive_plocks_stored: clvmd receive_plocks_stored 16850860:2 flags a sig 0 need_plocks 1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: match_change: clvmd match_change 16850860:2 matches cg 1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: retrieve_plocks: clvmd retrieve_plocks<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 kernel: [ 3532.125482] dlm: connecting to 16850860<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:20:05 usrv-fsm2 cluster-dlm[16315]: retrieve_plocks: clvmd retrieve_plocks first 0 last 0 r_count 0 p_count 0 sig 0<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 lrmd[15788]:&nbsp; warning: child_timeout_callback: p_clvm_start_0 process (PID 16336) timed out<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 lrmd[15788]:&nbsp; warning: operation_finished: p_clvm_start_0:16336 - timed out after 90000ms<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 lrmd[15788]:&nbsp;&nbsp; notice: operation_finished: p_clvm_start_0:16336:stderr [&nbsp;&nbsp; local socket: connect failed: Connection refused ]<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 crmd[15791]:&nbsp;&nbsp;&nbsp; error: process_lrm_event: LRM operation p_clvm_start_0 (17) Timed Out (timeout=90000ms)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: fail-count-p_clvm (1)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 109: fail-count-p_clvm=1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: last-failure-p_clvm (1427980972)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 111: last-failure-p_clvm=1427980972<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: fail-count-p_clvm (2)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 113: fail-count-p_clvm=2<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: last-failure-p_clvm (1427980972)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 115: last-failure-p_clvm=1427980972<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: fail-count-p_clvm (3)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 117: fail-count-p_clvm=3<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: last-failure-p_clvm (1427980972)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 119: last-failure-p_clvm=1427980972<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: fail-count-p_clvm (4)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 121: fail-count-p_clvm=4<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_cs_dispatch: Update relayed from usrv-fsm1<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_trigger_update: Sending flush op to all hosts for: last-failure-p_clvm (1427980972)<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 attrd[15789]:&nbsp;&nbsp; notice: attrd_perform_update: Sent update 123: last-failure-p_clvm=1427980972<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 clvmd(p_clvm)[16464]: INFO: Stopping p_clvm<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:35 usrv-fsm2 clvmd(p_clvm)[16464]: INFO: Stopping clvmd<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:36 usrv-fsm2 crmd[15791]:&nbsp;&nbsp; notice: process_lrm_event: LRM operation p_clvm_stop_0 (call=18, rc=0, cib-update=52, confirmed=true) ok<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:36 usrv-fsm2 clvmd(p_clvm)[16493]: INFO: Starting p_clvm<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:36 usrv-fsm2 clvmd(p_clvm)[16493]: INFO: clvmd is started, checking cmirrord<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:37 usrv-fsm2 cmirrord[16507]: Starting cmirrord:<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:37 usrv-fsm2 cmirrord[16507]:&nbsp; Built: May 29 2013 15:04:35<o:p></o:p></p>
<p class="MsoNormal">Apr&nbsp; 2 13:21:39 usrv-fsm2 clvmd(p_clvm)[16493]: INFO: cmirrord started...rpm &#8211;<o:p></o:p></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<p class="MsoNormal">Thanks for any help on this.<o:p></o:p></p>
<p class="MsoNormal">Diane Schaefer<o:p></o:p></p>
</div>
</body>
</html>