<div dir="ltr">Dear Ken,<div><br></div><div>I already modified the startup as suggested during testing, thanks! I swapped the postfix ocf resource to the amavisd systemd resource, as latter controls postfix startup also as it turns out and having both resouces in the mail-services group causes conflicts (postfix is detected as not running).</div><div><br></div><div>Still experiencing the same behaviour, killing amavisd returns an rc=7 for the monitoring operation on the &quot;victim&quot; node, this soungs logical, but the logs contain the same: amavisd and virtualip cannot run anywhere.</div><div><br></div><div>I made sure systemd is clean (amavisd = inactive, not running instead of failed) and also reset the failcount on all resources before killing amavisd.</div><div><br></div><div>How can I make sure to have a clean state for the resources beside above actions?</div><div>Also note: when causing a filesystem resource to fail (e.g. with unmout), the failover happens successfully, all resources are started on the &quot;survivor&quot; node.</div><div><br></div><div>Best regards,</div><div>Lorand</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Mar 16, 2016 at 4:34 PM, Ken Gaillot <span dir="ltr">&lt;<a href="mailto:kgaillot@redhat.com" target="_blank">kgaillot@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On 03/16/2016 05:49 AM, Lorand Kelemen wrote:<br>
&gt; Dear Ken,<br>
&gt;<br>
&gt; Thanks for the reply! I lowered migration-threshold to 1 and rearranged<br>
&gt; contraints like you suggested:<br>
&gt;<br>
&gt; Location Constraints:<br>
&gt; Ordering Constraints:<br>
&gt;   promote mail-clone then start fs-services (kind:Mandatory)<br>
&gt;   promote spool-clone then start fs-services (kind:Mandatory)<br>
&gt;   start fs-services then start network-services (kind:Mandatory)<br>
<br>
Certainly not a big deal, but I would change the above constraint to<br>
start fs-services then start mail-services. The IP doesn&#39;t care whether<br>
the filesystems are up yet or not, but postfix does.<br>
<br>
&gt;   start network-services then start mail-services (kind:Mandatory)<br>
&gt; Colocation Constraints:<br>
&gt;   fs-services with spool-clone (score:INFINITY) (rsc-role:Started)<br>
&gt; (with-rsc-role:Master)<br>
&gt;   fs-services with mail-clone (score:INFINITY) (rsc-role:Started)<br>
&gt; (with-rsc-role:Master)<br>
&gt;   network-services with mail-services (score:INFINITY)<br>
&gt;   mail-services with fs-services (score:INFINITY)<br>
&gt;<br>
&gt; Now virtualip and postfix becomes stopped, I guess these are relevant but I<br>
&gt; attach also full logs:<br>
&gt;<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_color: Resource postfix cannot run anywhere<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_color: Resource virtualip-1 cannot run anywhere<br>
&gt;<br>
&gt; Interesting, will try to play around with ordering - colocation, the<br>
&gt; solution must be in these settings...<br>
&gt;<br>
&gt; Best regards,<br>
&gt; Lorand<br>
&gt;<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: --- 0.215.7 2<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: +++ 0.215.8 (null)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +  /cib:  @num_updates=8<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       ++<br>
&gt; /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;postfix&#39;]:<br>
&gt;  &lt;lrm_rsc_op id=&quot;postfix_last_failure_0&quot;<br>
&gt; operation_key=&quot;postfix_monitor_45000&quot; operation=&quot;monitor&quot;<br>
&gt; crm-debug-origin=&quot;do_update_resource&quot; crm_feature_set=&quot;3.0.10&quot;<br>
&gt; transition-key=&quot;86:2962:0:ae755a85-c250-498f-9c94-ddd8a7e2788a&quot;<br>
&gt; transition-magic=&quot;0:7;86:2962:0:ae755a85-c250-498f-9c94-ddd8a7e2788a&quot;<br>
&gt; on_node=&quot;mail1&quot; call-id=&quot;1333&quot; rc-code=&quot;7&quot;<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; abort_transition_graph:       Transition aborted by postfix_monitor_45000<br>
&gt; &#39;create&#39; on mail1: Inactive graph<br>
&gt; (magic=0:7;86:2962:0:ae755a85-c250-498f-9c94-ddd8a7e2788a, cib=0.215.8,<br>
&gt; source=process_graph_event:598, 1)<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; update_failcount:     Updating failcount for postfix on mail1 after failed<br>
&gt; monitor: rc=7 (update=value++, time=1458124686)<br>
<br>
I don&#39;t think your constraints are causing problems now; the above<br>
message indicates that the postfix resource failed. Postfix may not be<br>
able to run anywhere because it&#39;s already failed on both nodes, and the<br>
IP would be down because it has to be colocated with postfix, and<br>
postfix can&#39;t run.<br>
<br>
The rc=7 above indicates that the postfix agent&#39;s monitor operation<br>
returned 7, which is &quot;not running&quot;. I&#39;d check the logs for postfix errors.<br>
<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; process_graph_event:  Detected action (2962.86)<br>
&gt; postfix_monitor_45000.1333=not running: failed<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_client_update:  Expanded fail-count-postfix=value++ to 1<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Completed cib_modify operation for section status: OK<br>
&gt; (rc=0, origin=mail1/crmd/253, version=0.215.8)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_peer_update:    Setting fail-count-postfix[mail1]: (null) -&gt; 1 from<br>
&gt; mail2<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt; do_state_transition:  State transition S_IDLE -&gt; S_POLICY_ENGINE [<br>
&gt; input=I_PE_CALC cause=C_FSA_INTERNAL origin=abort_transition_graph ]<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; write_attribute:      Sent update 406 with 2 changes for<br>
&gt; fail-count-postfix, id=&lt;n/a&gt;, set=(null)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_peer_update:    Setting last-failure-postfix[mail1]: 1458124291 -&gt;<br>
&gt; 1458124686 from mail2<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; write_attribute:      Sent update 407 with 2 changes for<br>
&gt; last-failure-postfix, id=&lt;n/a&gt;, set=(null)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Forwarding cib_modify operation for section status to<br>
&gt; master (origin=local/attrd/406)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Forwarding cib_modify operation for section status to<br>
&gt; master (origin=local/attrd/407)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: --- 0.215.8 2<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: +++ 0.215.9 (null)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +  /cib:  @num_updates=9<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       ++<br>
&gt; /cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]:<br>
&gt;  &lt;nvpair id=&quot;status-1-fail-count-postfix&quot; name=&quot;fail-count-postfix&quot;<br>
&gt; value=&quot;1&quot;/&gt;<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Completed cib_modify operation for section status: OK<br>
&gt; (rc=0, origin=mail2/attrd/406, version=0.215.9)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: --- 0.215.9 2<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: +++ 0.215.10 (null)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +  /cib:  @num_updates=10<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +<br>
&gt;  /cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]/nvpair[@id=&#39;status-1-last-failure-postfix&#39;]:<br>
&gt;  @value=1458124686<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_cib_callback:   Update 406 for fail-count-postfix: OK (0)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_cib_callback:   Update 406 for fail-count-postfix[mail1]=1: OK (0)<br>
&gt; Mar 16 11:38:06 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Completed cib_modify operation for section status: OK<br>
&gt; (rc=0, origin=mail2/attrd/407, version=0.215.10)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_cib_callback:   Update 406 for fail-count-postfix[mail2]=(null): OK<br>
&gt; (0)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_cib_callback:   Update 407 for last-failure-postfix: OK (0)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_cib_callback:   Update 407 for<br>
&gt; last-failure-postfix[mail1]=1458124686: OK (0)<br>
&gt; Mar 16 11:38:06 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt; attrd_cib_callback:   Update 407 for<br>
&gt; last-failure-postfix[mail2]=1457610376: OK (0)<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; abort_transition_graph:       Transition aborted by<br>
&gt; status-1-fail-count-postfix, fail-count-postfix=1: Transient attribute<br>
&gt; change (create cib=0.215.9, source=abort_unless_down:319,<br>
&gt; path=/cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;],<br>
&gt; 1)<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; abort_transition_graph:       Transition aborted by<br>
&gt; status-1-last-failure-postfix, last-failure-postfix=1458124686: Transient<br>
&gt; attribute change (modify cib=0.215.10, source=abort_unless_down:319,<br>
&gt; path=/cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]/nvpair[@id=&#39;status-1-last-failure-postfix&#39;],<br>
&gt; 1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; unpack_config:        On loss of CCM Quorum: Ignore<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_online_status:      Node mail1 is online<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_online_status:      Node mail2 is online<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource mail:0 active in<br>
&gt; master mode on mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource spool:0 active in<br>
&gt; master mode on mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-spool active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-spool active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-mail active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-mail active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt; unpack_rsc_op_failure:        Processing failed op monitor for postfix on<br>
&gt; mail1: not running (7)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource spool:1 active in<br>
&gt; master mode on mail2<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource mail:1 active in<br>
&gt; master mode on mail2<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; group_print:   Resource Group: network-services<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      virtualip-1        (ocf::heartbeat:IPaddr2):     Started<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; clone_print:   Master/Slave Set: spool-clone [spool]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Masters: [ mail1 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Slaves: [ mail2 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; clone_print:   Master/Slave Set: mail-clone [mail]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Masters: [ mail1 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Slaves: [ mail2 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; group_print:   Resource Group: fs-services<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      fs-spool   (ocf::heartbeat:Filesystem):    Started mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      fs-mail    (ocf::heartbeat:Filesystem):    Started mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; group_print:   Resource Group: mail-services<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      postfix    (ocf::heartbeat:postfix):       FAILED mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: Promoting mail:0 (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: mail-clone: Promoted 1 instances of a possible 1 to master<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: Promoting spool:0 (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: spool-clone: Promoted 1 instances of a possible 1 to master<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; RecurringOp:   Start recurring monitor (45s) for postfix on mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   virtualip-1     (Started mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   spool:0 (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   spool:1 (Slave mail2)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   mail:0  (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   mail:1  (Slave mail2)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   fs-spool        (Started mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   fs-mail (Started mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; LogActions:   Recover postfix (Started mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; process_pe_message:   Calculated Transition 2963:<br>
&gt; /var/lib/pacemaker/pengine/pe-input-330.bz2<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; handle_response:      pe_calc calculation pe_calc-dc-1458124686-5541 is<br>
&gt; obsolete<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; unpack_config:        On loss of CCM Quorum: Ignore<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_online_status:      Node mail1 is online<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_online_status:      Node mail2 is online<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource mail:0 active in<br>
&gt; master mode on mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource spool:0 active in<br>
&gt; master mode on mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-spool active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-spool active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-mail active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource fs-mail active on<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt; unpack_rsc_op_failure:        Processing failed op monitor for postfix on<br>
&gt; mail1: not running (7)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource spool:1 active in<br>
&gt; master mode on mail2<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; determine_op_status:  Operation monitor found resource mail:1 active in<br>
&gt; master mode on mail2<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; group_print:   Resource Group: network-services<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      virtualip-1        (ocf::heartbeat:IPaddr2):     Started<br>
&gt; mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; clone_print:   Master/Slave Set: spool-clone [spool]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Masters: [ mail1 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Slaves: [ mail2 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; clone_print:   Master/Slave Set: mail-clone [mail]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Masters: [ mail1 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; short_print:       Slaves: [ mail2 ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; group_print:   Resource Group: fs-services<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      fs-spool   (ocf::heartbeat:Filesystem):    Started mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      fs-mail    (ocf::heartbeat:Filesystem):    Started mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; group_print:   Resource Group: mail-services<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_print:      postfix    (ocf::heartbeat:postfix):       FAILED mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; get_failcount_full:   postfix has failed 1 times on mail1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt; common_apply_stickiness:      Forcing postfix away from mail1 after 1<br>
&gt; failures (max=1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: Promoting mail:0 (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: mail-clone: Promoted 1 instances of a possible 1 to master<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: Promoting spool:0 (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; master_color: spool-clone: Promoted 1 instances of a possible 1 to master<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; rsc_merge_weights:    fs-mail: Rolling back scores from postfix<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; rsc_merge_weights:    postfix: Rolling back scores from virtualip-1<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_color: Resource postfix cannot run anywhere<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; native_color: Resource virtualip-1 cannot run anywhere<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; LogActions:   Stop    virtualip-1     (mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   spool:0 (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   spool:1 (Slave mail2)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   mail:0  (Master mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   mail:1  (Slave mail2)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   fs-spool        (Started mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt; LogActions:   Leave   fs-mail (Started mail1)<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; LogActions:   Stop    postfix (mail1)<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; do_state_transition:  State transition S_POLICY_ENGINE -&gt;<br>
&gt; S_TRANSITION_ENGINE [ input=I_PE_SUCCESS cause=C_IPC_MESSAGE<br>
&gt; origin=handle_response ]<br>
&gt; Mar 16 11:38:06 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt; process_pe_message:   Calculated Transition 2964:<br>
&gt; /var/lib/pacemaker/pengine/pe-input-331.bz2<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; do_te_invoke: Processing graph 2964 (ref=pe_calc-dc-1458124686-5542)<br>
&gt; derived from /var/lib/pacemaker/pengine/pe-input-331.bz2<br>
&gt; Mar 16 11:38:06 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt; te_rsc_command:       Initiating action 5: stop postfix_stop_0 on mail1<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: --- 0.215.10 2<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: +++ 0.215.11 (null)<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +  /cib:  @num_updates=11<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +<br>
&gt;  /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;postfix&#39;]/lrm_rsc_op[@id=&#39;postfix_last_0&#39;]:<br>
&gt;  @operation_key=postfix_stop_0, @operation=stop,<br>
&gt; @transition-key=5:2964:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt; @transition-magic=0:0;5:2964:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt; @call-id=1335, @last-run=1458124686, @last-rc-change=1458124686,<br>
&gt; @exec-time=435<br>
&gt; Mar 16 11:38:07 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; match_graph_event:    Action postfix_stop_0 (5) confirmed on mail1 (rc=0)<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Completed cib_modify operation for section status: OK<br>
&gt; (rc=0, origin=mail1/crmd/254, version=0.215.11)<br>
&gt; Mar 16 11:38:07 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt; te_rsc_command:       Initiating action 12: stop virtualip-1_stop_0 on mail1<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: --- 0.215.11 2<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       Diff: +++ 0.215.12 (null)<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +  /cib:  @num_updates=12<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_perform_op:       +<br>
&gt;  /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;virtualip-1&#39;]/lrm_rsc_op[@id=&#39;virtualip-1_last_0&#39;]:<br>
&gt;  @operation_key=virtualip-1_stop_0, @operation=stop,<br>
&gt; @transition-key=12:2964:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt; @transition-magic=0:0;12:2964:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt; @call-id=1337, @last-run=1458124687, @last-rc-change=1458124687,<br>
&gt; @exec-time=56<br>
&gt; Mar 16 11:38:07 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt; match_graph_event:    Action virtualip-1_stop_0 (12) confirmed on mail1<br>
&gt; (rc=0)<br>
&gt; Mar 16 11:38:07 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_request:  Completed cib_modify operation for section status: OK<br>
&gt; (rc=0, origin=mail1/crmd/255, version=0.215.12)<br>
&gt; Mar 16 11:38:07 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt; run_graph:    Transition 2964 (Complete=7, Pending=0, Fired=0, Skipped=0,<br>
&gt; Incomplete=0, Source=/var/lib/pacemaker/pengine/pe-input-331.bz2): Complete<br>
&gt; Mar 16 11:38:07 [7420] HWJ-626.domain.local       crmd:     info: do_log:<br>
&gt;     FSA: Input I_TE_SUCCESS from notify_crmd() received in state<br>
&gt; S_TRANSITION_ENGINE<br>
&gt; Mar 16 11:38:07 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt; do_state_transition:  State transition S_TRANSITION_ENGINE -&gt; S_IDLE [<br>
&gt; input=I_TE_SUCCESS cause=C_FSA_INTERNAL origin=notify_crmd ]<br>
&gt; Mar 16 11:38:12 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt; cib_process_ping:     Reporting our current digest to mail2:<br>
&gt; ed43bc3ecf0f15853900ba49fc514870 for 0.215.12 (0x152b110 0)<br>
&gt;<br>
&gt;<br>
&gt; On Mon, Mar 14, 2016 at 6:44 PM, Ken Gaillot &lt;<a href="mailto:kgaillot@redhat.com">kgaillot@redhat.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; On 03/10/2016 09:49 AM, Lorand Kelemen wrote:<br>
&gt;&gt;&gt; Dear List,<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; After the creation and testing of a simple 2 node active-passive<br>
&gt;&gt;&gt; drbd+postfix cluster nearly everything works flawlessly (standby, failure<br>
&gt;&gt;&gt; of a filesystem resource + failover, splitbrain + manual recovery)<br>
&gt;&gt; however<br>
&gt;&gt;&gt; when delibarately killing the postfix instance, after reaching the<br>
&gt;&gt;&gt; migration threshold failover does not occur and resources revert to the<br>
&gt;&gt;&gt; Stopped state (except the master-slave drbd resource, which works as<br>
&gt;&gt;&gt; expected).<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Ordering and colocation is configured, STONITH and quorum disabled, the<br>
&gt;&gt;&gt; goal is to always have one node running all the resources and at any sign<br>
&gt;&gt;&gt; of error it should fail over to the passive node, nothing fancy.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Is my configuration wrong or am I hitting a bug?<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; All software from centos 7 + elrepo repositories.<br>
&gt;&gt;<br>
&gt;&gt; With these versions, you can set &quot;two_node: 1&quot; in<br>
&gt;&gt; /etc/corosync/corosync.conf (which will be done automatically if you<br>
&gt;&gt; used &quot;pcs cluster setup&quot; initially), and then you don&#39;t need to ignore<br>
&gt;&gt; quorum in pacemaker.<br>
&gt;&gt;<br>
&gt;&gt;&gt; Regarding STONITH: the machines are running on free ESXi instances on<br>
&gt;&gt;&gt; separate machines, so the Vmware fencing agents won&#39;t work because in the<br>
&gt;&gt;&gt; free version the API is read-only.<br>
&gt;&gt;&gt; Still trying to figure out a way to go, until then manual recovery + huge<br>
&gt;&gt;&gt; arp cache times on the upstream firewall...<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Please find pe-input*.bz files attached, logs and config below. The<br>
&gt;&gt;&gt; situation: on node mail1 postfix was killed 3 times (migration<br>
&gt;&gt; threshold),<br>
&gt;&gt;&gt; it should have failed over to mail2.<br>
&gt;&gt;&gt; When killing a filesystem resource three times this happens flawlessly.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Thanks for your input!<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Best regards,<br>
&gt;&gt;&gt; Lorand<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Cluster Name: mailcluster<br>
&gt;&gt;&gt; Corosync Nodes:<br>
&gt;&gt;&gt;  mail1 mail2<br>
&gt;&gt;&gt; Pacemaker Nodes:<br>
&gt;&gt;&gt;  mail1 mail2<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Resources:<br>
&gt;&gt;&gt;  Group: network-services<br>
&gt;&gt;&gt;   Resource: virtualip-1 (class=ocf provider=heartbeat type=IPaddr2)<br>
&gt;&gt;&gt;    Attributes: ip=10.20.64.10 cidr_netmask=24 nic=lan0<br>
&gt;&gt;&gt;    Operations: start interval=0s timeout=20s<br>
&gt;&gt; (virtualip-1-start-interval-0s)<br>
&gt;&gt;&gt;                stop interval=0s timeout=20s<br>
&gt;&gt; (virtualip-1-stop-interval-0s)<br>
&gt;&gt;&gt;                monitor interval=30s (virtualip-1-monitor-interval-30s)<br>
&gt;&gt;&gt;  Master: spool-clone<br>
&gt;&gt;&gt;   Meta Attrs: master-max=1 master-node-max=1 clone-max=2 clone-node-max=1<br>
&gt;&gt;&gt; notify=true<br>
&gt;&gt;&gt;   Resource: spool (class=ocf provider=linbit type=drbd)<br>
&gt;&gt;&gt;    Attributes: drbd_resource=spool<br>
&gt;&gt;&gt;    Operations: start interval=0s timeout=240 (spool-start-interval-0s)<br>
&gt;&gt;&gt;                promote interval=0s timeout=90 (spool-promote-interval-0s)<br>
&gt;&gt;&gt;                demote interval=0s timeout=90 (spool-demote-interval-0s)<br>
&gt;&gt;&gt;                stop interval=0s timeout=100 (spool-stop-interval-0s)<br>
&gt;&gt;&gt;                monitor interval=10s (spool-monitor-interval-10s)<br>
&gt;&gt;&gt;  Master: mail-clone<br>
&gt;&gt;&gt;   Meta Attrs: master-max=1 master-node-max=1 clone-max=2 clone-node-max=1<br>
&gt;&gt;&gt; notify=true<br>
&gt;&gt;&gt;   Resource: mail (class=ocf provider=linbit type=drbd)<br>
&gt;&gt;&gt;    Attributes: drbd_resource=mail<br>
&gt;&gt;&gt;    Operations: start interval=0s timeout=240 (mail-start-interval-0s)<br>
&gt;&gt;&gt;                promote interval=0s timeout=90 (mail-promote-interval-0s)<br>
&gt;&gt;&gt;                demote interval=0s timeout=90 (mail-demote-interval-0s)<br>
&gt;&gt;&gt;                stop interval=0s timeout=100 (mail-stop-interval-0s)<br>
&gt;&gt;&gt;                monitor interval=10s (mail-monitor-interval-10s)<br>
&gt;&gt;&gt;  Group: fs-services<br>
&gt;&gt;&gt;   Resource: fs-spool (class=ocf provider=heartbeat type=Filesystem)<br>
&gt;&gt;&gt;    Attributes: device=/dev/drbd0 directory=/var/spool/postfix fstype=ext4<br>
&gt;&gt;&gt; options=nodev,nosuid,noexec<br>
&gt;&gt;&gt;    Operations: start interval=0s timeout=60 (fs-spool-start-interval-0s)<br>
&gt;&gt;&gt;                stop interval=0s timeout=60 (fs-spool-stop-interval-0s)<br>
&gt;&gt;&gt;                monitor interval=20 timeout=40<br>
&gt;&gt; (fs-spool-monitor-interval-20)<br>
&gt;&gt;&gt;   Resource: fs-mail (class=ocf provider=heartbeat type=Filesystem)<br>
&gt;&gt;&gt;    Attributes: device=/dev/drbd1 directory=/var/spool/mail fstype=ext4<br>
&gt;&gt;&gt; options=nodev,nosuid,noexec<br>
&gt;&gt;&gt;    Operations: start interval=0s timeout=60 (fs-mail-start-interval-0s)<br>
&gt;&gt;&gt;                stop interval=0s timeout=60 (fs-mail-stop-interval-0s)<br>
&gt;&gt;&gt;                monitor interval=20 timeout=40<br>
&gt;&gt; (fs-mail-monitor-interval-20)<br>
&gt;&gt;&gt;  Group: mail-services<br>
&gt;&gt;&gt;   Resource: postfix (class=ocf provider=heartbeat type=postfix)<br>
&gt;&gt;&gt;    Operations: start interval=0s timeout=20s (postfix-start-interval-0s)<br>
&gt;&gt;&gt;                stop interval=0s timeout=20s (postfix-stop-interval-0s)<br>
&gt;&gt;&gt;                monitor interval=45s (postfix-monitor-interval-45s)<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Stonith Devices:<br>
&gt;&gt;&gt; Fencing Levels:<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Location Constraints:<br>
&gt;&gt;&gt; Ordering Constraints:<br>
&gt;&gt;&gt;   start network-services then promote mail-clone (kind:Mandatory)<br>
&gt;&gt;&gt; (id:order-network-services-mail-clone-mandatory)<br>
&gt;&gt;&gt;   promote mail-clone then promote spool-clone (kind:Mandatory)<br>
&gt;&gt;&gt; (id:order-mail-clone-spool-clone-mandatory)<br>
&gt;&gt;&gt;   promote spool-clone then start fs-services (kind:Mandatory)<br>
&gt;&gt;&gt; (id:order-spool-clone-fs-services-mandatory)<br>
&gt;&gt;&gt;   start fs-services then start mail-services (kind:Mandatory)<br>
&gt;&gt;&gt; (id:order-fs-services-mail-services-mandatory)<br>
&gt;&gt;&gt; Colocation Constraints:<br>
&gt;&gt;&gt;   network-services with spool-clone (score:INFINITY) (rsc-role:Started)<br>
&gt;&gt;&gt; (with-rsc-role:Master)<br>
&gt;&gt; (id:colocation-network-services-spool-clone-INFINITY)<br>
&gt;&gt;&gt;   network-services with mail-clone (score:INFINITY) (rsc-role:Started)<br>
&gt;&gt;&gt; (with-rsc-role:Master)<br>
&gt;&gt; (id:colocation-network-services-mail-clone-INFINITY)<br>
&gt;&gt;&gt;   network-services with fs-services (score:INFINITY)<br>
&gt;&gt;&gt; (id:colocation-network-services-fs-services-INFINITY)<br>
&gt;&gt;&gt;   network-services with mail-services (score:INFINITY)<br>
&gt;&gt;&gt; (id:colocation-network-services-mail-services-INFINITY)<br>
&gt;&gt;<br>
&gt;&gt; I&#39;m not sure whether it&#39;s causing your issue, but I would make the<br>
&gt;&gt; constraints reflect the logical relationships better.<br>
&gt;&gt;<br>
&gt;&gt; For example, network-services only needs to be colocated with<br>
&gt;&gt; mail-services logically; it&#39;s mail-services that needs to be with<br>
&gt;&gt; fs-services, and fs-services that needs to be with<br>
&gt;&gt; spool-clone/mail-clone master. In other words, don&#39;t make the<br>
&gt;&gt; highest-level resource depend on everything else, make each level depend<br>
&gt;&gt; on the level below it.<br>
&gt;&gt;<br>
&gt;&gt; Also, I would guess that the virtual IP only needs to be ordered before<br>
&gt;&gt; mail-services, and mail-clone and spool-clone could both be ordered<br>
&gt;&gt; before fs-services, rather than ordering mail-clone before spool-clone.<br>
&gt;&gt;<br>
&gt;&gt;&gt; Resources Defaults:<br>
&gt;&gt;&gt;  migration-threshold: 3<br>
&gt;&gt;&gt; Operations Defaults:<br>
&gt;&gt;&gt;  on-fail: restart<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Cluster Properties:<br>
&gt;&gt;&gt;  cluster-infrastructure: corosync<br>
&gt;&gt;&gt;  cluster-name: mailcluster<br>
&gt;&gt;&gt;  cluster-recheck-interval: 5min<br>
&gt;&gt;&gt;  dc-version: 1.1.13-10.el7_2.2-44eb2dd<br>
&gt;&gt;&gt;  default-resource-stickiness: infinity<br>
&gt;&gt;&gt;  have-watchdog: false<br>
&gt;&gt;&gt;  last-lrm-refresh: 1457613674<br>
&gt;&gt;&gt;  no-quorum-policy: ignore<br>
&gt;&gt;&gt;  pe-error-series-max: 1024<br>
&gt;&gt;&gt;  pe-input-series-max: 1024<br>
&gt;&gt;&gt;  pe-warn-series-max: 1024<br>
&gt;&gt;&gt;  stonith-enabled: false<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.15 2<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.16 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=16<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;postfix&#39;]/lrm_rsc_op[@id=&#39;postfix_last_failure_0&#39;]:<br>
&gt;&gt;&gt;  @transition-key=4:1234:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @transition-magic=0:7;4:1234:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @call-id=1274, @last-rc-change=1457613440<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; abort_transition_graph:       Transition aborted by postfix_monitor_45000<br>
&gt;&gt;&gt; &#39;modify&#39; on mail1: Inactive graph<br>
&gt;&gt;&gt; (magic=0:7;4:1234:0:ae755a85-c250-498f-9c94-ddd8a7e2788a, cib=0.197.16,<br>
&gt;&gt;&gt; source=process_graph_event:598, 1)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; update_failcount:     Updating failcount for postfix on mail1 after<br>
&gt;&gt; failed<br>
&gt;&gt;&gt; monitor: rc=7 (update=value++, time=1457613440)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_client_update:  Expanded fail-count-postfix=value++ to 3<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail1/crmd/196, version=0.197.16)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_peer_update:    Setting fail-count-postfix[mail1]: 2 -&gt; 3 from<br>
&gt;&gt; mail2<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; write_attribute:      Sent update 400 with 2 changes for<br>
&gt;&gt;&gt; fail-count-postfix, id=&lt;n/a&gt;, set=(null)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Forwarding cib_modify operation for section status<br>
&gt;&gt; to<br>
&gt;&gt;&gt; master (origin=local/attrd/400)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; process_graph_event:  Detected action (1234.4)<br>
&gt;&gt;&gt; postfix_monitor_45000.1274=not running: failed<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_peer_update:    Setting last-failure-postfix[mail1]: 1457613347 -&gt;<br>
&gt;&gt;&gt; 1457613440 from mail2<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; do_state_transition:  State transition S_IDLE -&gt; S_POLICY_ENGINE [<br>
&gt;&gt;&gt; input=I_PE_CALC cause=C_FSA_INTERNAL origin=abort_transition_graph ]<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; write_attribute:      Sent update 401 with 2 changes for<br>
&gt;&gt;&gt; last-failure-postfix, id=&lt;n/a&gt;, set=(null)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.16 2<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.17 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=17<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]/nvpair[@id=&#39;status-1-fail-count-postfix&#39;]:<br>
&gt;&gt;&gt;  @value=3<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail2/attrd/400, version=0.197.17)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; abort_transition_graph:       Transition aborted by<br>
&gt;&gt;&gt; status-1-fail-count-postfix, fail-count-postfix=3: Transient attribute<br>
&gt;&gt;&gt; change (modify cib=0.197.17, source=abort_unless_down:319,<br>
&gt;&gt;&gt;<br>
&gt;&gt; path=/cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]/nvpair[@id=&#39;status-1-fail-count-postfix&#39;],<br>
&gt;&gt;&gt; 1)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_cib_callback:   Update 400 for fail-count-postfix: OK (0)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_cib_callback:   Update 400 for fail-count-postfix[mail1]=3: OK (0)<br>
&gt;&gt;&gt; Mar 10 13:37:20 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_cib_callback:   Update 400 for fail-count-postfix[mail2]=(null): OK<br>
&gt;&gt;&gt; (0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Forwarding cib_modify operation for section status<br>
&gt;&gt; to<br>
&gt;&gt;&gt; master (origin=local/attrd/401)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.17 2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.18 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=18<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]/nvpair[@id=&#39;status-1-last-failure-postfix&#39;]:<br>
&gt;&gt;&gt;  @value=1457613440<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail2/attrd/401, version=0.197.18)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_cib_callback:   Update 401 for last-failure-postfix: OK (0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_cib_callback:   Update 401 for<br>
&gt;&gt;&gt; last-failure-postfix[mail1]=1457613440: OK (0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7418] HWJ-626.domain.local      attrd:     info:<br>
&gt;&gt;&gt; attrd_cib_callback:   Update 401 for<br>
&gt;&gt;&gt; last-failure-postfix[mail2]=1457610376: OK (0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; abort_transition_graph:       Transition aborted by<br>
&gt;&gt;&gt; status-1-last-failure-postfix, last-failure-postfix=1457613440: Transient<br>
&gt;&gt;&gt; attribute change (modify cib=0.197.18, source=abort_unless_down:319,<br>
&gt;&gt;&gt;<br>
&gt;&gt; path=/cib/status/node_state[@id=&#39;1&#39;]/transient_attributes[@id=&#39;1&#39;]/instance_attributes[@id=&#39;status-1&#39;]/nvpair[@id=&#39;status-1-last-failure-postfix&#39;],<br>
&gt;&gt;&gt; 1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; unpack_config:        On loss of CCM Quorum: Ignore<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_online_status:      Node mail1 is online<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_online_status:      Node mail2 is online<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource mail:0 active in<br>
&gt;&gt;&gt; master mode on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource spool:0 active in<br>
&gt;&gt;&gt; master mode on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource fs-spool active on<br>
&gt;&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource fs-mail active on<br>
&gt;&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt;&gt;&gt; unpack_rsc_op_failure:        Processing failed op monitor for postfix on<br>
&gt;&gt;&gt; mail1: not running (7)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource spool:1 active in<br>
&gt;&gt;&gt; master mode on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource mail:1 active in<br>
&gt;&gt;&gt; master mode on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; group_print:   Resource Group: network-services<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      virtualip-1        (ocf::heartbeat:IPaddr2):<br>
&gt;&gt;  Started<br>
&gt;&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; clone_print:   Master/Slave Set: spool-clone [spool]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Masters: [ mail1 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Slaves: [ mail2 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; clone_print:   Master/Slave Set: mail-clone [mail]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Masters: [ mail1 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Slaves: [ mail2 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; group_print:   Resource Group: fs-services<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      fs-spool   (ocf::heartbeat:Filesystem):    Started<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      fs-mail    (ocf::heartbeat:Filesystem):    Started<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; group_print:   Resource Group: mail-services<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      postfix    (ocf::heartbeat:postfix):       FAILED<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; get_failcount_full:   postfix has failed 3 times on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt;&gt;&gt; common_apply_stickiness:      Forcing postfix away from mail1 after 3<br>
&gt;&gt;&gt; failures (max=3)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: Promoting mail:0 (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: mail-clone: Promoted 1 instances of a possible 1 to master<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: Promoting spool:0 (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: spool-clone: Promoted 1 instances of a possible 1 to master<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; rsc_merge_weights:    postfix: Rolling back scores from virtualip-1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_color: Resource virtualip-1 cannot run anywhere<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; RecurringOp:   Start recurring monitor (45s) for postfix on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    virtualip-1     (mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   spool:0 (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   spool:1 (Slave mail2)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   mail:0  (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   mail:1  (Slave mail2)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    fs-spool        (Started mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    fs-mail (Started mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    postfix (Started mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; process_pe_message:   Calculated Transition 1235:<br>
&gt;&gt;&gt; /var/lib/pacemaker/pengine/pe-input-302.bz2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; handle_response:      pe_calc calculation pe_calc-dc-1457613441-3756 is<br>
&gt;&gt;&gt; obsolete<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; unpack_config:        On loss of CCM Quorum: Ignore<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_online_status:      Node mail1 is online<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_online_status:      Node mail2 is online<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource mail:0 active in<br>
&gt;&gt;&gt; master mode on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource spool:0 active in<br>
&gt;&gt;&gt; master mode on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource fs-spool active on<br>
&gt;&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource fs-mail active on<br>
&gt;&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt;&gt;&gt; unpack_rsc_op_failure:        Processing failed op monitor for postfix on<br>
&gt;&gt;&gt; mail1: not running (7)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource spool:1 active in<br>
&gt;&gt;&gt; master mode on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; determine_op_status:  Operation monitor found resource mail:1 active in<br>
&gt;&gt;&gt; master mode on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; group_print:   Resource Group: network-services<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      virtualip-1        (ocf::heartbeat:IPaddr2):<br>
&gt;&gt;  Started<br>
&gt;&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; clone_print:   Master/Slave Set: spool-clone [spool]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Masters: [ mail1 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Slaves: [ mail2 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; clone_print:   Master/Slave Set: mail-clone [mail]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Masters: [ mail1 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; short_print:       Slaves: [ mail2 ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; group_print:   Resource Group: fs-services<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      fs-spool   (ocf::heartbeat:Filesystem):    Started<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      fs-mail    (ocf::heartbeat:Filesystem):    Started<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; group_print:   Resource Group: mail-services<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_print:      postfix    (ocf::heartbeat:postfix):       FAILED<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; get_failcount_full:   postfix has failed 3 times on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:  warning:<br>
&gt;&gt;&gt; common_apply_stickiness:      Forcing postfix away from mail1 after 3<br>
&gt;&gt;&gt; failures (max=3)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: Promoting mail:0 (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: mail-clone: Promoted 1 instances of a possible 1 to master<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: Promoting spool:0 (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; master_color: spool-clone: Promoted 1 instances of a possible 1 to master<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; rsc_merge_weights:    postfix: Rolling back scores from virtualip-1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; native_color: Resource virtualip-1 cannot run anywhere<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; RecurringOp:   Start recurring monitor (45s) for postfix on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    virtualip-1     (mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   spool:0 (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   spool:1 (Slave mail2)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   mail:0  (Master mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:     info:<br>
&gt;&gt;&gt; LogActions:   Leave   mail:1  (Slave mail2)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    fs-spool        (Started mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    fs-mail (Started mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; LogActions:   Stop    postfix (Started mail1)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; do_state_transition:  State transition S_POLICY_ENGINE -&gt;<br>
&gt;&gt;&gt; S_TRANSITION_ENGINE [ input=I_PE_SUCCESS cause=C_IPC_MESSAGE<br>
&gt;&gt;&gt; origin=handle_response ]<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7419] HWJ-626.domain.local    pengine:   notice:<br>
&gt;&gt;&gt; process_pe_message:   Calculated Transition 1236:<br>
&gt;&gt;&gt; /var/lib/pacemaker/pengine/pe-input-303.bz2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; do_te_invoke: Processing graph 1236 (ref=pe_calc-dc-1457613441-3757)<br>
&gt;&gt;&gt; derived from /var/lib/pacemaker/pengine/pe-input-303.bz2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; te_rsc_command:       Initiating action 12: stop virtualip-1_stop_0 on<br>
&gt;&gt; mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; te_rsc_command:       Initiating action 5: stop postfix_stop_0 on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.18 2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.19 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=19<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;virtualip-1&#39;]/lrm_rsc_op[@id=&#39;virtualip-1_last_0&#39;]:<br>
&gt;&gt;&gt;  @operation_key=virtualip-1_stop_0, @operation=stop,<br>
&gt;&gt;&gt; @transition-key=12:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @transition-magic=0:0;12:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @call-id=1276, @last-run=1457613441, @last-rc-change=1457613441,<br>
&gt;&gt;&gt; @exec-time=66<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail1/crmd/197, version=0.197.19)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; match_graph_event:    Action virtualip-1_stop_0 (12) confirmed on mail1<br>
&gt;&gt;&gt; (rc=0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.19 2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.20 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=20<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;postfix&#39;]/lrm_rsc_op[@id=&#39;postfix_last_0&#39;]:<br>
&gt;&gt;&gt;  @operation_key=postfix_stop_0, @operation=stop,<br>
&gt;&gt;&gt; @transition-key=5:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @transition-magic=0:0;5:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @call-id=1278, @last-run=1457613441, @last-rc-change=1457613441,<br>
&gt;&gt;&gt; @exec-time=476<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; match_graph_event:    Action postfix_stop_0 (5) confirmed on mail1 (rc=0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; te_rsc_command:       Initiating action 79: stop fs-mail_stop_0 on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail1/crmd/198, version=0.197.20)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.20 2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.21 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=21<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;fs-mail&#39;]/lrm_rsc_op[@id=&#39;fs-mail_last_0&#39;]:<br>
&gt;&gt;&gt;  @operation_key=fs-mail_stop_0, @operation=stop,<br>
&gt;&gt;&gt; @transition-key=79:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @transition-magic=0:0;79:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @call-id=1280, @last-run=1457613441, @last-rc-change=1457613441,<br>
&gt;&gt;&gt; @exec-time=88, @queue-time=1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail1/crmd/199, version=0.197.21)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; match_graph_event:    Action fs-mail_stop_0 (79) confirmed on mail1<br>
&gt;&gt; (rc=0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; te_rsc_command:       Initiating action 77: stop fs-spool_stop_0 on mail1<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: --- 0.197.21 2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       Diff: +++ 0.197.22 (null)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +  /cib:  @num_updates=22<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_perform_op:       +<br>
&gt;&gt;&gt;<br>
&gt;&gt; /cib/status/node_state[@id=&#39;1&#39;]/lrm[@id=&#39;1&#39;]/lrm_resources/lrm_resource[@id=&#39;fs-spool&#39;]/lrm_rsc_op[@id=&#39;fs-spool_last_0&#39;]:<br>
&gt;&gt;&gt;  @operation_key=fs-spool_stop_0, @operation=stop,<br>
&gt;&gt;&gt; @transition-key=77:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @transition-magic=0:0;77:1236:0:ae755a85-c250-498f-9c94-ddd8a7e2788a,<br>
&gt;&gt;&gt; @call-id=1282, @last-run=1457613441, @last-rc-change=1457613441,<br>
&gt;&gt;&gt; @exec-time=86<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_request:  Completed cib_modify operation for section status:<br>
&gt;&gt; OK<br>
&gt;&gt;&gt; (rc=0, origin=mail1/crmd/200, version=0.197.22)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info:<br>
&gt;&gt;&gt; match_graph_event:    Action fs-spool_stop_0 (77) confirmed on mail1<br>
&gt;&gt; (rc=0)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:  warning:<br>
&gt;&gt;&gt; run_graph:    Transition 1236 (Complete=11, Pending=0, Fired=0,<br>
&gt;&gt; Skipped=0,<br>
&gt;&gt;&gt; Incomplete=1, Source=/var/lib/pacemaker/pengine/pe-input-303.bz2):<br>
&gt;&gt;&gt; Terminated<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:  warning:<br>
&gt;&gt;&gt; te_graph_trigger:     Transition failed: terminated<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_graph:  Graph 1236 with 12 actions: batch-limit=12 jobs,<br>
&gt;&gt;&gt; network-delay=0ms<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   16]: Completed pseudo op<br>
&gt;&gt;&gt; network-services_stopped_0     on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   15]: Completed pseudo op<br>
&gt;&gt;&gt; network-services_stop_0        on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   12]: Completed rsc op virtualip-1_stop_0<br>
&gt;&gt;&gt;              on mail1 (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   84]: Completed pseudo op<br>
&gt;&gt;&gt; fs-services_stopped_0          on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   83]: Completed pseudo op<br>
&gt;&gt; fs-services_stop_0<br>
&gt;&gt;&gt;             on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   77]: Completed rsc op fs-spool_stop_0<br>
&gt;&gt;&gt;             on mail1 (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   79]: Completed rsc op fs-mail_stop_0<br>
&gt;&gt;&gt;              on mail1 (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   90]: Completed pseudo op<br>
&gt;&gt;&gt; mail-services_stopped_0        on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   89]: Completed pseudo op<br>
&gt;&gt;&gt; mail-services_stop_0           on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action   86]: Pending rsc op postfix_monitor_45000<br>
&gt;&gt;&gt;             on mail2 (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:         * [Input 85]: Unresolved dependency rsc op<br>
&gt;&gt;&gt; postfix_start_0 on mail2<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action    5]: Completed rsc op postfix_stop_0<br>
&gt;&gt;&gt;              on mail1 (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; print_synapse:        [Action    8]: Completed pseudo op all_stopped<br>
&gt;&gt;&gt;              on N/A (priority: 0, waiting: none)<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:     info: do_log:<br>
&gt;&gt;&gt;     FSA: Input I_TE_SUCCESS from notify_crmd() received in state<br>
&gt;&gt;&gt; S_TRANSITION_ENGINE<br>
&gt;&gt;&gt; Mar 10 13:37:21 [7420] HWJ-626.domain.local       crmd:   notice:<br>
&gt;&gt;&gt; do_state_transition:  State transition S_TRANSITION_ENGINE -&gt; S_IDLE [<br>
&gt;&gt;&gt; input=I_TE_SUCCESS cause=C_FSA_INTERNAL origin=notify_crmd ]<br>
&gt;&gt;&gt; Mar 10 13:37:26 [7415] HWJ-626.domain.local        cib:     info:<br>
&gt;&gt;&gt; cib_process_ping:     Reporting our current digest to mail2:<br>
&gt;&gt;&gt; 3896ee29cdb6ba128330b0ef6e41bd79 for 0.197.22 (0x1544a30 0)<br>
<br>
</blockquote></div><br></div>