<html><body><p>Hi all... <br><br>Just a quick follow-up. <br><br>Thought I should come clean and share with you that the incorrect &quot;migrate-to&quot; operation name defined in my VirtualDomain<br>resource was my mistake.  It was mis-coded in the virtual guest provisioning script.  I have since changed it to &quot;migrate_to&quot; <br>and of course, the specified live migration timeout value is working effectively now.  (For some reason, I assumed we were letting that<br>operation meta value default). <br><br>I was wondering if someone could refer me to the definitive online link for pacemaker resource man pages?  I don't see any resource man pages installed<br>on my system anywhere.   I found this one online:  <a href="https://www.mankier.com/7/ocf_heartbeat_VirtualDomain">https://www.mankier.com/7/ocf_heartbeat_VirtualDomain</a>  but is there a more 'official' page I should refer our<br>Linux KVM on System z customers to? <br><br>Thanks again for your assistance. <br><br>Scott Greenlese ...<tt>IBM KVM on System Z Solution Test</tt> Poughkeepsie, N.Y.<br>  INTERNET:  swgreenl@us.ibm.com  <br><br><br><img width="16" height="16" src="cid:1__=8FBB0A29DFC20B778f9e8a93df938690918c8FB@" border="0" alt="Inactive hide details for &quot;Ulrich Windl&quot; ---01/27/2017 02:32:43 AM---&gt;&gt;&gt; &quot;Scott Greenlese&quot; &lt;swgreenl@us.ibm.com&gt; schrieb am 27."><font color="#424282">&quot;Ulrich Windl&quot; ---01/27/2017 02:32:43 AM---&gt;&gt;&gt; &quot;Scott Greenlese&quot; &lt;swgreenl@us.ibm.com&gt; schrieb am 27.01.2017 um 02:47 in Nachricht</font><br><br><font size="2" color="#5F5F5F">From:        </font><font size="2">&quot;Ulrich Windl&quot; &lt;Ulrich.Windl@rz.uni-regensburg.de&gt;</font><br><font size="2" color="#5F5F5F">To:        </font><font size="2">&lt;users@clusterlabs.org&gt;, Scott Greenlese/Poughkeepsie/IBM@IBMUS</font><br><font size="2" color="#5F5F5F">Cc:        </font><font size="2">&quot;Si Bo Niu&quot; &lt;niusibo@cn.ibm.com&gt;, Michael Tebolt/Poughkeepsie/IBM@IBMUS</font><br><font size="2" color="#5F5F5F">Date:        </font><font size="2">01/27/2017 02:32 AM</font><br><font size="2" color="#5F5F5F">Subject:        </font><font size="2">Antw: Re: [ClusterLabs] Antw: Re: Live Guest Migration timeouts for VirtualDomain resources</font><br><hr width="100%" size="2" align="left" noshade style="color:#8091A5; "><br><br><br><tt>&gt;&gt;&gt; &quot;Scott Greenlese&quot; &lt;swgreenl@us.ibm.com&gt; schrieb am 27.01.2017 um 02:47 in<br>Nachricht<br>&lt;OF63CD0E10.D58C4C3D-ON002580B5.0005C410-852580B5.0009DBDE@notes.na.collabserv.c <br>m&gt;:<br><br>&gt; Hi guys..<br>&gt; <br>&gt; Well, today I confirmed that what Ulrich said is correct. &nbsp;If I update the<br>&gt; VirtualDomain resource with the operation name &nbsp;&quot;migrate_to&quot; instead of<br>&gt; &quot;migrate-to&quot;, &nbsp;it effectively overrides and enforces the 1200ms default<br>&gt; value to the new value.<br>&gt; <br>&gt; I am wondering how I would have known that I was using the wrong operation<br>&gt; name, when the initial operation name is already incorrect<br>&gt; when the resource is created?<br><br>For SLES 11, I made a quick (portable non-portable unstable) try (print the operations known to an RA):<br> # crm ra info VirtualDomain |sed -n -e &quot;/Operations' defaults/,\$p&quot;<br>Operations' defaults (advisory minimum):<br><br> &nbsp; &nbsp;start &nbsp; &nbsp; &nbsp; &nbsp; timeout=90<br> &nbsp; &nbsp;stop &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;timeout=90<br> &nbsp; &nbsp;status &nbsp; &nbsp; &nbsp; &nbsp;timeout=30 interval=10<br> &nbsp; &nbsp;monitor &nbsp; &nbsp; &nbsp; timeout=30 interval=10<br> &nbsp; &nbsp;migrate_from &nbsp;timeout=60<br> &nbsp; &nbsp;migrate_to &nbsp; &nbsp;timeout=120<br><br>Regards,<br>Ulrich<br><br>&gt; <br>&gt; This is what the meta data for my resource looked like after making the<br>&gt; update:<br>&gt; <br>&gt; [root@zs95kj VD]# date;pcs resource update zs95kjg110065_res op migrate_to<br>&gt; timeout=&quot;360s&quot;<br>&gt; Thu Jan 26 16:43:11 EST 2017<br>&gt; You have new mail in /var/spool/mail/root<br>&gt; <br>&gt; [root@zs95kj VD]# date;pcs resource show zs95kjg110065_res<br>&gt; Thu Jan 26 16:43:46 EST 2017<br>&gt; &nbsp;Resource: zs95kjg110065_res (class=ocf provider=heartbeat<br>&gt; type=VirtualDomain)<br>&gt; &nbsp; Attributes: config=/guestxml/nfs1/zs95kjg110065.xml<br>&gt; hypervisor=qemu:///system migration_transport=ssh<br>&gt; &nbsp; Meta Attrs: allow-migrate=true<br>&gt; &nbsp; Operations: start interval=0s timeout=120<br>&gt; (zs95kjg110065_res-start-interval-0s)<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; stop interval=0s timeout=120<br>&gt; (zs95kjg110065_res-stop-interval-0s)<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; monitor interval=30s (zs95kjg110065_res-monitor-interval-30s)<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; migrate-from interval=0s timeout=1200<br>&gt; (zs95kjg110065_res-migrate-from-interval-0s)<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; migrate-to interval=0s timeout=1200<br>&gt; (zs95kjg110065_res-migrate-to-interval-0s) &nbsp; &lt;&lt;&lt; Original op name / value<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; migrate_to interval=0s timeout=360s<br>&gt; (zs95kjg110065_res-migrate_to-interval-0s) &nbsp;&lt;&lt;&lt; New op name / value<br>&gt; <br>&gt; <br>&gt; Where does that original op name come from in the VirtualDomain resource<br>&gt; definition? &nbsp;How can we get the initial meta value changed and shipped with<br>&gt; a valid operation name (i.e. migrate_to), and<br>&gt; maybe a more reasonable migrate_to timeout value... something significantly<br>&gt; higher than 1200ms , i.e. 1.2 seconds ? &nbsp;Can I report this request as a<br>&gt; bugzilla on the RHEL side, or should this go to my internal IBM bugzilla<br>&gt; for KVM on System Z development?<br>&gt; <br>&gt; Anyway, thanks so much for identifying my issue. &nbsp;I can reconfigure my<br>&gt; resources to make them tolerate longer migration execution times.<br>&gt; <br>&gt; <br>&gt; Scott Greenlese ... IBM KVM on System Z Solution Test<br>&gt; &nbsp; INTERNET: &nbsp;swgreenl@us.ibm.com <br>&gt; <br>&gt; <br>&gt; <br>&gt; <br>&gt; From:                 Ken Gaillot &lt;kgaillot@redhat.com&gt;<br>&gt; To:                 Ulrich Windl &lt;Ulrich.Windl@rz.uni-regensburg.de&gt;,<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; users@clusterlabs.org <br>&gt; Date:                 01/19/2017 10:26 AM<br>&gt; Subject:                 Re: [ClusterLabs] Antw: Re: Live Guest Migration timeouts for<br>&gt; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; VirtualDomain resources<br>&gt; <br>&gt; <br>&gt; <br>&gt; On 01/19/2017 01:36 AM, Ulrich Windl wrote:<br>&gt;&gt;&gt;&gt;&gt; Ken Gaillot &lt;kgaillot@redhat.com&gt; schrieb am 18.01.2017 um 16:32 in<br>&gt; Nachricht<br>&gt;&gt; &lt;4b02d3fa-4693-473b-8bed-dc98f9e3f3f3@redhat.com&gt;:<br>&gt;&gt;&gt; On 01/17/2017 04:45 PM, Scott Greenlese wrote:<br>&gt;&gt;&gt;&gt; Ken and Co,<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Thanks for the useful information.<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;<br>&gt;&gt; [...]<br>&gt;&gt;&gt;&gt;<br>&gt;&gt;&gt;&gt; Is this internally coded within the class=ocf provider=heartbeat<br>&gt;&gt;&gt;&gt; type=VirtualDomain resource agent?<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; Aha, I just realized what the issue is: the operation name is<br>&gt;&gt;&gt; migrate_to, not migrate-to.<br>&gt;&gt;&gt;<br>&gt;&gt;&gt; For technical reasons, pacemaker can't validate operation names (at the<br>&gt;&gt;&gt; time that the configuration is edited, it does not necessarily have<br>&gt;&gt;&gt; access to the agent metadata).<br>&gt;&gt;<br>&gt;&gt; BUT the set of operations is finite, right? So if those were in some XML<br>&gt; schema, the names could be verified at least (not meaning that the<br>&gt; operation is actually supported).<br>&gt;&gt; BTW: Would a &quot;crm configure verify&quot; detect this kijnd of problem?<br>&gt;&gt;<br>&gt;&gt; [...]<br>&gt;&gt;<br>&gt;&gt; Ulrich<br>&gt; <br>&gt; Yes, it's in the resource agent meta-data. While pacemaker itself uses a<br>&gt; small set of well-defined actions, the agent may define any arbitrarily<br>&gt; named actions it desires, and the user could configure one of these as a<br>&gt; recurring action in pacemaker.<br>&gt; <br>&gt; Pacemaker itself has to be liberal about where its configuration comes<br>&gt; from -- the configuration can be edited on a separate machine, which<br>&gt; doesn't have resource agents, and then uploaded to the cluster. So<br>&gt; Pacemaker can't do that validation at configuration time. (It could<br>&gt; theoretically do some checking after the fact when the configuration is<br>&gt; loaded, but this could be a lot of overhead, and there are<br>&gt; implementation issues at the moment.)<br>&gt; <br>&gt; Higher-level tools like crmsh and pcs, on the other hand, can make<br>&gt; simplifying assumptions. They can require access to the resource agents<br>&gt; so that they can do extra validation.<br>&gt; <br>&gt; _______________________________________________<br>&gt; Users mailing list: Users@clusterlabs.org <br>&gt; </tt><tt><a href="http://lists.clusterlabs.org/mailman/listinfo/users">http://lists.clusterlabs.org/mailman/listinfo/users</a></tt><tt>&nbsp;<br>&gt; <br>&gt; Project Home: </tt><tt><a href="http://www.clusterlabs.org">http://www.clusterlabs.org</a></tt><tt>&nbsp;<br>&gt; Getting started: </tt><tt><a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a></tt><tt>&nbsp;<br>&gt; Bugs: </tt><tt><a href="http://bugs.clusterlabs.org">http://bugs.clusterlabs.org</a></tt><tt>&nbsp;<br><br><br><br></tt><br><br><BR>
</body></html>