<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body>
    <div class="moz-cite-prefix">On 6/19/20 12:13 AM, Howard wrote:<br>
    </div>
    <blockquote type="cite"
cite="mid:CAO51vj7RniJZ60kAkmcgqZTouBjBwgkaKDqDnqSvh32+JDbd7Q@mail.gmail.com">
      <meta http-equiv="content-type" content="text/html; charset=UTF-8">
      <div dir="ltr">
        <div>Thanks for all the help so far.  With your assistance, I'm
          very close to stable.</div>
        <div><br>
        </div>
        <div>Made the following changes to the vmfence stonith resource:</div>
        <div>  </div>
        <div>Meta Attrs: failure-timeout=30m migration-threshold=10<br>
            Operations: monitor interval=60s
          (vmfence-monitor-interval-60s)<br>
        </div>
        <div><br>
        </div>
        <div>If I understand this correctly, it will check if the
          fencing device is online every 60 seconds. It will try 10
          times and then mark the node ineligible.  After 30 minutes it
          will start trying again.</div>
      </div>
      <br>
      <div class="gmail_quote">
        <div dir="ltr" class="gmail_attr">On Thu, Jun 18, 2020 at 12:29
          PM Ken Gaillot <<a href="mailto:kgaillot@redhat.com"
            moz-do-not-send="true">kgaillot@redhat.com</a>> wrote:<br>
        </div>
        <blockquote class="gmail_quote" style="margin:0px 0px 0px
          0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On
          Thu, 2020-06-18 at 21:32 +0300, Andrei Borzenkov wrote:<br>
          > 18.06.2020 18:24, Ken Gaillot пишет:<br>
          > > Note that a failed start of a stonith device will
          not prevent the<br>
          > > cluster from using that device for fencing. It just
          prevents the<br>
          > > cluster from monitoring the device.<br>
          > > <br>
          > <br>
          > My understanding is that if stonith resource cannot run
          anywhere, it<br>
          > also won't be used for stonith. When failcount exceeds
          threshold,<br>
          > resource is banned from node. If it happens on all nodes,
          resource<br>
          > cannot run anywhere and so won't be used for stonith.
          Start failure<br>
          > automatically sets failcount to INFINITY.<br>
          > <br>
          > Or do I misunderstand something?<br>
          <br>
          I had to test to confirm, but a stonith resource stopped due
          to<br>
          failures can indeed be used. Only stonith resources stopped
          via<br>
          location constraints (bans) or target-role=Stopped are
          prevented from<br>
          being used.<br>
        </blockquote>
      </div>
    </blockquote>
    Unfortunately this could be a bit tricky to test as fenced updates<br>
    the device-list on configuration changes but scores as well
    influence<br>
    if a device is taken into that list.<br>
    So there is as well a possible dependency on when the device-list
    has been<br>
    updated most recently.<br>
    Don't know if it is relevant for this config but unfortunately
    something<br>
    to have in the back of one's mind in case of more complex fencing<br>
    setups.<br>
    An uglyness that is known for a long time but there is no easy way<br>
    to solve the issue without loosing part of the independence and with<br>
    that robustness of the fencing subsystem.<br>
    <br>
    Klaus<br>
    <blockquote type="cite"
cite="mid:CAO51vj7RniJZ60kAkmcgqZTouBjBwgkaKDqDnqSvh32+JDbd7Q@mail.gmail.com">
      <div class="gmail_quote">
        <blockquote class="gmail_quote" style="margin:0px 0px 0px
          0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
          -- <br>
          Ken Gaillot <<a href="mailto:kgaillot@redhat.com"
            target="_blank" moz-do-not-send="true">kgaillot@redhat.com</a>><br>
          <br>
          _______________________________________________<br>
          Manage your subscription:<br>
          <a href="https://lists.clusterlabs.org/mailman/listinfo/users"
            rel="noreferrer" target="_blank" moz-do-not-send="true">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
          <br>
          ClusterLabs home: <a href="https://www.clusterlabs.org/"
            rel="noreferrer" target="_blank" moz-do-not-send="true">https://www.clusterlabs.org/</a><br>
        </blockquote>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <pre class="moz-quote-pre" wrap="">_______________________________________________
Manage your subscription:
<a class="moz-txt-link-freetext" href="https://lists.clusterlabs.org/mailman/listinfo/users">https://lists.clusterlabs.org/mailman/listinfo/users</a>

ClusterLabs home: <a class="moz-txt-link-freetext" href="https://www.clusterlabs.org/">https://www.clusterlabs.org/</a>
</pre>
    </blockquote>
    <br>
  </body>
</html>