<div dir="auto">Petr,<div dir="auto"><br></div><div dir="auto">Thank you very much for your help.   I will follow your advice and report my findings to the list.</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Jul 10, 2019, 4:47 AM Petr Mensik <<a href="mailto:pemensik@redhat.com">pemensik@redhat.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello Alex,<br>
<br>
I would try removing all-servers and clear-on-reload statements away. I<br>
would use just one server for testing, retesting all of them for the<br>
same behaviour. When you do not know which server is used, it is hard to<br>
debug better.<br>
<br>
I think dots in server=/.X/ are not necessary and maybe even misleading.<br>
Try it without them, just server=/X/ip<br>
<br>
I think one second timeout is too short. Just use only localhost in<br>
/etc/resolv.conf and debug what happens with dnsmasq. Record what<br>
queries are sent to dnsmasq and what dnsmasq forwards to configured servers.<br>
<br>
Note I discovered already requests without recursion desired bit set are<br>
forwarded always, do not serve any local records. But that should not be<br>
the issue. Try dig +rec and dig +norec to rule it out.<br>
<br>
Regards,<br>
Petr<br>
<br>
On 7/7/19 10:28 PM, Alex Litvak wrote:<br>
> (luck of sleep, fixing some mistakes in text)<br>
> <br>
> Hello everyone,<br>
> <br>
> I run consul services on my network where services are registered with<br>
> <xyz>.service.consul when they start.  All containers and bare metal<br>
> hosts are running dnsmasq 2.80.<br>
> I noticed that if I restart one of the containers, one of the hosts<br>
> continue failing to resolve the service name.  I assume that dnsmasq is<br>
> a culprit because:<br>
> <br>
> 1. I can resolve service xyz.service.consul against standard dns servers<br>
> with dig.<br>
> 2. Dnsmasq listening on 127.0.0.1 is the first line in the resolve.conf<br>
> and when I run tcpdump against port 53 on interface lo I see it returns<br>
> NXDOMAIN on each A record query for service in question.<br>
> 3. If I restart dnsmasq everything is back to normal again.  Even more<br>
> weird, if I send SIGHUP to dnsmasq, which only causes a reread of<br>
> /etc/hosts file, everything is back to normal as far as service<br>
> resolution goes.<br>
> <br>
> I have this problem only happening  on some hosts without the pattern I<br>
> can recognize.  For example I have two nodes with the same config, os,<br>
> kernel version, dnsmasq version, etc ... and one of them has the problem<br>
> 100% after service xyz.service.consul restart and the other is not.<br>
> <br>
> Where do I start troubleshooting? Any ideas are welcome.<br>
> <br>
> Here is a standard dnsmasq confugration.<br>
> <br>
> port=53<br>
> domain-needed<br>
> bogus-priv<br>
> interface=lo<br>
> listen-address=127.0.0.1<br>
> no-dhcp-interface=127.0.0.1<br>
> #bind-interfaces<br>
> no-resolv<br>
> all-servers<br>
> dns-forward-max=500<br>
> <br>
> # If you don't want dnsmasq to read /etc/hosts, uncomment the<br>
> # following line.<br>
> #no-hosts<br>
> # or if you want it to read another file, as well as /etc/hosts, use<br>
> # this.<br>
> #addn-hosts=/etc/banner_add_hosts<br>
> <br>
> #log-queries=extra<br>
> #log-facility=/var/log/dnsmasq.log<br>
> log-async=25<br>
> <br>
> # Set the cachesize here.<br>
> cache-size=10000<br>
> min-cache-ttl=5<br>
> #neg-ttl=3600<br>
> <br>
> # If you want to disable negative caching, uncomment this.<br>
> #no-negcache<br>
> <br>
> # For debugging purposes, log each DNS query as it passes through<br>
> # dnsmasq.<br>
> #log-queries<br>
> clear-on-reload<br>
> <br>
> server=10.0.48.12<br>
> server=10.0.48.11<br>
> server=10.0.21.63<br>
> server=10.0.21.61<br>
> <br>
> server=/.la.consul/<a href="http://10.0.73.43" rel="noreferrer noreferrer" target="_blank">10.0.73.43</a><br>
> server=/.la.consul/<a href="http://10.0.73.40" rel="noreferrer noreferrer" target="_blank">10.0.73.40</a><br>
> server=/.la.consul/<a href="http://10.0.73.28" rel="noreferrer noreferrer" target="_blank">10.0.73.28</a><br>
> server=/.chi-pbx.consul/<a href="http://10.1.73.1" rel="noreferrer noreferrer" target="_blank">10.1.73.1</a><br>
> server=/.chi-pbx.consul/<a href="http://10.1.73.2" rel="noreferrer noreferrer" target="_blank">10.1.73.2</a><br>
> server=/.chi-pbx.consul/<a href="http://10.1.73.3" rel="noreferrer noreferrer" target="_blank">10.1.73.3</a><br>
> server=/.consul/<a href="http://10.0.73.43" rel="noreferrer noreferrer" target="_blank">10.0.73.43</a><br>
> server=/.consul/<a href="http://10.0.73.40" rel="noreferrer noreferrer" target="_blank">10.0.73.40</a><br>
> server=/.consul/<a href="http://10.0.73.28" rel="noreferrer noreferrer" target="_blank">10.0.73.28</a><br>
> <br>
> Resolver config<br>
> <br>
> search ''<br>
> options  timeout:1 attempts:1<br>
> nameserver 127.0.0.1<br>
> nameserver 10.0.48.11<br>
> nameserver 10.0.48.12<br>
> nameserver 10.0.21.63<br>
> <br>
> <br>
> <br>
> _______________________________________________<br>
> Dnsmasq-discuss mailing list<br>
> <a href="mailto:Dnsmasq-discuss@lists.thekelleys.org.uk" target="_blank" rel="noreferrer">Dnsmasq-discuss@lists.thekelleys.org.uk</a><br>
> <a href="http://lists.thekelleys.org.uk/mailman/listinfo/dnsmasq-discuss" rel="noreferrer noreferrer" target="_blank">http://lists.thekelleys.org.uk/mailman/listinfo/dnsmasq-discuss</a><br>
<br>
-- <br>
Petr Menšík<br>
Software Engineer<br>
Red Hat, <a href="http://www.redhat.com/" rel="noreferrer noreferrer" target="_blank">http://www.redhat.com/</a><br>
email: <a href="mailto:pemensik@redhat.com" target="_blank" rel="noreferrer">pemensik@redhat.com</a>  PGP: 65C6C973<br>
<br>
_______________________________________________<br>
Dnsmasq-discuss mailing list<br>
<a href="mailto:Dnsmasq-discuss@lists.thekelleys.org.uk" target="_blank" rel="noreferrer">Dnsmasq-discuss@lists.thekelleys.org.uk</a><br>
<a href="http://lists.thekelleys.org.uk/mailman/listinfo/dnsmasq-discuss" rel="noreferrer noreferrer" target="_blank">http://lists.thekelleys.org.uk/mailman/listinfo/dnsmasq-discuss</a><br>
</blockquote></div>