Das liegt an dem Video - Audio Offset von ca. 1 Segmentlänge und die ist bei Wilmaa ca. 3s, bei anderen Streams kann das auch ca. 10s betragen - du kannst aber auch die
--ffmpeg-copyts
Option weglassen, wenn dir das besser gefällt