Acho que não é um problema do Thunderbird, mas de qualquer cliente de e-mail que suporte encadeamento. Mas não sei se a diferença entre diferentes informações em in-reply-to e references aqui pode depender de diferentes interpretações.
O que eu realmente vejo é que você corrigiu References agora, de acordo com rfc5322:
In-Reply-To: cita o message-id da mensagem para a qual você está respondendo.
References: anexa o message id da mensagem respondida às referências anteriores
Primeira postagem
Message-ID: <msg-id1>
…e sem References
1ª resposta
`
Message-ID: <msg-id2>
In-Reply-To: <msg-id1>
References: <msg-id1>
`
2ª resposta:
…
Message-ID: <msg-id3>
In-Reply-To: <msg-id2>
References: <msg-id1> <msg-id2>
…
No entanto, você quebrou os message IDs como indicado em
Aliás: Existe outro bug que ao marcar várias linhas como texto pré-formatado inclui a marcação cmd-e não uma vez, mas muitas vezes, uma para cada linha?