عندما أقوم بعرض ملف خريطة موقع XML في المتصفح، فإنه يعرض عشرة ملفات. يحتوي كل ملف على 50,000 سجل، ولكن المجموعة الكاملة من السجلات غير مرئية. يمكنك الرجوع إلى لقطة الشاشة السابقة لمعرفة العدد الإجمالي للسجلات وهو “887,652”.
خرائط مواقع XML التي ينشئها Discourse لا تتضمن جميع المشاركات على موقعي. أجريت استعلامًا للمشاركات وأرى حوالي 800 ألف مشاركة. لكن خرائط مواقع XML تتضمن 347 ألفًا فقط. أفتقد حوالي 55٪ من عناوين URL للمشاركات في خريطة الموقع.
بالإضافة إلى ذلك، فإن الاستعلام في OP سيستخرج جميع الرسائل الخاصة والمواضيع المحذوفة أيضًا.
أعتقد أنه سيحتاج إلى أن يكون أشبه بـ:
SELECT
COUNT(*)
FROM topics t
JOIN categories c ON c.id = t.category_id
WHERE c.read_restricted IS FALSE
AND t.archetype = 'regular'
AND t.deleted_at IS NULL