Я искал в канале Support, но не нашёл готового ответа, так что простите за быстрый вопрос по поддержке:
Мы используем S3 для хранения файлов Discourse примерно с 2016 года. Когда я посмотрел в корень бакета S3, то с удивлением увидел каталожную структуру «выше» тех директорий, которые я ожидал там найти, например: optimized/, original/ и т. д.
Как вы думаете, безопасно ли удалить нумерованные директории в корне, например 99/, возможно, из-за ошибки копирования, произошедшей давным-давно? Возможно, они были скопированы очень давно в неправильное место. Есть ли вероятность, что в постах прописаны старые пути к этим локациям, которые я не хочу нарушить?
Вот как это выглядит, и моя цель — очистить это (если это вообще нужно):
Я думаю, что мы тоже немного своеобразны Мы используем Discourse примерно с 2015 года и за эти годы меняли места хранения данных.
Сначала мы использовали локальное хранилище для файлов, затем, по мере роста, перешли на загрузку в S3. На тот момент, насколько я помню, мы не переносили существующие файлы путем пересборки постов, поэтому в самых старых постах до сих пор используются URL-адреса, не относящиеся к локальному хранилищу.
Хочу отметить, что мы не планируем ничего удалять в текущем виде, так как даже если структура организации менялась с годами, речь идет о небольших объемах данных, и в такой ситуации безопаснее оставить всё как есть.
Спасибо за внимание, @sam, хорошо это знать — интересно, не вручную ли мы загрузили в S3 то, что у нас было, и что-то пошло не так. Это не нанесло никакого вреда.
Плюс множество именованных директорий от 1/ до 225/. В каждой именованной директории находится один файл изображения с именем вроде ‘874c0706216382af.jpg’.
Для tombstone настроен жизненный цикл S3 для отметки как удалённых через 30 дней.
Так что, предполагая, используются ли только optimized/, original/ и tombstone/?
Эти файлы всегда присутствовали на очень старых форумах (около 2014 года). Я думаю, что они появились раньше, чем optimized и original, и подозреваю, что на них всё ещё ссылаются.
Я не удержался и решил это выяснить. Это действительно старая схема загрузки. Она была заброшена позже, чем я предполагал, в мае 2015 года, в этом коммите.
Эти загрузки всё ещё используются, поэтому не удаляйте их!
Спасибо, Майкл. Так как эти файлы относятся к началу нашей работы в 2014 году, их номера небольшие, и мы оставим их на прежнем месте.
Кстати, недавно мы переносили сервер и выбрали путь резервного копирования и восстановления Discourse (вместо обновления непосредственно базовой версии Unix). Мне кажется (хотя я не уверен на 100%), что процесс восстановления не корректно разместил эти локальные файлы. Они присутствовали в архиве резервной копии, но восстановление, похоже, сработало только для оптимизированных/оригинальных версий файлов ниже по иерархии.
Это не было большой проблемой, так как мы могли самостоятельно извлечь их с помощью команды tar -x из архива резервной копии (когда заметили различия в содержимом загрузок между старым и новым серверами), но это может сбить с толку кого-то другого, поэтому я хотел упомянуть об этом здесь.
Хотя 99,9% наших загрузок сейчас обслуживаются через S3 (мы довольно рано перешли с локального хранилища на S3), я полагаю, что при ручном создании ведра S3 мы скопировали туда и локальные файлы. В ретроспективе, вероятно, следовало бы пересобрать сообщения, но всё работало достаточно хорошо, учитывая, что очень старые сообщения имели URL-адреса загрузок локальных файлов.