Grazie per questo consiglio, Jay. Ho effettivamente pensato di scrivere un plugin, ma anche che dovrebbe essere fattibile dalla console di Rails per le varie operazioni di massa, ma non conosco Rails e ciò sembra comunque richiedere l’attivazione di funzioni incorporate. Ciò creerebbe lo stesso problema di sovrascrittura a meno che i job non venissero committati al core.
Finora ho gestito la situazione con il Data Explorer dal basso e (molto attentamente) psql dall’alto, ma preferirei fare le cose secondo le regole, data la sorte.
Probabilmente dovrei essere esplicito su ciò che sto facendo.
Gestisco un forum che è alla sua terza o quarta manifestazione, essendo passato attraverso Phorum e phpBB sotto le mie mani e qualcos’altro prima che ci arrivassi. L’argomento è ristretto e la base utenti è minuscola, ma il contenuto è stato portato avanti ad ogni spostamento e rappresenta molta conoscenza istituzionale. Discourse, con le sue funzionalità di categorizzazione, tagging e interfaccia, sembrava una grande soluzione per l’accessibilità alla conoscenza.
Quindi ho importato il forum che non è mai stato categorizzato o taggato nelle sue incarnazioni precedenti. Piuttosto che analizzare 100.000 post/8.000 thread, ho utilizzato un software di elaborazione del linguaggio naturale per aiutare con le categorizzazioni e i tag. Aggiorno quindi direttamente le tabelle topics, categories e topic_tag, essendo, come ho detto, molto attento.
Il processo è ancora in corso, ma ho un flusso di lavoro stabile e posso facilmente completarlo con gli strumenti a disposizione. In futuro, tuttavia, ci saranno aggiornamenti periodici regolari per integrare nuove categorizzazioni e tag che potrebbero essere diversi o meno dai dati precedenti. Quindi puoi capire la necessità.
Ovviamente il Data Explorer è un flusso unidirezionale, ma è stato molto conveniente. Posso superare il limite di dimensione facendo dei batch e, ora, aumentando l’impostazione del limite, quindi grazie per questo.