将 PDF 和 DOC 文件作为纯文本存储在数据库中 - 从哪里开始?

我想修改我的 Discourse 安装,使其能够将 PDF 和 DOC 文件的内容作为纯文本存储在数据库中。我对数据库结构和 Discourse 代码的工作原理有基本了解。我应该从哪里开始修改源代码?

您试图解决什么问题?很难想象您描述的是一种好的解决方案。从这里开始:Developing Discourse Plugins - Part 1 - Create a basic plugin