Discourseにワードクラウドのプラグインはありますか?
Carl
それはないですが…何か特定の理由が必要ですか?どのように使われるのでしょうか?
2つの点で素晴らしいアイデアだと思います。
1つ目は、単語クラウドをクリックすると、その単語(例:「購読者」)に一致するすべてのトピックが表示される機能です。
2つ目は、この他にも検索結果や、トップ投稿者など、さまざまな情報を表示できるようにすることです。
おそらく、1日1回、あるいはそれ以上、cronジョブで実行できる仕組みにすればよいでしょう。
面白いアイデアだと思ったので
、作ってみました*。
現在は「とりあえず動く」レベルの非常に初期段階で、大幅な洗練や追加オプション、そしてクリック機能の実装も必要です。
ハンバーガーメニューにリンクが追加されます :tada。
現時点では、タイプや場所を問わず、すべての投稿から単語統計を構築することに注意してください。これは、実質的に迂回した形での軽微なプライバシー漏洩として機能する可能性があります(プライベートな領域の投稿から単語を除外するための追加の対策が必要かもしれません)。ただし、これを見るにはログインが必要で、データへのアクセスも制限されます。また、単語は SVG として描画され、上位数百語のみが表示されるため、ほとんどのサイトにとって大きな懸念材料にはならないでしょう。セキュリティを強化するために改善を進めますが、この方式ならクエリが非常に高速に実行されます。
お楽しみください
。
*このツールは、リポジトリでクレジットしているいくつかの非常に優れた既存のライブラリを活用しています。私のクエリの元となった @DiscourseMetrics さんの クエリ に感謝します。
とても素敵ですね。ワードクラウドに特定の単語を含めないようにする設定も必要ではないでしょうか?
もちろん、賢明な除外ルールを多数追加し、正規表現を調整してマークダウン形式などを除去する必要があります。ただし、過度に複雑にならないように注意が必要です。これはあくまで最初のステップです。色付けをいくつか追加しました。
ただ明確にしておきたいのですが、それは素晴らしいですね(笑)。
無視する単語のローカライズされたリストを追加しました:
これにより、結果が少し面白くなるはずです。
また、多くのサニタイジングロジックを追加したため、結果が大幅に改善されました。
素敵ですね!
この取り組み、気に入りました。お疲れ様でした。もし機能リクエストをさせてもらうなら:
/wordcloud/category)これが私の近隣フォーラムでの表示例です。
素晴らしいフィードバックと素晴らしいアイデアをありがとうございます!
はい、そのアプローチは良さそうですね。現在、クライアントワークで3メートルも埋もれていますが、次のアップデートではカテゴリ選択機能を検討します。
カテゴリ選択は以下で実装されています:
カテゴリを選択しない(デフォルト)場合、すべてのフォーラム投稿(PM も含む)がスキャンされます。カテゴリを 1 つだけ追加すると、単語統計はそのカテゴリに制限されます。

さらに、正規表現の大幅な改善も加わっています(
)。これにより「raw」データがきれいに整理され、Markdown のほとんど、あるいはすべてが除去されるようになりました。
NB: 単語統計は現在、毎時間更新されます(これはおそらくまだ過剰ですが、当面は本番環境での変更確認を容易にするため、初期コードの進化に伴ってこのようにしています)。
NB#2: 現時点では英語以外の言語への対応は考慮していません(もちろんテストもされていません)。現在の単語操作処理は、一部の言語では正しく機能しない可能性があります。ご提案や PR を歓迎します。
すばらしい!最も関連性の高いカテゴリのみを含む、更新されたワードクラウドがここにあります。
私のコミュニティは小さく、まだ比較的新しいものです。正直に言うと、ワードクラウドに表示されている情報は見た目はきれいなものの、特に意味や有用性には欠けます。おそらく、コミュニティに関する振り返りのトピックでのビジュアルとして使ったり、それに類する用途には使えるかもしれません。このツールをどのように活用しているかの例をもっと見てみたいですね。
含まれている単語の中には、you’d、off、got、add など、一般的で意味のないものもあります。「ワードクラウドの無視する単語リスト」の設定(私の場合はデフォルトの 100 に設定されています)が正しく機能しているのでしょうか?あるいは、無視する単語のリストを別のもの、より適切なものに置き換えるべきでしょうか?
はい、より大きなリストを検討することに喜んで賛成です(私は ここにある 200 語のリスト を見つけましたが、より「権威ある情報源」として ウィキペディア に譲りました)。
OK、以下を行いました:
参考までに、まだ除外したい単語がある場合は、以下のファイルの先頭に追加してください:
例として「ive」「its」「topic」「post」などを追加しています。
変更の影響をより迅速に確認するには、Sidekiqからジョブを再トリガーするだけです:
これでしばらくはこれで十分でしょう。専用のトピックを作成するかもしれません。
OK、こちらが気に入るかもしれません:
更新: イグnoreリストの構成を簡素化しました。もはや「イグnoreリストの適用割合」を設定する必要はありません。ネイティブのローカライズ済み設定を使って、イグnoreリストから単語を削除したり追加したりするだけで済みます。
このバージョンを取得するには、旧バージョンをアンインストールする必要がありますか?
プラグインのアップグレードだけで済むはずです。問題がありますか?
ごめんなさい、解決しました。![]()
全く問題ありません ![]()