Discourse 用ワードクラウドプラグイン?

Discourseにワードクラウドのプラグインはありますか?

Carl

「いいね!」 3

それはないですが…何か特定の理由が必要ですか?どのように使われるのでしょうか?

「いいね!」 6

2つの点で素晴らしいアイデアだと思います。

1つ目は、単語クラウドをクリックすると、その単語(例:「購読者」)に一致するすべてのトピックが表示される機能です。

2つ目は、この他にも検索結果や、トップ投稿者など、さまざまな情報を表示できるようにすることです。

おそらく、1日1回、あるいはそれ以上、cronジョブで実行できる仕組みにすればよいでしょう。

「いいね!」 1

面白いアイデアだと思ったので :game_die:、作ってみました*。

現在は「とりあえず動く」レベルの非常に初期段階で、大幅な洗練や追加オプション、そしてクリック機能の実装も必要です。

ハンバーガーメニューにリンクが追加されます :tada。

:warning: 現時点では、タイプや場所を問わず、すべての投稿から単語統計を構築することに注意してください。これは、実質的に迂回した形での軽微なプライバシー漏洩として機能する可能性があります(プライベートな領域の投稿から単語を除外するための追加の対策が必要かもしれません)。ただし、これを見るにはログインが必要で、データへのアクセスも制限されます。また、単語は SVG として描画され、上位数百語のみが表示されるため、ほとんどのサイトにとって大きな懸念材料にはならないでしょう。セキュリティを強化するために改善を進めますが、この方式ならクエリが非常に高速に実行されます。

お楽しみください :man_dancing:

*このツールは、リポジトリでクレジットしているいくつかの非常に優れた既存のライブラリを活用しています。私のクエリの元となった @DiscourseMetrics さんの クエリ に感謝します。

「いいね!」 15

とても素敵ですね。ワードクラウドに特定の単語を含めないようにする設定も必要ではないでしょうか?

「いいね!」 1

もちろん、賢明な除外ルールを多数追加し、正規表現を調整してマークダウン形式などを除去する必要があります。ただし、過度に複雑にならないように注意が必要です。これはあくまで最初のステップです。色付けをいくつか追加しました。

「いいね!」 2

ただ明確にしておきたいのですが、それは素晴らしいですね(笑)。

「いいね!」 1

無視する単語のローカライズされたリストを追加しました:

これにより、結果が少し面白くなるはずです。

また、多くのサニタイジングロジックを追加したため、結果が大幅に改善されました。

「いいね!」 3

素敵ですね! :heart_eyes_cat: この取り組み、気に入りました。お疲れ様でした。もし機能リクエストをさせてもらうなら:

  • ハンバーガーメニューのリンクをオプションにしてください(これはイースターエッグとしてのアイデアが好きです)
  • 選択したカテゴリのみを含めるためのカテゴリ設定を作成してください
  • 特定のカテゴリとサブカテゴリのみのワードクラウドを生成できるように、カテゴリ用ルートを提供してください(例:/wordcloud/category

これが私の近隣フォーラムでの表示例です。

「いいね!」 4

よく動作しますが、微調整が必要です:

「いいね!」 3

素晴らしいフィードバックと素晴らしいアイデアをありがとうございます!

はい、そのアプローチは良さそうですね。現在、クライアントワークで3メートルも埋もれていますが、次のアップデートではカテゴリ選択機能を検討します。

「いいね!」 2
  • カテゴリ選択は以下で実装されています:

    FEATURE: restrict word stats to specific Categories · merefield/discourse-word-cloud@0777adc · GitHub

    カテゴリを選択しない(デフォルト)場合、すべてのフォーラム投稿(PM も含む)がスキャンされます。カテゴリを 1 つだけ追加すると、単語統計はそのカテゴリに制限されます。

    image

  • さらに、正規表現の大幅な改善も加わっています(:sweat_smile: :stuck_out_tongue:)。これにより「raw」データがきれいに整理され、Markdown のほとんど、あるいはすべてが除去されるようになりました。

NB: 単語統計は現在、毎時間更新されます(これはおそらくまだ過剰ですが、当面は本番環境での変更確認を容易にするため、初期コードの進化に伴ってこのようにしています)。

NB#2: 現時点では英語以外の言語への対応は考慮していません(もちろんテストもされていません)。現在の単語操作処理は、一部の言語では正しく機能しない可能性があります。ご提案や PR を歓迎します。

「いいね!」 3

すばらしい!最も関連性の高いカテゴリのみを含む、更新されたワードクラウドがここにあります。

私のコミュニティは小さく、まだ比較的新しいものです。正直に言うと、ワードクラウドに表示されている情報は見た目はきれいなものの、特に意味や有用性には欠けます。おそらく、コミュニティに関する振り返りのトピックでのビジュアルとして使ったり、それに類する用途には使えるかもしれません。このツールをどのように活用しているかの例をもっと見てみたいですね。

含まれている単語の中には、you’d、off、got、add など、一般的で意味のないものもあります。「ワードクラウドの無視する単語リスト」の設定(私の場合はデフォルトの 100 に設定されています)が正しく機能しているのでしょうか?あるいは、無視する単語のリストを別のもの、より適切なものに置き換えるべきでしょうか?

「いいね!」 1

はい、より大きなリストを検討することに喜んで賛成です(私は ここにある 200 語のリスト を見つけましたが、より「権威ある情報源」として ウィキペディア に譲りました)。

「いいね!」 1

OK、以下を行いました:

  • 無視リストを300語に拡張しました。これはこちらで見つけたリストを使用しています。
  • 正規表現を強化して引用符を除去するようにしました(これにより「quote」という言葉が頻繁に表示されなくなりました!)。
  • 無視リストを追加した後に不要になった、残りの上位10語の恣意的な削除を削除しました。

参考までに、まだ除外したい単語がある場合は、以下のファイルの先頭に追加してください:

例として「ive」「its」「topic」「post」などを追加しています。

変更の影響をより迅速に確認するには、Sidekiqからジョブを再トリガーするだけです:

これでしばらくはこれで十分でしょう。専用のトピックを作成するかもしれません。

「いいね!」 3

OK、こちらが気に入るかもしれません:

更新: イグnoreリストの構成を簡素化しました。もはや「イグnoreリストの適用割合」を設定する必要はありません。ネイティブのローカライズ済み設定を使って、イグnoreリストから単語を削除したり追加したりするだけで済みます。

「いいね!」 2

このバージョンを取得するには、旧バージョンをアンインストールする必要がありますか?

「いいね!」 1

プラグインのアップグレードだけで済むはずです。問題がありますか?

ごめんなさい、解決しました。:sunglasses:

「いいね!」 1

全く問題ありません :+1: