Tris20
(Tristan)
1
Discourse AI - Related Topics: Enhancing Content Exploration は素晴らしいと思いますが、残念ながらその範囲は現在読んでいるトピックによって定義されているようです。
LLMの最近の進歩により、ユーザーの投稿や閲覧履歴をざっと見て、おすすめのフィードを提供することは可能でしょうか?
これは、Q&Aに焦点を当てたユースケースにとって素晴らしい機能となるでしょう。多くの異なるカテゴリがあり、非常に忙しいユーザー(同僚)がおり、彼らが単に見ることができない非常に役立つ情報がたくさんあります。優れたおすすめリストは、一部のユーザーが解決しようとしている問題よりも「先に進む」のに役立つでしょう。
理想としては、ユーザーがすでに興味を示しているツールや会話に関連する、一般的で重要かつ話題になっているバグのリストになると思います。
「いいね!」 7
EricGT
(EricGT)
2
もし公開されているのであれば、サイトへのリンクを共有していただけますか?
Discourse AIの機能を、一般公開される前から利用してきた者として、あなたのサイトについてもっと知りたいと思っています。あなたが指摘した具体的な詳細を理解することで、あなたのプラットフォームのユニークな側面を考慮に入れ、Discourse AIにより情報に基づいた推奨を行うことができるようになります。
Tris20
(Tristan)
3
喜んで共有したいのですが、残念ながら大規模な企業の内部インスタンスなのです 
しかし、私たちが何をしているのか、いくつかアイデアをお伝えすることはできるかもしれません。
背景
基本的に、社内版Stack Overflowのようなもので、私たちは「このプロキシをどう設定すればいいのか?」や「GoogleでBug123の結果が見つからないんだけど、誰か解決した?」のような、会社や業界特有の問題を共有しています。
私たちのカテゴリはツール固有のもので、例えば以下のようなものがあります。
- Kubernetes
- Gitlab
- 今まで見た中で最悪のUIを持つ、バグのあるIBM製品
おすすめリストはどのように役立つか?
現在、Gitlabカテゴリのトピックを読んだり返信したりする際に、他のツール(Kubernetesなど)との連携について話している場合、関連トピックに関する通知は一切受け取れません。そのため、Kubernetesカテゴリに非常に役立つ投稿があっても、非常に遅くまで気づかない可能性があります。自分で見つけるか、適切な通知を購読する必要があります。
ほとんどのユーザーは、通知設定をうまく活用できていません。
- 結果を出すプレッシャーにさらされている
- プラットフォームに十分な時間を費やしていないため、通知設定を最大限に活用できていない。
おすすめリストがあれば、オンデマンドで、ワンクリックで潜在的に役立つ情報を提供できます。基本的に、「最近の興味に基づいて、役立つ可能性のあるトピックをいくつかご紹介します」というものです。ユーザーの検索履歴、話題のトピック、参加しているトピックの一般的なキーワードなどから構築できます。そのため、Buggy IBMカテゴリを一度も訪れたことがない場合、そのカテゴリからのものは何もおすすめされません。ただし、例えばGitlabのように、すでに強い関心を持っている何かに偶然触れた場合は別です。
「いいね!」 4
EricGT
(EricGT)
4
keypunchマシンを使ったことがないのは明らかです。
画像提供元:
Definition of keypunch machine | PCMag
このトピックを見ましたか?ほとんどの投稿に多くの役立つ情報があるので、すべて読むべきです。
「いいね!」 1
このサイトのトップには「デイリーブズ」というAIによる要約を提供しており、12時間ごとに更新され、過去2日間の投稿から情報を取得しています。
このソリューションは独自のもので、公開されているプラグインではありませんが、コンセプトは実証されています。
そして、はい、エラーが発生しやすいです!
コンテンツをリンクできるようにしたいと思っていました… 更新:完了しました。GPT 4 Turboとプロンプトエンジニアリングが必要でした。GPT 3.5では、このレベルの指示に対応できません。
「いいね!」 3
Tris20
(Tristan)
6
あなたの美しいパンチカードマシンを見ました。そして、マークダウンをサポートしていないウェブベースのチケット発行システムを提案します 
おすすめトピック
ありがとうございます。これを見ていませんでした。私たちの状況が変われば役立つかもしれませんが、残念ながら、以前に言及し忘れていた現在の制限には対応していないようです 
制限事項
- チャットは使用できません
- プライベートメッセージは使用できません
- 安全性が重要なソフトウェアを開発しているため、AIに依存して応答を生成し、開発者に静かに提供することはできません
これらの制限により、おすすめトピックのリストが私たちにとって良い解決策となる理由は、コンテンツが生成されず、チャットもプライベートメッセージも使用されないことです。
これは、毎日の概要を提供する興味深い方法になるでしょう。あなたが言うように、ハイパーリンクは間違いなく素晴らしい機能になるでしょう。ユーザー固有の興味のセットに合わせてカスタマイズすることを考えていますか?既存のデイリーダイジェストに頼るのではなく、このアプローチが魅力的だったのはなぜですか?
「いいね!」 2
Tris20
(Tristan)
8
これがこのリクエストの真に困難な部分であり、同時に多くの価値がある部分だと推測します。
ほとんどのコンテンツホスティングプラットフォームには、何らかのカスタマイズされたレコメンデーションシステムがありますが、Discourseもいずれその方向に向かうのではないかと驚きません。画像/音声をオブジェクト/テキスト/コンセプトに翻訳する間のエラー層を取り除くため、Spotify/Youtubeのようなプラットフォームよりも達成可能であると言えます。
「いいね!」 2
EricGT
(EricGT)
9
端的に言うと。
最初の投稿のリクエストについて、もっと型破りな発想をしてみてください。満たさなければならない多くの有効な制約がありますが、だからといって、より良い解決策が存在しないということにはなりません。
関連トピックに関する補足ですが、正直なところ、ここ数日で何千もの関連トピックを見てきましたが、こちらに気づきました。
注目すべき点です。
英語サイト(OpenAI)の関連トピックの多くの投稿をレビューしていると、スペイン語のトピックが一緒にグループ化される傾向があることに気づき始めました。もしそれらが最初に英語に翻訳されていれば、各投稿は異なるベクトルを持ち、したがって他の投稿と一緒にクラスター化されるだろうと推測しています。
「いいね!」 1
sam
(Sam Saffron)
11
私たちはまだ機能を調整中ですが(来週の発表を検討中)、新しい「AI を活用した定期レポート」はあなたのビジョンに完全に合致しています:
カスタム指示
meta.discourse.org の毎日サマリーを生成
-
上位ユーザーや投稿数/トピック数などの主要な統計をリストアップ
-
当日の活動について簡潔に要約した、興味深い新しいトピックを約 10 件リストアップ
-
当日に大きな活動があった、興味深い過去のトピックを約 10 件リストアップ
-
@team グループの活動概要をまとめ、彼らが作成したトピックへのリンクを文中に含める
-
情報源:すべての主張には、フォーラムの議論へのリンクを必ず付与する
-
Markdown の活用:読みやすさを向上させるために、太字、斜体、> 引用、リンク を使用する
-
リンク作成:直接参照には https://meta.discourse.org/t/-/TOPIC_ID/POST_NUMBER を使用する
-
ユーザーメンション:@USERNAME でユーザーを参照
-
トピックリンクの多用:レポート内で少なくとも 30 のトピックへのリンクを作成するよう努める。エンドユーザーにとってトピック ID 自体は無意味なので、リンクを挿入する必要がある場合は ref を使うか、より良い方法として 文 の中に埋め込む
-
カテゴリとタグ:#TAG および #CATEGORY の形式を使用してタグとカテゴリを示す
-
bug トピックは私にとって非常に重要です。優先順位を付け、誤分類されたバグを発見した場合は強調表示してください。正しく分類されているものについては言及しないでください。
-
トピックの要約を提供する際は、段落形式にしてください。例:
@user が XYZ に関する 問題 を発見し、@user2 が 提案 を行いました
AI によって生成された生レポート - 免責事項 - 約 4 件の幻覚が含まれています
主要な統計
- 新しい投稿:131
- 新しいトピック:25
- いいね数と投稿数による上位ユーザー:
興味深い新しいトピック
-
実験的な管理サイドバーナビゲーション - @martin が実験的な管理サイドバーナビゲーションを導入し、そのデザインと機能に関する議論が巻き起こりました。@packman や @Don などのユーザーが、欠落しているエントリやモバイル表示の問題についてフィードバックを提供し、@martin はこれを認識しており、今後のアップデートで検討中であると表明しました。続きを読む。
-
推奨トピックリスト - @Tris20 が、LLM の進歩を活用してユーザーの関心に合わせたコンテンツを提供するため、トップメニューに推奨トピックリストを追加することを提案しました。この会話は、@EricGT、@merefield などが参加し、パーソナライズされたコンテンツ推薦の可能性と課題について議論が深まりました。続きを読む。
-
Discourse 10 周年 - @Judy_Hawkins や @Quercus などのユーザーが、自身の人生に影響を与えたさまざまな Discourse コミュニティへの感謝を共有し、プラットフォームの 10 周年を祝いました。続きを読む。
-
Locations プラグイン - @Don が Locations プラグインの問題を報告し、@merefield が迅速に対応し、問題の調査意欲を示しました。続きを読む。
-
ユーザーによるナビゲーションバー編集の制限 - @Yola がユーザーによるナビゲーションバーの編集を制限する方法について助けを求め、@JammyDodger がこの機能は個人のカスタマイズ用に設計されていることを明確にしました。@pfaffman と @LOCOSP が編集ボタンを非表示にする CSS ソリューションを提供しました。続きを読む。
-
ファイルアップロードのバグ - @Vladimir_P がファイルアップロード時にバグに遭遇し、@JammyDodger と @blake が対応し、修正が実装されました。続きを読む。
-
プラグインの作成とインストール - @Gaurav_Kumar_Sandan がホームページでのプラグインの作成とインストールについて質問し、@JammyDodger と @pfaffman がテーマコンポーネントとプラグインインストールに関するガイダンスを提供しました。続きを読む。
-
DiscoTOC - 自動目次 - @digitaldominica と @Arkshine が DiscoTOC コンポーネントの問題について議論し、Discourse のアップデート後に解決されました。続きを読む。
-
プラグイン内のカスタムユーザー設定 - @pirhoo がプラグインからカスタムユーザーフィールドを作成する方法についてアドバイスを探し、@merefield がプロセスを支援するリソースを提供しました。続きを読む。
-
請求情報の場所 - @Teresations が Communiteq でホストされている Discourse の請求情報の場所を確認する必要があり、@awesomerobot と @RGJ がコントロールパネルを指し示すことで支援しました。続きを読む。
大きな活動があった興味深い過去のトピック
-
絵文字の行間調整に関するフィードバック - @sam と @tynaut が絵文字の行間調整がユーザーステータスのスタイルに与える影響について議論し、@tynaut がチャット向けの修正を確認し、投稿/メッセージ向けの解決策を探っていると発表しました。続きを読む。
-
FILTER を使用したデータの要約 - @JammyDodger が活動要約の好みに基づいてユーザーデータをセグメント化するための FILTER 関数を使用した SQL クエリを共有し、クエリの構成要素について詳細に説明しました。続きを読む。
-
ユーザーのプロフィールの一部としてのコミュニケーションスタイル - @Saif と @simon が、ユーザーのプロフィールに感情分析を実装してコミュニケーションスタイルを評価することの可能性と懸念について議論しました。続きを読む。
-
チャットで Enter で改行、Shift+Enter でメッセージ送信 - @meglio がチャット入力動作の設定変更を提案し、@Jagster や @Moin などのユーザーが支持し、多段落メッセージングをよりユーザーフレンドリーにするための提案を行いました。続きを読む。
-
投票を含む最初の投稿を承認できない - @Firepup650 が、投票を含むユーザーの最初の投稿を権限エラーにより承認できないという問題を報告しました。続きを読む。
誤分類された bug トピック
- ロゴアップロード時のエラーメッセージ - @spicerunner がロゴアップロード時のエラーメッセージを報告し、アップデート後に解決されました。このトピックは正しく bug として分類されていました。続きを読む。
正しく分類された bug トピック
-
送信通知メールの失敗 - @managenet が添付ファイルサイズ制限の変更を試みた後、送信通知メールで問題に直面しました。続きを読む。
-
アプリの再構築がレイヤー抽出で停止 - @LOCOSP が Docker レイヤーの抽出中に再構築が停止する問題に遭遇し、ファイルの再取得を強制する方法についてアドバイスを求めました。続きを読む。
-
Discourse Launcher / Docker はローカルの Postgresql と Redis サーバーを使用するか? - @dalu74 が Discourse がホストの Postgresql と Redis インストールを使用するかどうかを質問し、@hello-smile6 が明確にしました。続きを読む。
詳細と議論については、meta.discourse.org をご覧ください。
具体的には、これらの自動化レポートの一部を活用して、興味深いコンテンツを浮き彫りにすることができます。
コンテキストサイズ、レポートがカバーする日数などを制御できるため、ここで極めて高い制御が可能になります。
ただし注意が必要ですが、これは GPT-4 turbo でなければうまく機能しません。Anthropic Claude は大きなコンテキストウィンドウを持つ LLM ですが、生成された結果は私を満足させるには至りませんでした。
「いいね!」 13
EricGT
(EricGT)
12
ご存知かもしれませんが、他の人のために、これはそれほど明白ではないかもしれないので述べておきます。
右上にあるDiscourse AIボットにアクセスできる場合

次に、Forum Helperペルソナを使用して、Periodic report using AIのcustom instructionsで使用できるさまざまな指示を試すこともできます。言い換えれば、Forum Helperを使用してレポートを迅速にプロトタイプ化できます。
開発中にフィードバックを提供できた特権を得た者として、望ましい結果を得るためにはcustom instructionsが重要であることをお伝えできます。上記の例では、Samが最初の要求に基づいたレポートのバリエーションのためにこれを追加したことが明確にわかります。
お役に立てば幸いです。
「いいね!」 1
sam
(Sam Saffron)
13
残念ながら、このカスタム指示はGPT 4にとっても難しすぎますが、良い点としては、他のものはかなりうまく機能しています。
「いいね!」 1
Tris20
(Tristan)
14
これを気に入っていますが、機能については完全には理解できていません。これはダイジェストに似たものを生成しているように見えます。その情報については、この新しい形式をかなり気に入っています。
応答からわからなかったのは、カスタマイズされた要約を提供できるかどうかです。どこかでそれを見逃しましたか?ユーザーの個々の興味に基づいて、これをユーザーごとに生成することは可能ですか?
これらの考えをより具体的にするために、大まかに考えていたのは次のとおりです。
- ユーザーの主な興味を特定する: (一度実行) キーワードのために、ユーザーがやり取りした(いいね、返信、作成)すべてのトピックと返信をスキャンします。
- ユーザーの最近の興味を特定する: 今月ユーザーが読んだトピックと返信をキーワードでスキャンします。
- 最近のトピックの主要な概念を特定する: 今週のすべての新しいトピックをスキャンします。
擬似コード
user_interests = main_interests + recent_interests
Recommended_list = Match(recent_topics with user_interests)
Recommended_list = Recommended_list.sort_by_match_strength()
「いいね!」 3
sam
(Sam Saffron)
15
日々のレポート(現在メタでTL3用に配線されています)から導き出している興味深い結論があります。
LLMを活用した機能で最も人気があるのは、日付XからYまでのトピックの変更点を1段落で要約するシンプルな機能です。
LLMにコーパス全体を読み込ませてこのようなレポートを作成させる代わりに、「フラグメントキャッシュ」を保持することができます。例えば、トピックごとの段落を保存します。
| トピックID |
要約の日付範囲 |
ごく短い要約 |
| 2343 |
12-1 → 12-9 |
… |
これにより、ユーザーごとにカスタム要約を作成できます。つまり、これを複数の問題に分割していることになります。
これにはいくつかの利点があります。スケーラビリティが非常に高く、コンテキストの量がはるかに限られているため、要約はより正確になり、コンテキストの漏洩や幻覚のリスクが少なくなります。
「いいね!」 4
EricGT
(EricGT)
16
このアイデアのバリエーションについて考えてきました。タグやカテゴリで関連付けられたトピックについて考えるのではなく、それらを意味的な類似性に基づいて検討します。意味的に関連するすべてのトピックがきれいに球を形成するわけではありませんが、そのように考えるのは役立ちます。単一のトピックから始まる球を想像してみてください。より多くのトピックが追加されるにつれて球は拡大しますが、しばらくするとサイズが制限されます。それでも、球が成長するにつれて、また満杯になった後でも、球内にさらに多くのトピックを追加できます。これは、時間の経過とともに異なる意味的類似性を持つトピックが追加されることによる急激な爆発を表す、花火のようなものと考えてください。このアナロジーは、概念をよりよく理解するのに役立ちます。特に、これらの急激な爆発と、長時間残ってきらめくものに興味があります。これを視覚的に表現できれば、意味的な中心を選んで、それについての段落を調整できると良いでしょう。
このトピックは、「全投稿を表示」を使用すると、意味的に関連するトピックの実際の画像が表示されます。
編集
こちらが私が考えているものに近いビジュアルです。

画像はここから取得しました。
https://marvl.infotech.monash.edu/webcola/
「いいね!」 1
sam
(Sam Saffron)
17
これは多くの点で、Discourse のための “the algorithm” を求めるようなものです。
興味深いものを選択するための「アルゴリズム」には、多くの要素が考えられます。
- それは誰ですか? 例:「Jane が投稿した記事はとても気になります」
- それは何ですか? 例:「とてもよく書かれた投稿にはとても関心があります」
- それは何ですか? 例:「このメタベクトル空間のトピックにはとても関心があります」
- それはどのくらい人気がありますか? 例:「他の多くの人が好き/読んでいる記事を読みたいと思います」
- その他、まだまだたくさんあります。
「いいね!」 2
EricGT
(EricGT)
18
正直に言うと、「アルゴリズム」という言葉を初めて聞きましたが、はい、私の考えていることとかなり一致しています。さらに詳しく調べる必要がありますが、あなたが述べていることに反対するとは思えません。
2023年11月21日
ChatGPT 3.5
あなた
Twitterの「アルゴリズム」とは何ですか?
ChatGPT
Twitterのアルゴリズムとは、ソーシャルメディアプラットフォームがユーザーのタイムラインやフィードに表示するコンテンツを決定するために使用する、複雑な一連の数学的ルールとプロセスを指します。このアルゴリズムは、ユーザーの興味、エンゲージメント履歴、その他の要因に基づいて、ユーザーが表示するコンテンツをキュレーションおよびパーソナライズするように設計されています。Twitterのアルゴリズムは長年にわたって進化してきましたが、一般的に、ユーザーエンゲージメントとプラットフォーム上での維持を促進しながら、ユーザーに最も関連性の高い魅力的なツイートを表示することを目的としています。
Twitterのアルゴリズムに影響を与える可能性のある主要なコンポーネントと要因には、以下が含まれます。
- 関連性:アルゴリズムは、ツイートがユーザーの興味や好みにどれだけ関連しているかを考慮します。ユーザーがフォローしているアカウント、エンゲージしたコンテンツ(いいね、リツイート、返信)、ツイートで使用したキーワードやハッシュタグを考慮に入れます。
- エンゲージメント:より多くのいいね、リツイート、返信、共有を獲得したツイートは、アルゴリズムによってプロモートされる可能性が高くなります。エンゲージメントが高いほど、ツイートがユーザーに響いており、より価値があると見なされていることを示します。
- 新しさ:Twitterは、最新の情報やトレンドをユーザーに常に更新するために、最近のツイートを優先することがよくあります。ただし、依然として関連性があり魅力的な古いツイートを表示することもあります。
- パーソナライゼーション:アルゴリズムは、ユーザーの特定の興味や行動に合わせてフィードを調整することにより、各ユーザーにパーソナライズされたエクスペリエンスを作成します。ユーザーがプラットフォームとやり取りするにつれて、時間の経過とともに適応します。
- フォロワー数:アカウントのフォロワー数も、ツイートの可視性に影響を与える可能性があります。フォロワーが多いアカウントは、一般的にツイートをより広範なオーディエンスに表示される可能性が高くなります。
- メディアタイプ:画像、動画、その他のメディアを含むツイートは、より高いエンゲージメントを獲得する傾向があり、アルゴリズムによってプロモートされる可能性があります。
- 品質と安全性:Twitterのアルゴリズムは、スパム、偽情報、有害なコンテンツの可視性を減らしながら、高品質で安全なコンテンツをプロモートすることも目指しています。
Twitterは、ユーザーエクスペリエンスを向上させ、誤情報や有害なコンテンツの拡散に関連する懸念に対処するために、アルゴリズムを定期的に更新および改良していることに注意することが重要です。ユーザーは、設定を調整したり、アカウントをミュートしたり、リストなどのTwitterの機能を使用したり、「最も関連性の高いツイートを最初に表示」オプションを使用してフィードをさらにカスタマイズしたりすることで、タイムラインをある程度制御することもできます。
Tris20
(Tristan)
19
これは絶対に素晴らしいですね。「監視中」の通知なしバージョンという感じで、まさに私たちが探しているものです。このフォーマットを読んでいるときに感じる認知的負荷の少なさには本当に感銘を受けました!正直、もっとたくさん読めるのが待ちきれません!
これは今のところMetaでしか試されていないと考えてよいでしょうか?技術フォーラムで、より難解な情報が扱われる場合に、これがどのように機能するか非常に興味があります。
「いいね!」 2
sam
(Sam Saffron)
20
非常に技術的なフォーラムでも試しましたが、うまく機能しました。すぐに利用できる状態です。来週、適切なドキュメントを追加します。
「いいね!」 5