1回のフラグで投稿が非表示に

いいえ。

ほとんどの場合、これは単一のユーザーが「この投稿にフラグを立てるべきか確信が持てませんが、私の解釈([投稿の内容 | モデレーターの方針])に基づけば、確認したほうがいいかもしれません」と伝えるためのメッセージです。

初心者ではないユーザーは、特定のモデレーターへの私信(あるいは稀に @moderators へのメンション)として行うこともありますが、このようなコメントの最も一般的な形は「その他」フラグです。

「いいね!」 3

なるほど。

ただ、これには同意できないですね。「その他」を送るほど誰かが気にしているなら、それはまさにフラグです。確かにその重みは下げる(あるいは上げる)こともできますが、明らかに何か問題があります。

とはいえ、そのフラグの意味がやや曖昧なので、必要だとお考えなら重みを減らすことに賛成します。

「いいね!」 2

幸い、これはすでに存在します!

「いいね!」 1

ああ、つまりその特定の「その他」フラグの重みを調整できるわけですね?@eviltrout、各フラグタイプの基本フラグ重みを設定として提供しているのでしょうか?私が言いたいのは、サイト管理者が「『その他』フラグはすべてフラグ重みを付与しない」と決定し、そのフラグの基本重みをゼロに変更できるのではないかということです。

現在、「その他」と「不適切」は同じ基本フラグ重みになっているように見えます。

try.discourse.org でテストしたところ、両方のフラグともレビューキューで 1.0(フラグ)+ 5.0(信頼レベルボーナス)= 6.0 となっており、投稿を非表示にするために必要なスコアは 4.0 です。つまり現在、「その他」は「不適切」と同じフラグ重みを持っていますが、これは私には正しくないように思えます。

この発言の意味がわかりません。なぜなら、上記のテストではすべてのフラグに対してすでに「無視」が保持されているからです。

つまり、特定のフラグの重みをゼロにしたい場合は、「無視」ボタンを押せばよいのでしょうか?何か見落としているのでしょうか?

「いいね!」 2

はい。その設定はレビューキューの「設定」にあります。ただし、低/中/高の選択肢のみ可能です。

「いいね!」 1

ああ、すべてがデフォルトで「low」になっているので、おそらく 1.0 が下限でしょう。このリストに「off」や「none」を追加すべきでしょうか、@eviltrout?

「いいね!」 3

「無視」を直接使用すると、TL3 メンバーの重みが低下しました。私はこれを観察し、特定の TL3 メンバーが上げたフラグに対して「不同意」ではなく、繰り返し「無視」を適用することで、ある期間をかけてその重みを 51% まで低下させるテストを行いました。

新規作成したアカウントでの再テストが役立つでしょうか?再現可能であれば、そのテストを実行し、スクリーンショット付きの正確な指標を投稿する用意があります。

もしそれが、フラグ投稿者の重みを低下させないこと、および信頼レベル 3 の要件にあるフラグ付き投稿 > 最大 5 に 1 を追加しないことを意味するならば、はい、フラグの重みをゼロにすることが期待される結果となります。

「いいね!」 2

ああ、それはそもそも起こってはいけないと思います。「Ignore」は私にとって「このことはなかったことにする」という意味です。@eviltrout さんが来週にそれを考慮してくれると確信しています。

「いいね!」 5

ここで問題なのは、「フラグを無視」しても投稿の重み付けに影響が残ってしまう点です。もし「無視」が本当に無視になるようにする計画なら、無視されたフラグが投稿のフラグ重み付けにカウントされないようにすることが重要です。

おそらく、これはユーザーのフラグ「同意(agreed)」インジケーターも変更することになるでしょう。というのも、それにも無視されたフラグが考慮されているからです?

「いいね!」 4

さて、今週のアクションリストはこちらです:

  1. 「無視」機能がユーザーの精度に影響しないことを確認する。

  2. TL4 ユーザーがフラグ 1 つで非 TL4 ユーザーのコンテンツを即座に非表示にするという特殊ケースを削除する。

  3. スコアに関係なく、非 TL4 ユーザーがフラグ 1 つでコンテンツを即座に非表示にするのを防ぐ:

    非表示の閾値を調整する予定です。現在、非表示の基準は特定のパーセンタイルを超えるスコアに基づいていますが、非表示に関してはこれがあまりにも低すぎると思います。計算の基準としては、投稿あたり平均 3 つのフラグに近いデフォルト値を設定し、そこから調整していきます。

    その間に、min flaggers to hide(非表示にするための最小フラグ数)の設定を復活させる可能性が高いです。これにより、ここで寄せられている不満の 90% は解消されると思います。スコアは依然として、最も悪質なものを目立つようにソートするのに役立ちますので、問題なく機能するはずです。

「いいね!」 6

最初の 2 つの修正は以下の通りです:

「いいね!」 4

実際、社内で議論した結果、TL3 から TL0 へのスパム処理を元に戻しました。この例外は重要であると考えて維持します。一方、TL4 の例外は引き続き削除されています:

「いいね!」 3

はい、いくつかの調整を行いました。最初の 2 つは、フォーラムがまだ新しく十分なデータがなく、適切な計算ができない場合の修正です。ソースを閲覧している際に、これが問題であると気づきました:

こちらは、このトピックでのフィードバックとより関連性が高いものです:

優先度の計算は、少なくとも 2 つのスコア(フラグ)を持つレビューアブルを中心に再編されました。このバージョンにアップグレードすると、コンテンツを非表示にするための閾値が引き上げられます。「中」の感度は、おおよそ 2 つのフラグに相当します。

ぜひ試していただき、改善されたかどうかフィードバックをお寄せください!

「いいね!」 8

@ubik 最新のコードをプルしたら、しばらく試してから、新しく改善された体験について長い返信を書いてくださいね :wink:

私たちは来週ほとんど不在になるため、この分野での変更はしばらくこれが最後になりますが、既存のフラグ付けシステムに対するこれらすべての変更は重要な改善だと信じています。

「いいね!」 1

min flaggers to hide に関連する変更が一切見当たりませんが、見落としているのでしょうか、それとも実装されなかったのでしょうか?
私にとってはこれが最も重要な変更でした。当面他の変更を加える予定がないのであれば、古いバージョンのソースに戻すことを余儀なくされる可能性が高いです。

以下の点について:
FIX: 無視されたフラグは精度スコアに含まれないようにする
フラグ付けの特殊ケースを削除
FIX: TL3 → TL0 のスパム処理を元に戻す

私の理解が正しければ、これらの変更は TL3 以上のユーザーにのみ影響し、TL0 や TL1 のユーザーに多くの問題がある現状では、これらは役に立たないでしょう。

また、以下の点について:
FIX: 感度設定がデフォルトで機能していなかった
閾値を計算する前に最小限のレビュー対象数を要求する
レビュー対象の感度/優先度の計算を微調整する

これらの変更は初期段階では多少役立つかもしれませんが、時間が経つにつれて悪化する可能性もあるように思えます。
ベースとなる感度の上昇は、時間の経過とともに何らかの形でユーザーの影響を受けるようですが、その具体的な仕組みは不明です。
target_count は、計算に含まれる投稿数が減るため、精度の蓄積を遅らせるように見えるようです(私の理解が正しければ)。ただし、単一フラグの投稿も除外されるため、一部のユーザーにとっては精度の蓄積が促進される可能性もあります。

何か見落としているのか、それとも変更内容を読み違えているのか、ご説明いただけますでしょうか?

self.target_count は app/jobs/scheduled/reviewable_priorities.rb で定義され、2 に設定されていることがわかりました。これをローカルで変更して再ビルドすれば、何かが隠されるまでに最低 3 つのフラグが必要になるのでしょうか?
─ 編集 ─ 少し読み進めるうちに、これは希望的観測だったのではないかと思いますが、とりあえずこの質問は残しておきます。私の現在の解釈では、これは「レビュー済みアイテムがユーザーの精度に影響を与えるために必要な最小フラグ数」を意味していると考えています。

あなたの理解は正しくありません。

修正:無視されたフラグは精度スコアに含まれないようにする
はい、これは TL3 未満に影響します。私のミスです。無視フラグは公開していません。

フラグ付けに関する特殊ケースを削除し、修正:TL3 以上のスパム処理を元に戻す(TL3 未満は対象外?)

最初の 3 つの修正をまだ正しく理解できていないのでしょうか?

「いいね!」 1

新しい計算により、スパムフラグ 1 つで新規ユーザーを黙らせ、すべての投稿を非表示にできるのでしょうか?silence_new_user_sensitivity 設定がデフォルトの「高」に設定されている場合、TL2 のユーザーがこれを可能にできるように思えます。以前は、新規ユーザーを黙らせるには 3 人の異なるユーザーがフラグを立てる必要がありました。この設定は現在も適用され、感度計算とどのように相互作用するのでしょうか。どちらが優先されますか?

これも本当に待ちきれません。フラグ1つで非表示になるため、モデレーターと怒っているユーザーの両方に追加の作業が発生しています。

「いいね!」 2

ほぼ1週間、最新バージョンで運用していますが、不適切なフラグ1つで投稿が隠されたままになっているケースがまだあります。例えば、この投稿のように。

また、レビュー可能なスコアリングが意味をなさない状態で投稿が隠されているケースもまだあります。例えば、この投稿のように。

投稿が隠される前に、以前の3つのフラグに戻せる設定を設けてください。新しいシステムは必要なく、私のユーザーも理解できていません。このシステムが一部のフォーラムには適しているのは確かですが、オプションとして選択可能にしてください。

「いいね!」 2