Falco
(Falco)
1
Discourse AI を発表できることを嬉しく思います。これは、人工知能と Discourse を統合するための新しいプラグインであり、ワンストップ ソリューションです。これにより、新機能の有効化と既存機能の強化が可能になります。この最初のリリースでは、コミュニティ マネージャー、メンバー、モデレーターが、感情分析から自動校正、提案された編集まで、さまざまなタスクを支援する 7 つの異なる Discourse AI モジュールを出荷します。これらの各機能の詳細と、ロードマップで次に何が来るかについて読み進めてください。
これは、元のエントリ https://blog.discourse.org/2023/04/introducing-discourse-ai/ のコンパニオン ディスカッション トピックです。
「いいね!」 62
justin
(Justin DiRose)
2
これは素晴らしい業績ですね、@Falco とチームの皆さん。これが実際にどのように機能し、コミュニティ管理全体にどのような影響を与えるのか、本当に楽しみです。
「いいね!」 20
ozkn
(Mathx)
3
プラグインありがとうございます。画像からテキストを抽出する機能を楽しみにしています。
「いいね!」 6
まるでクリスマスプレゼントを開けるようなアップデートです。
(現時点では)コミュニティ担当の専任マネージャーがおらず、このようなツールは専任の役割なしで規模を拡大し続けることを可能にします。
言うまでもなく、ユーザーエクスペリエンスを向上させるコンポーザーヘルパーのような機能もあります。
「いいね!」 15
素晴らしいですね!ビジネスプランでのAI機能の提供を楽しみにしています 
「いいね!」 7
これをとても楽しみにしています。できるだけ早く追加します。
AIによる投稿/コメントスパムの検出にAIを使用する計画はありますか?(一般的に)コミュニティでは大きな問題となっています。
「いいね!」 9
Jagster
(Jakke Lehtonen)
9
いいね!でも…どうして良いものはいつもこんなに高いんだ 
「いいね!」 1
Canapin
(Coin-coin le Canapin)
12
テキストを生成したり、回答を得たいのであれば、もっと安価な昔ながらの方法がありますよ 
「いいね!」 15
sam
(Sam Saffron)
13
こんにちは、ロージーさん
はい、この領域を調査する予定です。難しいのは、プロンプトの制限により GPT-4 に入力できる例がごくわずかしかないことです。トークン制限を満たすのは非常に困難です。ただし、他にもかなりの数のアプローチがありますので、調査してご報告します。
わずかなファインチューニングでも、GPT-4 は物事を評価するのにひどい仕事をするわけではありません。
「いいね!」 13
mattdm
(Matthew Miller)
14
コードの長いブロックやsyslog出力を含む投稿で試していただけますか?それらは常に当社のサイトでakismetによってスパムとしてタグ付けされています。
「いいね!」 9
GPT-4のコストが許容できるのであれば、GPT-3のファインチューニングでこれを解決できるのではないでしょうか?
「いいね!」 4
sam
(Sam Saffron)
17
おそらくそうですが、モデルの微調整は非常に高価になります。単純に埋め込みを使用することで非常に良い結果を得ている人もいます。おそらく次に試すべきことはそれでしょう。
「いいね!」 4
確認したところ、ファインチューニングは予想よりもはるかに安価でした。トレーニングデータの量に大きく依存しますが、単一のGPT-4に収まるサイズと比較した場合、数セントです。
まだ使用する段階には至っていないため、何か見落としている可能性があります。もし間違っていたら訂正してください。
https://openai.com/pricing
「いいね!」 3
トレーニングは非常に、非常に高価になる可能性があります。私の場合は、トレーニングの計算において、OpenAIが推奨する最小トレーニングだけでも、単一のユースケースでのトレーニングに約20万ドルかかることになります。
「いいね!」 5
TL1の制限で新規ユーザーが混乱するという問題はまだありますか?
もしそうなら、AIが解決策として役立つと思います。新規ユーザーにもっと多くのことを許可しつつ、AIがそれらを注意深く監視し、問題がないと確信できない場合はモデレーターキューに入れるのです。
mattdm
(Matthew Miller)
22
リクエストされたとおり:Akismetによってスパムとフラグが付けられた、スパムではないAsk Fedoraの投稿:
「いいね!」 7
mattdm
(Matthew Miller)
23
これらの感情分析がどのように分類されるのか、私も非常に興味があります!
「いいね!」 4
sam
(Sam Saffron)
24
問題ありません。@Falco は今日これについてスパイキングを行っており、非常に有望に見えます。些細なプロンプトでも驚くほどうまくいきます。スパムはあまりにもスパム的です。
詳細は Falco に任せます。
さらに興味深いアプローチとして、ベクトルデータベースに頼ることも考えられます。何かを投稿し、そのベクトルが他の 20 のスパムに近い場合…それはおそらくスパムでしょう。このアプローチはファインチューニングを可能にします。
正直なところ、Akismet の将来はあまり明るくないと思います。Matt は長期的なことを考えるとストレスを感じているに違いありません。
「いいね!」 4