Ein Modell anhand der Beiträge einer Website trainieren?

Vielleicht nicht im Geltungsbereich, aber es wäre interessant, ein Modell auf allen Beiträgen in meinem Forum zu trainieren und es zu verwenden, um einen KI-Bot als Expertenbenutzer zu erstellen, mit dem Benutzer interagieren könnten, oder der Fragen von Benutzern in Threads selbst beantworten könnte, und relevante frühere Beiträge verlinken/zitieren könnte.

3 „Gefällt mir“

Ich verstehe dich, aber hier gibt es massive Skalierbarkeitsprobleme. Das Training ist höllisch teuer und nicht einmal für GPT 3.5 / 4 verfügbar.

Die Branche drängt wirklich sehr stark auf

  1. Wachsende Token-Zahlen (z. B. Anthropic mit 100.000 Token-Kontext)
  2. Vektordatenbanken für Embeddings und das Verlassen auf Embeddings für den Kontext
6 „Gefällt mir“

Chatbot macht das bereits, ohne dass ein Training erforderlich ist. Es wird sogar kommerziell genutzt.

(Oh, ich bin mir nicht sicher, warum das hochgestuft wurde.)

2 „Gefällt mir“