У меня есть запрос на создание дашбордов Data Explorer на уровне категории с определёнными ключевыми метриками, которые будут автоматически обновляться каждый месяц и отправляться модераторам категорий, чтобы они могли отслеживать показатели и принимать бизнес-решения на их основе.
Анализ тональности — этот запрос также сделан на уровне категории. Я изучил таблицу classification_results, чтобы понять, как выполнить соединение, однако в ней мало столбцов, и есть только один с названием target_id, но я не знаю, что он обозначает. Кроме того, я вижу его только в таблицах, связанных с ИИ.
Итак, просто для проверки: если target_type равен ‘post’, то мне нужно соединить classification_results.target_id с posts.id, верно?
А если target_type — что-то другое, например ‘comment’, то тогда я должен соединять его с таблицей comments? Просто хочу убедиться, что я соединяюсь с правильной таблицей в зависимости от типа.
Не уверен, что комментарии обрабатываются AI-анализом тональности. Это target_type, который вы видите в своих данных?
Похоже, сейчас поддерживаются только посты, но формат позволяет в будущем расширить его на другие сущности. Однако мой набор данных ограничен, поэтому, если вы сможете выполнить этот запрос и посмотреть, какие типы у вас есть, это будет очень полезно:
SELECT target_type
FROM classification_results
GROUP BY 1
Я вижу только тип цели «пост». Правильно ли я понимаю, что пост сам по себе представляет собой совокупность нескольких типов? Например, одна тема может содержать 10 постов. Значит ли это, что в данном случае анализ тональности применяется 10 раз — по одному разу к каждому посту темы? То есть, если задача состоит в создании панели управления, отображающей показатель тональности по темам в разрезе категорий, следующим шагом будет понимание того, к скольким из постов темы был применён анализ тональности, а затем вычисление среднего значения?
Анализ тональности применяется на уровне поста, поэтому каждый пост будет иметь свою запись в таблице classification_results. Для каждого поста также будет отдельная запись для каждой примененной модели, поэтому, в зависимости от того, какие результаты вас интересуют, вам нужно будет отфильтровать именно те, которые относятся к конкретной модели.
Думаю, это зависит от того, какие результаты вас интересуют. Положительная/отрицательная тональность может лучше подходить для такой концепции. Эмоциональные показатели, возможно, лучше расположить в виде отдельных столбцов для каждой темы.
Однако вы можете почерпнуть некоторые идеи из существующих примеров: