Preguntas sobre el algoritmo del Nuevo Usuario del Mes

Hola,
Fui un nuevo usuario en un foro de Discourse con más de 930 “me gusta” al final de mi primer mes. Los poseedores del título de “nuevo usuario del mes” fueron dos personas, una con alrededor de 40 “me gusta” y la otra con 60. He mirado el código proporcionado en una publicación anterior en este sitio y no debería haber sido posible que esta situación se desarrollara como lo hizo. Mirando solo mis “me gusta” principales, hice los cálculos usando los valores asignados a un “me gusta” de cada nivel de confianza y obtuve un número como 360 solo por mis “me gusta” principales. Luego, haciendo los cálculos para el usuario con 60 “me gusta”, multipliqué ese número por tres, incluso si hubiera recibido “me gusta” de un administrador las sesenta veces, todavía no habría estado cerca de 360. ¿Qué pasó aquí? Ambos nos unimos con días de diferencia a mediados de noviembre… ¿qué no estoy considerando? No quiero sonar amargado, pero fue bastante decepcionante/confuso. Hasta ahora, nadie ha podido darme una respuesta que no sea “El nuevo usuario del mes es una estafa”. Así que cualquier información sería útil, pero ten en cuenta que ya he visto el código. ¡Gracias!

3 Me gusta

Miré el código. No solo los “me gusta” se ponderan según la antigüedad, sino que el total también se divide según cuántas cuentas distintas dieron “me gusta” a tus publicaciones. Supongo que es una medida de popularidad generalizada.

Editar: ups, tal vez se divide por el número de publicaciones y no por cuentas; ver más abajo en el hilo.

4 Me gusta

También tuve eso en cuenta, sin embargo.
Es realmente extraño, parece.

¿Entonces cuentas diferentes? Vaya. Tiene sentido… No puedo obtener los datos de eso, pero sigo pensando que es extraño.

¡Gracias por la ayuda, de todos modos!

¿Has revisado Dataexplorer? Está integrado en el núcleo y puede que ya exista un script para la consulta.

En cuanto a modificar el nuevo usuario del mes, no estoy seguro de las opciones. Sin embargo, creo que en la configuración del sitio puedes modificar los pesos por nivel de confianza (TL).

No, no lo he hecho. Quizás lo intente.
¡Gracias!

1 me gusta

Esto puede ayudar a localizar los personalizados que la gente ha compartido.

2 Me gusta

Solo los administradores de un foro pueden usar Date Explorer, por lo que no puedes usarlo para obtener datos como usuario.

Escribiste mucho sobre el recuento total de “me gusta”, pero no mencionaste el recuento de publicaciones. La puntuación calculada a partir de los “me gusta”, ponderada por el nivel de confianza del usuario, se divide por el número total de publicaciones que realizaste:

Entonces, tal vez recibiste más “me gusta”, pero también publicaste con más frecuencia que los usuarios que recibieron la insignia.

7 Me gusta

Eso explica mucho. ¡Gracias!
(pero no tiene mucho sentido. Publicar más debería considerarse una contribución a la comunidad y no debería perjudicar la puntuación, en mi opinión.)

¿Qué contribuye más a una comunidad? ¿Muchas publicaciones con pocos “me gusta” debido a su falta de atractivo, o un puñado de publicaciones que capturan el interés de los usuarios con muchos “me gusta”?

(Soy consciente de que el uso de los “me gusta” difiere de una comunidad a otra, algunas comunidades cuyos usuarios típicos no ven el valor de dar “me gusta” a una publicación, o no es su costumbre, etc.)

2 Me gusta

Estoy de acuerdo, en su mayoría veo tu punto, pero creo que es un escenario diferente en mi foro.
La mayoría de las publicaciones rara vez obtienen más de uno o dos “me gusta”, y el nuevo usuario del mes no tiene en cuenta las soluciones, lo que creo que podría ser bueno (pero no estoy seguro de si es un plugin) o incluso hacer que la insignia no sea automática, para que los moderadores o administradores tengan que elegir. Eso haría que la insignia se adaptara mejor a cada foro.
Yo diría, ¿crees que tener 1.1K “me gusta” con alrededor de 700 publicaciones y 60 soluciones en dos semanas se considera útil en un foro o tener alrededor de 60 “me gusta” y 40 publicaciones (en aproximadamente la misma cantidad de tiempo) se considera más material para “nuevo usuario del mes”?
¡Felices fiestas, por cierto!

2 Me gusta

Este es un muy buen punto y estoy de acuerdo contigo en que el algoritmo actual podría ser demasiado simplista. Creo que un buen primer paso sería hacer que el factor de publicación sea no lineal, como

SUM(...) / SQRT(5 + COUNT(DISTINCT p.id))::float AS score

o tal vez incluso

LN(1 + SUM(CASE ... END)) / (5 + COUNT(DISTINCT p.id))::float AS score

4 Me gusta

Un enfoque para favorecer las publicaciones más apreciadas es tomar la suma de los cuadrados de los “me gusta” y luego dividir por el número de publicaciones.

Me pregunto si mi interpretación errónea podría tener valor: tener en cuenta el número de cuentas distintas que dan “me gusta”. Podría, por ejemplo, ayudar contra grupos o anillos de votación.

De paso, observo que mi foro solo eligió 13 ganadores de un posible total de 24 insignias de nuevo usuario del mes en los últimos 12 meses.

2 Me gusta

Sí, estoy de acuerdo. Esa podría ser una buena idea.

¿Podrías explicar eso en inglés? Apenas pude entender el código del nuevo usuario del mes, jaja.

¿Alguien con un nivel de confianza más alto podría editar el título a “Preguntas sobre el nuevo algoritmo de usuario del mes” o algo similar? Evidentemente no es un error. Solo un poco peculiar.
Gracias @Moin!

2 Me gusta

El “problema” es que la puntuación es (básicamente)

$$\text{Puntuación} = \frac{\text{# Me gusta}}{\text{# Publicaciones}}$$

Eso es algo que probablemente no es la situación deseada, como ya notaste. Si su número promedio de me gusta es el mismo, una gran cantidad de publicaciones debería calificarse más alto que una cantidad baja de publicaciones.

Entonces, para “solucionar” este problema, deberíamos cambiar la función: el denominador de la fracción debería aumentar menos si el número de publicaciones aumenta. Podemos solucionar esto aplicándole una función. Los candidatos habituales son SQRT y LN, ya que son crecientes pero menos que lineales:

Por lo tanto, al cambiar el divisor por algo que aumenta menos rápido a medida que aumenta la cantidad de publicaciones, la puntuación se vuelve más alta (después de todo, dividir por algo más pequeño da un resultado más grande). Cambiar la fórmula para aplicar SQRT o LN al divisor da el resultado deseado (“Una gran cantidad de publicaciones debería calificarse más alto que una cantidad baja de publicaciones, si su número promedio de me gusta es el mismo”).

La segunda fórmula intenta evitar el efecto no deseado opuesto: un pequeño número de publicaciones muy populares tampoco debería poder dominar la puntuación.

3 Me gusta

Si eres un administrador, puedes ir a la configuración del sitio y cambiar los factores de ponderación para igualarlos.

Por ejemplo, puedes cambiar la ponderación por nivel de confianza e incluso para el personal. Puedes cambiar la ponderación para que, sin importar el nivel de confianza o si es personal, los “me gusta” se ponderen por igual en lugar de aumentar según el puesto.

No soy un administrador, pero gracias de todos modos.
Parece que se aprende algo nuevo cada día :grinning:

¡Gracias por explicarlo! Esa es una solución genial. Ojalá eso fuera algo para mi foro ahora…

2 Me gusta

Eso no es realmente cierto en la mayoría de los casos. En esta lógica, lo que señalará si tus publicaciones son realmente útiles es exactamente el número de “me gusta”. Si publicas mucho, pero no puedes mantener una alta proporción de “me gusta” por publicación, eso demuestra que estás siendo hablador y posiblemente haciendo preguntas que podrías haber buscado.

Por ejemplo, tus preguntas ya se discuten en

2 Me gusta

De acuerdo. Me disculpo por publicar esta pregunta, sin embargo, no estoy de acuerdo. Diferentes foros utilizan los “me gusta” de manera diferente, y creo que la solución que publicó @RGJ sería útil en la mía. No todos los foros se inclinan a dar “me gusta” a cada publicación, porque a menudo solo nos inclinamos a dar “me gusta” a algo cuando nos anima y está de acuerdo con algo que hemos dicho. Tener razón a menudo no es suficiente para justificar un “me gusta” de la mayoría de los usuarios. Miraré tu enlace, pero no lo había visto antes. No creo que fuera necesario publicar con la misma opinión que al principio de la discusión a la que ya respondí. ¿Podemos estar en desacuerdo?

Piénsalo, sin embargo. Si eres genuinamente útil, entonces cuanto más publiques, mejor. De eso creo que debería tratar la insignia.
En la publicación que enlazaste, puede que tuvieras razón sobre los datos, pero estar activo en una comunidad no se trata solo de números. Antes dije que si solo hubiera publicado lo correcto una vez en el tema correcto y luego me hubiera vuelto totalmente inactivo, podría haber ganado la insignia. Eso es una laguna que no está bien.

Exactamente.

Así que con la fórmula actual, un usuario que creó una sola publicación “Me rindo, este foro es una mierda” que recibe 20 me gusta tendrá una puntuación más alta que un usuario que creó 60 publicaciones útiles que recibieron 200 me gusta en total.

Eso no parece correcto (para mí).

4 Me gusta

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.