Problemas recentes com Onebox

Nossos usuários têm reclamado que o Onebox está quebrado para alguns sites recentemente, incluindo New York Times e Washington Post. O Onebox mudou recentemente? Veja os links abaixo. O primeiro é um link de presente.

https://www.nytimes.com/2024/07/10/magazine/food-documentaries-health.html

https://www.washingtonpost.com/wellness/2024/07/16/nonstick-pans-pfas-teflon-flu/?itid=hp_ts-1-sallys-mix_p001_f008

https://www.washingtonpost.com/wellness/2024/07/16/nonstick-pans-pfas-teflon-flu/

1 curtida

onebox já funcionou com paywall :thinking:

1 curtida

Notei um número de URLs diretas sendo postadas recentemente, pensei que fossem dos sites, mas agora estou me perguntando se é mais do que isso :man_shrugging:

1 curtida

Recentemente adicionei suporte para oneboxes privadas do GitHub, mas isso não deve afetar outros sites. Geralmente não podemos fazer onebox de sites privados / com paywall:

Esses links também não aparecem para mim, mas o erro é exibido na pré-visualização:

https://www.nytimes.com/2024/07/10/magazine/food-documentaries-health.html

https://www.washingtonpost.com/wellness/2024/07/16/nonstick-pans-pfas-teflon-flu/?itid=hp_ts-1-sallys-mix_p001_f008

3 curtidas

Notei recentemente alguns comportamentos estranhos no Stable. Quando posto links de outras instâncias do Discourse (Tests-passed). Às vezes, aparentemente aleatoriamente, o link não faz “onebox” sempre.

Não tentei postar links do meu Stable no fórum Tests-passed.

Tentei reconstruir o HTML sem sucesso em fazer o link fazer “onebox”.

Acho que me lembro que há outro tópico aqui (no Meta) onde postei uma captura de tela.

1 curtida

Precisamos de exemplos claros de links que você acha que deveriam ser exibidos como onebox e não foram para que possamos agir.

2 curtidas

Este link do New York Times não funciona hoje:
https://www.nytimes.com/2022/03/10/dining/chowhound-closing.html#commentsContainer

Mas funcionou em 2022 em nosso fórum. Veja a primeira postagem.

Da mesma forma, este link do Washington Post não funciona hoje:
https://wapo.st/3J0aTO8

Mas funcionou em março deste ano em nosso fórum. Veja a 33ª postagem.

2 curtidas

Parece que agora está atrás de um paywall

2 curtidas

O New York Times e o Washington Post sempre foram publicações pagas. Embora eu não saiba se eles fizeram algo recentemente para mudar sua estrutura de paywall.

Embora, se posso fazer uma sugestão - se o paywall for o problema, e se for possível ver visualmente o título e a legenda do artigo na página com paywall, o onebox não deveria ser capaz de capturar essas informações?

3 curtidas

Sim, eu não discordo muito disso, olhei o código-fonte da página e sinto que temos informações suficientes para mostrar algo.

2 curtidas

O New York Times começou com paywall em 2011. Mas permitia algumas leituras sem registro e cartão de crédito às vezes, cinco se bem me lembro. Ao mesmo tempo, permitia a navegação do Google. Um sistema muito mais novo está bloqueando o acesso totalmente e, após uma briga com o Google, eles encerraram totalmente a leitura gratuita.

Será que a quebra do oneboxing aconteceu ao mesmo tempo?

2 curtidas

Como posso determinar o que é isso por mim mesmo?

Tenho um site que não faz onebox, posso adicionar algo a ele para que faça?

1 curtida

Você deve ler este tópico: Configuring and troubleshooting oneboxes

3 curtidas

Aqui está um link para o meu fórum Stable Discourse com links da minha outra instância do Discourse executando Tests-passed
https://community.openmr.com/t/apple-vision-pros-launch/41419/254?u=heliosurge

Aqui estão fotos nesse tópico 1 xrtropolis de não, não um na caixa enquanto posts posteriores um na caixa bem

1 curtida

Isso seria algo que a equipe consideraria adicionar para o Onebox - incluindo detalhes disponíveis para sites com paywall?

95% de certeza de que o onebox já faz isso. Se houver informações suficientes para exibir um onebox, ele o fará, mesmo que o conteúdo seja, em última análise, paywalled.

O que eu acho que acontece é que o onebox está sendo denylisted por esses sites paywalled devido a recentes crawlers/agentes de LLMs, então ele não vê o mesmo HTML que poderíamos ver ao usar um navegador.

No entanto, ficarei feliz em ser provado errado. Se alguém quiser dar uma olhada rápida para ver se consegue melhorar de alguma forma, pr-welcome :wink:

1 curtida

Este tópico foi fechado automaticamente 30 dias após a última resposta. Novas respostas não são mais permitidas.