Problemas com SSO e caractere '~'

sweetbeems · Fevereiro 11, 2025, 3:28am

Olá a todos,

Recentemente descobri que, se eu incluir ‘~’ na biografia de um usuário, recebo um erro de base64decode do Discourse. Ele consegue lidar com todos os outros caracteres problemáticos sem problemas (espaços, =, %, &), mas não com ‘~’ por algum motivo.

Mais alguém encontrou este problema?

Meu primeiro pensamento é que talvez minha codificação esteja errada, mas ainda não consegui descobrir.

Aqui está minha implementação em Python da codificação:

return_payload = base64.urlsafe_b64encode(parse.urlencode(params).encode())

que é então colocado diretamente em ‘sso’ nas requisições (junto com todas as outras informações necessárias)

resp = requests.post(
       ".../admin/users/sync_sso",
        data={'sso': return_payload, ...}
        headers={...}
)

Atualizei meu Discourse para a versão mais recente (3.5.0.beta1-dev), mas o problema persiste.

Obrigado por qualquer ajuda!

Jagster · Fevereiro 11, 2025, 6:51am

Provavelmente deveria ser corrigido, mas essa pergunta está acima do meu nível e das minhas habilidades. Mas por pura curiosidade prática: por que alguém usaria um til na bio?

sweetbeems · Fevereiro 11, 2025, 7:36am

Heh, acho que essa é uma pergunta razoável.

Eu administro um fórum multilíngue e em outras culturas o ‘~’ é frequentemente usado. Como exemplo, em coreano, ele é frequentemente usado no final para suavizar o tom, como ‘Se tiver alguma dúvida, me avise~’.

thoka · Fevereiro 11, 2025, 7:42am

Então este é um relatório de bug e não uma solicitação de suporte?

Jagster · Fevereiro 11, 2025, 7:47am

É mesmo? Um bug é algo que foi feito, mas não funciona. Isso parece mais com a pergunta “está pronto ou não?” e, se não estiver, seria mais adequado para o canal Contribute > Feature, em vez de uma pergunta de suporte.

sweetbeems · Fevereiro 11, 2025, 7:50am

Sim, acho que Bug é apropriado. Acredito que estou codificando em base64 corretamente, então o Discourse também deve decodificar corretamente.

sam · Fevereiro 11, 2025, 9:02am

Acho que é um bug (desde que possamos reproduzi-lo)

david · Fevereiro 11, 2025, 10:43am

Parece que urlsafe_b64encode substitui alguns caracteres na codificação base64. Da documentação:

Codifica o objeto s semelhante a bytes usando o alfabeto seguro para URL e sistema de arquivos, que substitui - em vez de + e _ em vez de / no alfabeto Base64 padrão, e retorna os bytes codificados. O resultado ainda pode conter =.

Isso significa que o resultado não é base64 padrão e não será compatível com a decodificação do Discourse.

Eu recomendaria usar a função b64encode normal em vez disso. Sua biblioteca HTTP cuidará do escape de URL, se necessário.

sweetbeems · Fevereiro 20, 2025, 7:13am

Após mais investigações, eu estava de fato codificando incorretamente.

Aqui está o que eu acabei tendo, para posteridade:

return_payload = base64.b64encode(parse.urlencode(kwargs).encode("utf-8"))
h = hmac.new(secret.encode("utf-8"), return_payload, digestmod=hashlib.sha256)
resp = requests.post(
       ".../admin/users/sync_sso",
        data={"sso": return_payload, "sig": h.hexdigest()}
        headers={...}
)

E se você estiver fazendo o redirecionamento, certifique-se de usar parse.urlencode para isso {“sso”…}.

Obrigado pela ajuda @sam e @david!

Tópico		Respostas	Visualizações
Server-side sync_sso rejects valid payloads with 422 "Login Error" when the base64 contains a `+` (triggered by `~` in synced fields) Bug sso	2	68	27 de Julho de 2026
SSO and e-mail addresses having a plus sign Support	3	2118	14 de Abril de 2021
Watch out for double url encoding of SSO payload SSO	0	1567	28 de Julho de 2019
Registration email address special characters Support	2	501	16 de Agosto de 2021
Unicode usernames Development rest-api	28	1734	29 de Novembro de 2024

Problemas com SSO e caractere '~'

Tópicos relacionados