Problemi con SSO e carattere '~'

sweetbeems · 11 Febbraio 2025, 3:28am

Ciao a tutti,

Recentemente ho scoperto che se includo ‘~’ nella biografia di un utente, ottengo un errore di base64decode da Discourse. Può gestire correttamente tutti gli altri caratteri problematici (spazi, =, %, &) ma non ‘~’ per qualche motivo.

Qualcun altro ha riscontrato questo problema?

Il mio primo pensiero è che forse la mia codifica potrebbe essere errata, ma non sono riuscito a capirlo.

Ecco la mia implementazione Python della codifica:

return_payload = base64.urlsafe_b64encode(parse.urlencode(params).encode())

che viene poi inserito direttamente in ‘sso’ nelle richieste (insieme a tutte le altre informazioni necessarie)

resp = requests.post(
       ".../admin/users/sync_sso",
        data={'sso': return_payload, ...}
        headers={...}
)

Ho aggiornato il mio Discourse all’ultima versione (3.5.0.beta1-dev), ma il problema persiste.

Grazie per qualsiasi aiuto!

Jagster · 11 Febbraio 2025, 6:51am

Probabilmente dovrebbe essere risolto, ma quella domanda va oltre le mie competenze e capacità. Ma per pura curiosità pratica: perché qualcuno userebbe una tilde in una bio?

sweetbeems · 11 Febbraio 2025, 7:36am

Heh, immagino sia una domanda ragionevole.

Gestisco un forum multilingue e in altre culture ‘~’ viene spesso utilizzato. Ad esempio, in coreano, viene spesso usato alla fine per addolcire il tono, come “Se hai domande, fammelo sapere~”.

thoka · 11 Febbraio 2025, 7:42am

Quindi questo è un bug report e non una richiesta di supporto?

Jagster · 11 Febbraio 2025, 7:47am

Davvero? Un bug è qualcosa che è stato implementato, ma non funziona. Questo è più simile alla domanda “è stato completato o no” e, se non lo è, rientra più in Contribute > Feature che in una domanda di supporto.

sweetbeems · 11 Febbraio 2025, 7:50am

Sì, penso che Bug sia appropriato. Credo di codificarlo correttamente in base64, quindi anche discourse dovrebbe decodificarlo correttamente.

sam · 11 Febbraio 2025, 9:02am

Penso che sia un bug (a condizione che possiamo riprodurlo)

david · 11 Febbraio 2025, 10:43am

Sembra che urlsafe_b64encode sostituisca alcuni caratteri nella codifica base64. Dalla documentazione:

Codifica l’oggetto s simile a byte utilizzando l’alfabeto sicuro per URL e file system, che sostituisce - invece di + e _ invece di / nell’alfabeto Base64 standard e restituisce i byte codificati. Il risultato può ancora contenere =.

Ciò significa che il risultato non è base64 standard e non sarà compatibile con la decodifica di Discourse.

Consiglierei di utilizzare invece la normale funzione b64encode. La tua libreria HTTP dovrebbe occuparsi dell’escape degli URL, se necessario.

sweetbeems · 20 Febbraio 2025, 7:13am

Dopo ulteriori indagini, stavo effettivamente codificando in modo errato.

Ecco cosa ho finito per ottenere, per posterità:

return_payload = base64.b64encode(parse.urlencode(kwargs).encode("utf-8"))
h = hmac.new(secret.encode("utf-8"), return_payload, digestmod=hashlib.sha256)
resp = requests.post(
       ".../admin/users/sync_sso",
        data={"sso": return_payload, "sig": h.hexdigest()}
        headers={...}
)

E se stai facendo il reindirizzamento, assicurati di usare parse.urlencode per quel {"sso"…}.

Grazie per l’aiuto @sam e @david!

Argomento		Risposte	Visualizzazioni
Server-side sync_sso rejects valid payloads with 422 "Login Error" when the base64 contains a `+` (triggered by `~` in synced fields) Bug	0	39	Luglio 13, 2026
SSO and e-mail addresses having a plus sign Support	3	2115	Aprile 14, 2021
Watch out for double url encoding of SSO payload SSO	0	1567	Luglio 28, 2019
Registration email address special characters Support	2	500	Agosto 16, 2021
Unicode usernames Development rest-api	28	1706	Novembre 29, 2024

Problemi con SSO e carattere '~'

Argomenti correlati