Richiesta di funzionalità: registrazione nativa di messaggi vocali e trascrizione audio automatica

Ciao team di Discourse,

Vorrei suggerire una nuova funzionalità che farebbe una grande differenza per l’accessibilità e il coinvolgimento nella piattaforma Discourse: supporto nativo per la registrazione e la pubblicazione di messaggi audio direttamente negli argomenti e nelle risposte, insieme alla trascrizione automatica da audio a testo (simile a ciò che offrono Instagram e WhatsApp). Ho visto alcune discussioni su plugin e componenti per questa funzionalità, inclusa l’informazione che quello disponibile non funziona al momento. Dato che non ho le competenze per installare un plugin da GitHub da solo e provarlo, uno strumento nativo integrato nel sistema con un semplice interruttore di abilitazione/disabilitazione sarebbe meraviglioso per gli utenti finali non esperti come me =)

Perché questa funzionalità?

Per molte persone, digitare non è sempre il mezzo di comunicazione più efficace o accessibile. Questo può includere:

  • Persone con disabilità o lesioni temporanee che rendono difficile la digitazione.

  • Membri della community che preferiscono parlare a causa del livello di alfabetizzazione o per comodità.

  • Utenti su dispositivi mobili che desiderano una comunicazione più veloce e a mani libere.

Consentire agli utenti di registrare e pubblicare audio (note vocali) anche nei commenti ridurrebbe drasticamente le barriere alla partecipazione e renderebbe le community di Discourse più inclusive.

Perché la trascrizione è importante?

La trascrizione automatica dei messaggi vocali garantirebbe che tutti gli utenti, compresi coloro che non possono ascoltare l’audio (ad esempio, a causa di disabilità uditive o quando si trovano in un ambiente silenzioso), possano comunque partecipare e interagire pienamente con i contenuti sulla piattaforma.

Integrarla nativamente (come fanno Instagram, WhatsApp o Google Messages) avvicinerebbe le piattaforme Discourse agli standard più avanzati di inclusività e accessibilità.

Cosa è stato provato finora?

Ho visto che ci sono state soluzioni precedenti della community:

Tuttavia, la maggior parte di questi non sono attivamente mantenuti, non sono completamente integrati o mancano di funzionalità di trascrizione. C’è un chiaro interesse continuo da parte della community riguardo alle funzionalità audio e alla conversione voce-testo integrata.

Funzionalità suggerita

  • Consentire la registrazione diretta di audio (note vocali) nel composer per argomenti e risposte.

  • Supportare il caricamento di file audio come alternativa.

  • Integrarsi con un servizio di sintesi vocale per generare e visualizzare automaticamente una trascrizione con ogni post audio.

  • Opzione per modificare o correggere le trascrizioni prima della pubblicazione.

  • Controlli di moderazione per gestire e rivedere i contenuti audio.

Conclusione

Questa funzionalità distinguerebbe Discourse come una piattaforma inclusiva e moderna che supporta una vasta gamma di utenti e situazioni.

Grazie per aver preso in considerazione questa proposta! Io (e altri nella community) saremmo davvero entusiasti di vedere qualsiasi progresso in questa direzione.

7 Mi Piace

Lo apprezzerei personalmente. Mi sono rotto una mano l’anno scorso e, sebbene la dettatura di Apple funzioni abbastanza bene, mi sarebbe piaciuto poterla fare anche direttamente in Discourse. Detto questo, personalmente tendo a divagare quando detta! :laughing:

Mi piacerebbe anche questo per il forum della mia famiglia dove, tra le altre cose, condividiamo e parliamo di foto. Poter registrare un messaggio in modo che la voce venga catturata e poi trascritta sarebbe oro puro.

Grazie per aver pubblicato la richiesta in modo così conciso.

3 Mi Piace

Questo sembra qualcosa che dovrebbe essere gestito dal lato del computer. Imparare a usare un sistema di dettatura e farlo funzionare sembra già abbastanza difficile. Averne uno diverso su ogni pezzo di software che usi sembra che sarebbe terribile. Cercare di supportare la dettatura su più piattaforme tramite il browser sembra anche insostenibile.

Non preferiresti vedere che la voce su testo funzionasse effettivamente prima che venisse caricata su un forum? La voce su testo non funziona meglio sul tuo computer, dove può essere addestrata alla tua voce?

Sono tutto per supportare tutti i tipi di utenti, ma non vedo come abbia senso che ogni singola applicazione web sia responsabile della trascrizione. Non ci aspettiamo che Discourse legga il testo ai non vedenti, Discourse fornisce HTML con cui l’applicazione scelta dall’utente può lavorare.

6 Mi Piace

L’accessibilità è un caso d’uso (probabilmente il principale), ma non l’unico.

Dato che un forum ha lo scopo di facilitare interazioni significative e costruire una community, offrire più di un modo per condividere un pensiero sembra prezioso. Non so quanto complesso sarebbe dal punto di vista dello sviluppo, o se ne varrebbe la pena, ma continuo a pensare a quanto facilmente le persone si esprimano nei gruppi WhatsApp semplicemente perché l’opzione per registrare una nota vocale è lì a portata di mano. Sarebbe meraviglioso avere qualcosa di simile in un forum, dove le conversazioni possono essere meglio organizzate per argomenti e categorie.

Io stesso uso spesso la funzione di Instagram che trascrive le note vocali invece di riprodurle. È comodo quando non voglio usare le cuffie, tenere il telefono all’orecchio o riprodurre l’audio ad alta voce. Avere un’opzione simile in un forum renderebbe le note vocali molto più pratiche. E personali.

Naturalmente, i forum non sono esattamente progettati per persone a cui non piace leggere o scrivere, o che trovano troppo complicato passare da un’app all’altra solo per copiare e incollare il testo trascritto. Ma nel mio caso, la maggior parte delle persone nel forum che gestisco accede a Discourse dai propri dispositivi mobili piuttosto che dai computer. Immagino che questo cambi come e quando partecipano. Molti potrebbero rinunciare a pubblicare semplicemente perché in quel momento non possono digitare molto. Poter parlare e pubblicare una nota vocale, o ancora meglio, trascrivere il parlato in testo e modificarlo in seguito, farebbe una grande differenza.

D’altra parte, le note vocali rendono la moderazione più impegnativa, quindi questo è qualcosa su cui dobbiamo riflettere collettivamente, considerando il maggior numero possibile di scenari utente diversi.

2 Mi Piace

OOOOOOOh. Hai ragione.

Capisco. È perché sono vecchio. Odio solo parlare con un computer. Anche quando sarebbe ovviamente più veloce della mia insistenza nello scarabocchiare sulla tastiera del mio telefono.

Avere un’interfaccia che ti permettesse di registrare o caricare un file audio e poi trascriverlo non dovrebbe essere così difficile. Penso che un componente del tema potrebbe occuparsi della parte di caricamento e forse il plugin AI esistente potrebbe gestire la trascrizione. (E la cosa divertente è che ho passato le ultime due o tre settimane su uno strumento di trascrizione Open Source!)

5 Mi Piace

Beh, la registrazione non è una richiesta nuova, ed era piuttosto difficile farla funzionare bene. Ma — un forum non fa foto o video, quindi perché l’audio dovrebbe essere diverso? Abbiamo tutti dispositivi che possono farlo e il resto è solo un bel player :thinking:

2 Mi Piace

Beh, capisco il tuo punto, ma non è esattamente la stessa natura di mezzo.

In un forum di solito condividiamo immagini create da qualcun altro, ma le note vocali contengono generalmente la tua voce in modo più personale. Almeno questo è l’obiettivo.

Lo sforzo necessario per produrre le proprie foto, video e note vocali è piuttosto diverso, e le note vocali sono solitamente il modo più rapido e diretto per condividere un pensiero. Scattare o selezionare una foto, o registrare e caricare un video, spesso richiede più passaggi.

Ma con l’audio, specialmente se la funzionalità è integrata nello strumento che stai già utilizzando, puoi semplicemente parlare e inviare. È una barriera inferiore alla partecipazione, motivo per cui vedo valore nell’avere quell’opzione in un contesto di forum.

Vedo ancora più valore nella capacità di trascrivere e avere sia l’audio che il testo, a causa delle sfide di moderazione e ricerca che l’audio da solo potrebbe comportare.

6 Mi Piace

Vorrei dare un +1 all’idea di Suelen. Mia moglie e sua sorella hanno il morbo di Parkinson e usano Siri per inviare ogni messaggio ed email. Osservo e rifletto ogni giorno sui dettagli del loro utilizzo e penso a come anche le persone non disabili potrebbero interagire meglio con il loro software tramite voce.

Sebbene Discourse sia ottimo sotto molti aspetti, la sua principale caratteristica distintiva rispetto ai vecchi sistemi BBS è che funziona bene su telefoni e tablet, oltre che nel browser. E i telefoni sono principalmente dispositivi vocali.

Se dovessi creare una suite di test per ciò che Discourse dovrà essere nel 2030-35, includerebbe la possibilità di accedere a un sito Discourse con un telefono e semplicemente navigare nella community auralmente. Idealmente, si potrebbe navigare tra categorie e thread solo tramite voce e audio e leggere il contenuto tramite sintesi vocale quando richiesto.

Molto più importante dell’IA e molto più semplice da realizzare. E mentre ogni dispositivo avrà il suo modo di trascrivere il parlato in testo e correggere gli errori, non si vuole fare affidamento su questi sistemi se sono bravi, gratuiti o coerenti, se possibile.

Sarebbe una funzionalità enorme perché Discourse ha così tanto da offrire, e sono curioso di sapere quali sarebbero i costi delle trascrizioni, ma penso che sia davvero un suggerimento molto valido da approfondire.

1 Mi Piace

Noi in linea di principio, e in pratica, abbiamo già gli strumenti necessari se solo li usassimo. Ho parlato questo testo in finlandese. Dopo di che, AI l’ha tradotto in inglese e tutto va bene.

1 Mi Piace