Generative Subtitles: dalla parola alla comprensione

Shirley Coady 03 set 2024 Tempo di lettura: 8 minuti
An introduction to translation collaboration
L'anno scorso ho scritto un blog sulla localizzazione video. Un anno è un periodo di tempo incredibilmente lungo nel campo della tecnologia; in realtà lo è in ogni ambito. Negli ultimi 12 mesi, Capo Verde è stato il primo paese subsahariano ad aver debellato la malaria dopo 50 anni, secondo l'OMS. La regina Margherita di Danimarca, che era l'ultima sovrana regnante al mondo, ha abdicato. Il Giappone è stato il quinto paese ad aver condotto un veicolo spaziale sulla luna.  E TikTok è diventata la terza piattaforma di social media più scaricata al mondo.  
 
Pare che la nostra tendenza sia quella di registrare video su qualsiasi evento, a prescindere dalla sua natura. Statista prevede che i contenuti multimediali genereranno 1,6 trilioni di dollari di fatturato nel 2024 e continueranno ad aumentare. I consumatori si stanno abituando sempre più a ricevere informazioni condensate in brevi video o ad avere qualsiasi film desiderino a portata di mano. Lavoriamo anche giorno e notte registrando riunioni (suggerimento di vita vissuta: ho scoperto un ottimo trucco per risparmiare tempo, ovvero saltare le riunioni in cui non devo fornire alcun contributo e successivamente guardare le registrazioni a una velocità 1,5 volte superiore). 
 
Contemporaneamente, la tecnologia dell'intelligenza artificiale sta compiendo passi da gigante. Al momento sto aspettando che porti a termine le mie faccende domestiche. Quando avremo un Roomba in grado di pulire le scale? Ma nel frattempo possiamo continuare a sviluppare nuovi modi per aumentare la produttività, migliorare la qualità e risparmiare denaro.  
 
La competenza umana continua a guadagnare valore, mentre l'intelligenza artificiale è destinata a svolgere le nostre attività più comuni. Ne consegue che la localizzazione video rimane un campo estremamente costoso e altamente specializzato. Per quale motivo? Riporto direttamente quello che ho scritto l'anno scorso nel mio blog: 
  • È molto complesso. Esistono applicazioni specializzate che vengono progettate per consentire ai professionisti di svolgere questo lavoro. 
  • I sottotitoli sono difficili da tradurre. Ci sono limiti di lunghezza per il testo, il testo deve adattarsi al video, le frasi vengono tagliate a causa di pause o cambi di scena, e così via. Ci sono buoni motivi per cui questo viene solitamente gestito da professionisti. 
  • La traduzione automatica non funziona bene con i frammenti di segmento, ma i sottotitoli devono corrispondere a ciò che viene visualizzato sullo schermo in un video. 
  • Il controllo di qualità richiede molto tempo. È necessario guardare, ascoltare e leggere più e più volte, tutto il video in tutte le lingue. 
  • Anche il millisecondo conta. Gli spettatori si accorgono se i sottotitoli sono sfalsati rispetto al parlato. 
Quando uscirà la prossima stagione di Squid Games, vorrei che i sottotitoli fossero quasi perfetti. Per favore, Netflix, assicurati che siano coinvolti linguisti professionisti! Invece, per un webinar, ad esempio, ho solo bisogno di comprenderne i contenuti, non c'entra alcuna scena sconvolgente. Purtroppo, a causa del costo elevato della localizzazione video, i webinar, che vengono organizzati con budget ridotti, di solito non sono sottotitolati o localizzati... fino ad ora! 
 

Presentazione della nuova funzionalità Generative Subtitles di Trados

 
Con Generative Subtitles potete creare rapidamente un progetto di traduzione su cloud per il vostro video (utilizzando il portale dedicato ai clienti o un connettore predefinito) e ammirare i sottotitoli che vengono generati automaticamente, rispettando le best practice del settore. Aggiungeteci un prompt personalizzato per assicurarvi che il vostro nome venga pronunciato correttamente dal presentatore che vi annuncerà con voce suadente nel video.  
 
Fantastico, vero? Metà del problema è risolto. Tuttavia, anche la localizzazione rappresenta decisamente una sfida. Oppure, dovrei dire che anche la localizzazione RAPPRESENTAVA una sfida! 
 
Cosa accadrebbe se invece di tradurre frammenti di segmenti, prendessimo ora il file con i sottotitoli e utilizzassimo un LLM per tradurlo? E se inviassimo all'LLM un riepilogo del video in modo che possa lavorare con il contesto? E se inviassimo contemporaneamente la vostra terminologia? 
 
Avete indovinato: otterreste una localizzazione dei sottotitoli di qualità! Ecco come funziona: 
 

   
 
Aspettate. Questo ultimo passaggio "Rivedi nell'Online Editor con anteprima dal vivo"… L'avete notato anche voi, vero? Molto bravi. Beh, spesso, per webinar, video di formazione ecc. l'automazione completa è molto buona. Il mio capo aveva un tono piuttosto basso mentre registrava le sue istruzioni, e io ho bisogno di rendere la sua voce più chiara e comprensibile. Esaminiamolo nel dettaglio. 
 

Schermata dell'anteprima in contesto in funzione nell'Online Editor  
 
Ammirate il testo dell'Online Editor che scorre durante la riproduzione del video, con l'audio. I sottotitoli vengono aggiornati in tempo reale mentre modificate il testo. Desiderate segnalare dei segmenti in modo che possiate chiedere successivamente al vostro capo cosa stava pensando? Oppure, se stai leggendo questo Matt (il mio capo), intendevo dire in modo che possiate successivamente congratularvi con il vostro capo per le sue profonde conoscenze. 
 
So che state pensando: sembra troppo bello per essere vero! Sto sognando? 
 
Se sentite la mia voce e vedete i sottotitoli che compaiono sotto la mia testa, la risposta è... probabilmente SÌ! Ma in caso contrario, parliamo di tutte le cose abituali.  
  • Sicurezza e privacy? Ci sono! Gli LLM utilizzati in questa favolosa soluzione sono integrati nella struttura di RWS Language Cloud. I vostri dati non diventeranno mai pubblici.  
  • Automazione del flusso di lavoro? C'è! Questa soluzione si basa sull'ambiente cloud standard di Trados, che include modelli di progetto, modelli di flusso di lavoro, assegnazioni delle attività e così via. Date un'occhiata a questi video e poi concedetevi una pausa caffè. 
  • Reporting? C'è! Si tratta di progetti non comuni. Continueremo ad aggiungere nuovi dati a scopo di monitoraggio, ma vi garantisco che la vostra produttività salirà alle stelle. 
  • È fantastico! A questo punto probabilmente vi state chiedendo cos'è che non può fare Trados. 
Beh, Deadpool & Wolverine non verrà sottotitolato utilizzando solo Trados. I nostri amici della Marvel useranno probabilmente una soluzione dedicata insieme ad esso, come una delle soluzioni dei nostri partner, ad esempio CaptionHub, che consente loro di modificare le indicazioni di minutaggio, spostare i sottotitoli sullo schermo e tradurre il linguaggio colorito di Deadpool in modo più colloquiale.  
 
Desiderate vedere i risultati? I nostri video Elevate sono stati sottotitolati e localizzati utilizzando questa soluzione. 
 
Desiderate una dimostrazione pratica? Contattate il vostro account manager per programmare una demo… Portate dei popcorn, perché i file multimediali diventeranno presto il vostro nuovo tipo di file preferito. 
Shirley Coady
Autore

Shirley Coady

Director of Product Management

Shirley Coady vanta oltre 20 anni di esperienza nella tecnologia linguistica. Ha iniziato la sua carriera come sviluppatrice di software, quindi si è trasferita in un'azienda start-up dove ha assunto ruoli aggiuntivi, tra cui assistenza tecnica e servizi professionali.


Con la crescita dell'azienda, la creazione di prodotti è rimasta la sua passione, pertanto è passata al ruolo di gestione dei prodotti. Attraverso varie fusioni e acquisizioni, ha gestito sia concetti elaborati da zero che prodotti esistenti in piccole, medie e grandi imprese. 


Nel 2022 ha assunto la guida del team Language Technology Product Management di RWS, dove, insieme a un team di talento, è responsabile del portafoglio di tecnologie tradizionali e all'avanguardia per la più grande azienda tecnologica del settore. 

Info e articoli di Shirley Coady