Transcription
vocale
Documentation
mise à jour le 16 novembre 2020
Table des matières
Confidentialité des enregistrements
Taille maximum des fichiers vocaux
Quelques sites professionnels de transcription
Extraction du fichier son d’une vidéo avec VLC
Le site transcription-vocale.fr
permet d’obtenir un document texte à partir d’un document audio en s’appuyant
sur le produit Speech-to-Text de
Google, lequel est un composant technique destiné à être intégré par des
informaticiens professionnels.
Par ailleurs les transcriptions obtenues sont imparfaites. Il est donc
opportun de disposer d’un outil d'édition dédié permettant d'écouter
l'enregistrement vocal tout en corrigeant la transcription issue du composant
Google.
Obtenir la transcription de Google et permettre son amélioration aisément,
telle est donc la principale valeur ajoutée du site transcription-vocale.fr
Le serveur de traitement sert de relais entre
le serveur Web de ce site de transcription vocale et les serveurs spécialisés
de Google. Dès lors que ce serveur est en activité, une tache de fond surveille
(toutes les 60 sec.) si un nouvel enregistrement a été posté par un
utilisateur. Alors, le schéma ci-dessus est mis en œuvre.
Le service Google est facturé environ
1€50 de l’heure transcrite. Pour en savoir plus, voir ce lien.
A priori tout fichier son contenant un enregistrement vocal clair, sans
trop de bruit de fond. Le fichier posté est converti à la volée (sur le serveur
de traitement) pour le rendre acceptable par le service de transcription de
Google.
Les extensions de fichier supportées à ce stade sont : .aac .flac
.mp3 .mp4a .ogg
.opus
Vous pouvez convertir votre fichier son vers une de ces extensions via ce site
Vous pouvez aussi contacter Pierre voir si une extension particulière
manquante pourrait être supportée.
Tout lien vers une vidéo Youtube publique, dont la partie vocale est
claire, sans trop de bruit de fond. Le fichier son correspondant est extrait
puis converti à la volée (sur le serveur de traitement) pour le rendre
acceptable par le service de transcription de Google.
10h et plus : 2€
TTC l’heure de transcription,
débité à la minute
·
Gestion de son compte : crédit de
transcription, mail, mot de passe …
·
Contact avec le
développeur du site et mentions légales
·
Se déconnecter
·
Indique que l’enregistrement provient d’une vidéo publique (sinon, il
provient
d’un fichier vocal posté)
·
Voir la progression du processus de transcription
·
Écouter le fichier vocal. Cliquer à
nouveau pour arrêter
·
Lire la transcription texte. Cliquer à nouveau pour
arrêter
·
Éditer la transcription
texte en écoutant le fichier vocal
·
Pour renommer le
fichier vocal (on pourra toujours revenir au nom initial,
maintenu en chapeau du menu
de la clé)
et / ou
déléguer l’édition à une autre
personne en donnant son mail. Elle devra pour
cela au besoin créer son
compte. Elle ne pourra ni renommer ni supprimer l’
enregistrement. Vous et la
personne déléguée peuvent éditer la transcription.
·
Indique que l’enregistrement est
délégué à une autre personne.
Mêmes fonctions que ci-dessus.
·
Indique que l’enregistrement
vous est délégué. Vous pouvez uniquement
stopper la délégation.
·
Permet d'obtenir des liens publics
vers les transcriptions et leurs sources :
copier ou ouvrir les liens
disponibles parmi : lien vers la vidéo, lien vers
l’audio seul, lien vers audio +
transcription
·
Supprimer la ligne avec l’enregistrement et la transcription
NB : les liens correspondants
(cf ci-dessus) ne seront alors plus actifs.
·
N° Numéro d’ordre de
l’enregistrement, façon non ambiguë de désigner un
enregistrement pour échanger
au besoin avec Pierre
·
Nom Nom du fichier posté
(éventuellement renommé par vos soins)
·
État
« En attente », « En cours » ou « Terminé ».
o
En attente après une ou deux minutes, signifie que le processus de transcription n’est
pas disponible pour l’instant,
o
En cours peut durer plusieurs minutes, voire dizaines de minutes, en fonction de la
taille de l’enregistrement,
o
Terminé signifie que la transcription est prête
·
Délais Les délais indiqués à
sa gauche indiquent : le délai entre le
post et le
déclenchement de la
transcription / le temps de transcription
L’édition des transcriptions pour amélioration est proposée via l’éditeur
intégré propre au site. Cet éditeur est
muni de sa propre documentation
Vous pouvez essayer également pour l’édition des transcriptions le site oTranscribe.com
Chaque utilisateur a
plusieurs exemples de transcriptions à sa disposition. Ces transcriptions sont
brutes, telles que fournies par Speech-to-Text de Google.
L’utilisateur peut
tester l’éditeur et apporter des modifications à la transcription éditée (ces
modifications ne seront pas sauvegardées).
Confidentialité des enregistrements
La confidentialité des
enregistrements est garantie à deux niveaux :
· Les noms des fichiers
sons et transcription sont cryptés dès leur apparition sur le serveur, et,
· Les fichiers sons et
transcription sont supprimés sur le serveur Google dès la transcription
effectuée.
NB : vos enregistrements et
tout ce qui y est attaché ne sont visibles que de votre compte
L’appel via un mobile est détecté. Les seules fonctionnalités offertes sont
alors : poster un enregistrement audio et suivre la progression de sa
transcription. Un PC (ou tablette) est nécessaire pour l’édition et la
récupération des transcriptions.
Dans la liste des
applications (via le bouton Démarrer), doit se trouver Enregistreur
vocal
Les fichiers des
enregistrements sont dans Documents > Enregistrements audio
Vous pouvez aussi
enregistrer via ce site
Taille maximum des fichiers vocaux
La taille maximum d’un fichier vocal pouvant être posté sur le site est de 512
MO. Au-delà, on peut le scinder avec un site tel que Mp3cut ou l’application Audacity, ou le transférer à
Pierre (pspanorama@gmail.com) via WeTransfer, qui déclenchera la transcription
à réception.
Le fonctionnement
détaillé du site et de l’éditeur associé a été testé à ce stade avec les navigateurs Chrome, Firefox
et Edge.
Les formats suivants de fichiers vocaux effectivement testés à ce jour en
écoute et transcription sont : aac, aiff, amr, flac, mp3, m4a, ogg, opus,
wav, wma
Quelques sites professionnels de transcription
·
Codexa
·
Authôt
·
Dragon
Merci d’en faire
connaître d’éventuels autres (via contacts)
Extraction du fichier son d’une vidéo avec VLC
1.
(Première fois) installer au besoin le
lecteur VLC media player (cela prend 170MO) grâce par exemple à ce
lien pour Windows : https://get.videolan.org/vlc/3.0.8/win64/vlc-3.0.8-win64.exe
2.
Lancer VLC media player
(automatique à la fin de l’installation)
3.
Faire « Ctrl+R » (ou Media
> Convertir / Enregistrer …)
4.
Cliquer sur
5.
Sélectionner le fichier de la vidéo et
cliquer sur
6.
Cliquer sur
7.
Dans profil, défiler pour sélectionner ‘audio
MP3’ (c’est a priori le plus compact) :
8.
Cliquer en bas sur
9.
Indiquer le nom du fichier voulu pour le
son (sans l’extension de la vidéo, comme ci-dessous (j’ai mis ‘son du film’)
10.
Cliquer sur Enregistrer (cf ci-dessus)
11.
Cela donne :
12.
Cliquer sur Démarrer (cf
ci-dessus)
13.
Cela risque de durer pas mal de temps
pour une vidéo longue (une barre de progression se remplit)
14.
À la fin vous obtenez un fichier
d’extension .MP3 que vous pouvez soumettre maintenant pour transcription