*   Transcription vocaleUne image contenant dessin

Description générée automatiquement

Documentation mise à jour le 22 mai 2020

Table des matières

 

Valeur ajoutée du site

Principe technique

Fichiers vocaux admis

Liens vidéo admis

Tarifs

Icônes et libellés

Edition des transcriptions

Exemples

Confidentialité des enregistrements

Version pour mobile

Enregistrement sur PC Windows

Taille maximum des fichiers vocaux

Configuration testées

Quelques sites professionnels de transcription

Extraction du fichier son d’une vidéo avec VLC

 

Valeur ajoutée du site

Le site transcription-vocale.fr permet d’obtenir un document texte à partir d’un document audio en s’appuyant sur le produit Speech-to-Text de Google, lequel est un composant technique destiné à être intégré par des informaticiens professionnels.

 

Par ailleurs les transcriptions obtenues sont imparfaites. Il est donc opportun de disposer d’un outil d'édition dédié permettant d'écouter l'enregistrement vocal tout en corrigeant la transcription issue du composant Google. 

 

Obtenir la transcription de Google et permettre son amélioration aisément, telle est donc la principale valeur ajoutée du site transcription-vocale.fr

 

 

Principe technique

Une image contenant dessin

Description générée automatiquement

Le serveur de traitement sert de relais entre le serveur Web de ce site de transcription vocale et les serveurs spécialisés de Google. Dès lors que ce serveur est en activité, une tache de fond surveille (toutes les 60 sec.) si un nouvel enregistrement a été posté par un utilisateur. Alors, le schéma ci-dessus est mis en œuvre.

Le service Google sera facturé à Pierre environ 1€50 de l’heure transcrite (à confirmer, car Pierre bénéficie pour l’instant d’un régime de test gratuit de la part de Google, et le service est donc gratuit pour les « bêta testeurs » du site). Pour en savoir plus, voir ce lien.

 

Fichiers vocaux admis

A priori tout fichier son contenant un enregistrement vocal clair, sans trop de bruit de fond. Le fichier posté est converti à la volée (sur le serveur de traitement) pour le rendre acceptable par le service de transcription de Google.

 

 

Liens vidéo admis

Tout lien vers une vidéo Youtube publique, dont la partie vocale est claire, sans trop de bruit de fond. Le fichier son correspondant est extrait puis converti à la volée (sur le serveur de traitement) pour le rendre acceptable par le service de transcription de Google.

 

 

Tarifs

10h et plus : 2€ TTC l’heure de transcription,
débité à la minute

 

Icônes et libellés

·          Une image contenant dessin

Description générée automatiquement    Gestion de son compte : crédit de transcription, mail, mot de passe …
 

·          Une image contenant objet, horloge

Description générée automatiquement     Contact avec le développeur du site et mentions légales

·          Une image contenant arme, coup de poing américain

Description générée automatiquement     Se déconnecter

·               Indique que l’enregistrement provient d’une vidéo publique (sinon, il provient
            d’un fichier vocal posté)

·               Voir la progression du processus de transcription

·                  Écouter le fichier vocal. Cliquer à nouveau pour arrêter

·              Lire la transcription texte. Cliquer à nouveau pour arrêter

·          Une image contenant outil

Description générée automatiquement     Éditer la transcription texte en écoutant le fichier vocal

·               Pour renommer le fichier vocal (on pourra toujours revenir au nom initial,
            maintenu en chapeau du menu de la clé)
            et / ou
           déléguer l’édition à une autre personne en donnant son mail. Elle devra pour
           cela au besoin créer son compte. Elle ne pourra ni renommer ni supprimer l’
           enregistrement. Vous et la personne déléguée peuvent éditer la transcription.

·              Indique que l’enregistrement est délégué à une autre personne.
           Mêmes fonctions que ci-dessus.

·               Indique que l’enregistrement vous est délégué. Vous pouvez uniquement
           stopper la délégation.

·             Permet d'obtenir des liens publics vers les transcriptions et leurs sources :
          copier ou ouvrir les liens disponibles parmi : lien vers la vidéo, lien vers
          l’audio seul, lien vers audio + transcription

·               Supprimer la ligne avec l’enregistrement et la transcription
           NB : les liens correspondants (cf ci-dessus) ne seront alors plus actifs.  

 

·         N°        Numéro d’ordre de l’enregistrement, façon non ambiguë de désigner un
            enregistrement pour échanger au besoin avec Pierre

·         Nom    Nom du fichier posté (éventuellement renommé par vos soins)

·         État      « En attente », « En cours » ou « Terminé ».

o   En attente après une ou deux minutes, signifie que le processus de transcription n’est pas disponible pour l’instant,

o   En cours peut durer plusieurs minutes, voire dizaines de minutes, en fonction de la taille de l’enregistrement,

o   Terminé signifie que la transcription est prête

·         Délais  Les délais indiqués à sa gauche indiquent : le délai entre le post et le
             déclenchement de la transcription
/ le temps de transcription

Edition des transcriptions

L’édition des transcriptions pour amélioration est proposée via l’éditeur intégré propre au site.  Cet éditeur est muni de sa propre documentation

 

Vous pouvez essayer également pour l’édition des transcriptions le site oTranscribe.com

 

Exemples

Chaque utilisateur a plusieurs exemples de transcriptions à sa disposition. Ces transcriptions sont brutes, telles que fournies par Speech-to-Text de Google.

 

L’utilisateur peut tester l’éditeur et apporter des modifications à la transcription éditée (ces modifications ne seront pas sauvegardées).

 

 

Confidentialité des enregistrements

La confidentialité des enregistrements est garantie à deux niveaux :

 

·         Les noms des fichiers sons et transcription sont cryptés dès leur apparition sur le serveur, et,

·         Les fichiers sons et transcription sont supprimés sur le serveur Google dès la transcription effectuée.

 

NB :  vos enregistrements et tout ce qui y est attaché ne sont visibles que de votre compte

 

Version pour mobile

L’appel via un mobile est détecté. Les seules fonctionnalités offertes sont alors : poster un enregistrement audio et suivre la progression de sa transcription. Un PC (ou tablette) est nécessaire pour l’édition et la récupération des transcriptions.

 

 

Enregistrement sur PC Windows

Dans la liste des applications (via le bouton Démarrer), doit se trouver Enregistreur vocal

Les fichiers des enregistrements sont dans Documents > Enregistrements audio

 

Vous pouvez aussi enregistrer via ce site

 

Taille maximum des fichiers vocaux

La taille maximum d’un fichier vocal pouvant être posté sur le site est de 512 MO. Au-delà, on peut le scinder avec un site tel que Mp3cut ou l’application Audacity, ou le transférer à Pierre (pspanorama@gmail.com) via WeTransfer, qui déclenchera la transcription à réception.

 

Configuration testées

Le fonctionnement détaillé du site et de l’éditeur associé a été testé à ce stade avec les navigateurs Chrome, Firefox et Edge.

 

Les formats suivants de fichiers vocaux effectivement testés à ce jour en écoute et transcription sont : aac, aiff, amr, flac, mp3, m4a, ogg, opus, wav, wma

 

Quelques sites professionnels de transcription

·         Codexa

·         Authôt

·         Happy Scribe

·         Amber Script

 

Merci d’en faire connaître d’éventuels autres (via contacts)

 

 

Extraction du fichier son d’une vidéo avec VLC

1.       (Première fois) installer au besoin le lecteur VLC media player (cela prend 170MO) grâce par exemple à ce lien pour Windows : https://get.videolan.org/vlc/3.0.8/win64/vlc-3.0.8-win64.exe

2.      Lancer VLC media player (automatique à la fin de l’installation)

3.      Faire « Ctrl+R » (ou Media > Convertir / Enregistrer …)

4.       Cliquer sur

5.       Sélectionner le fichier de la vidéo et cliquer sur

6.       Cliquer sur

7.       Dans profil, défiler pour sélectionner ‘audio MP3’ (c’est a priori le plus compact) : 


8.       Cliquer en bas sur

9.       Indiquer le nom du fichier voulu pour le son (sans l’extension de la vidéo, comme ci-dessous (j’ai mis ‘son du film’)


10.   Cliquer sur Enregistrer (cf ci-dessus)

11.   Cela donne :

12.  Cliquer sur Démarrer (cf ci-dessus)

13.  Cela risque de durer pas mal de temps pour une vidéo longue (une barre de progression se remplit)

14.   À la fin vous obtenez un fichier d’extension .MP3 que vous pouvez soumettre maintenant pour transcription