The Prague Post - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.177115
AFN 81.881407
ALL 99.252011
AMD 444.59148
ANG 2.049629
AOA 1037.159602
ARS 1294.14051
AUD 1.780172
AWG 2.047025
AZN 1.937816
BAM 1.956825
BBD 2.294803
BDT 138.092365
BGN 1.957857
BHD 0.428625
BIF 3332.101328
BMD 1.137236
BND 1.492134
BOB 7.854392
BRL 6.605299
BSD 1.136596
BTN 97.022843
BWP 15.66621
BYN 3.71968
BYR 22289.824581
BZD 2.282996
CAD 1.574122
CDF 3271.828234
CHF 0.930817
CLF 0.028662
CLP 1099.88957
CNY 8.306268
CNH 8.306019
COP 4901.486936
CRC 571.199327
CUC 1.137236
CUP 30.136753
CVE 110.77121
CZK 25.063093
DJF 202.11002
DKK 7.466603
DOP 68.807192
DZD 150.758867
EGP 58.143353
ERN 17.058539
ETB 151.279275
FJD 2.59711
FKP 0.856519
GBP 0.857288
GEL 3.116471
GGP 0.856519
GHS 17.695835
GIP 0.856519
GMD 81.31675
GNF 9843.350125
GTQ 8.754588
GYD 238.429138
HKD 8.82913
HNL 29.46444
HRK 7.519522
HTG 148.317723
HUF 408.38716
IDR 19177.096068
ILS 4.192296
IMP 0.856519
INR 97.094367
IQD 1489.779092
IRR 47906.064711
ISK 145.100373
JEP 0.856519
JMD 179.644139
JOD 0.806646
JPY 161.924776
KES 147.276378
KGS 99.205077
KHR 4566.00273
KMF 492.996098
KPW 1023.486197
KRW 1613.044532
KWD 0.348711
KYD 0.947196
KZT 594.971784
LAK 24598.413953
LBP 101896.34134
LKR 339.937138
LRD 227.418803
LSL 21.444738
LTL 3.357963
LVL 0.687903
LYD 6.221113
MAD 10.547908
MDL 19.662304
MGA 5177.713287
MKD 61.514233
MMK 2387.750039
MNT 4034.978004
MOP 9.086962
MRU 44.847502
MUR 51.278399
MVR 17.517685
MWK 1974.241998
MXN 22.425622
MYR 5.012372
MZN 72.675107
NAD 21.444738
NGN 1824.926761
NIO 41.821916
NOK 11.909658
NPR 155.236349
NZD 1.90379
OMR 0.437833
PAB 1.136596
PEN 4.279463
PGK 4.700463
PHP 64.495498
PKR 319.112616
PLN 4.278742
PYG 9097.767521
QAR 4.140226
RON 4.978937
RSD 117.291464
RUB 93.451578
RWF 1609.188866
SAR 4.267179
SBD 9.516785
SCR 16.196165
SDG 682.914367
SEK 10.940517
SGD 1.490626
SHP 0.893689
SLE 25.900592
SLL 23847.250746
SOS 649.934509
SRD 42.248737
STD 23538.488054
SVC 9.945212
SYP 14785.985057
SZL 21.403201
THB 37.92345
TJS 12.206811
TMT 3.980326
TND 3.398104
TOP 2.663525
TRY 43.238625
TTD 7.712041
TWD 36.987505
TZS 3056.325739
UAH 47.101683
UGX 4166.329832
USD 1.137236
UYU 47.664978
UZS 14768.739292
VES 91.955341
VND 29420.293975
VUV 138.058823
WST 3.166177
XAF 656.312471
XAG 0.034867
XAU 0.000342
XCD 3.073437
XDR 0.816192
XOF 653.911048
XPF 119.331742
YER 278.907529
ZAR 21.404946
ZMK 10236.492294
ZMW 32.36396
ZWL 366.189511
  • AEX

    -1.3700

    852.2

    -0.16%

  • BEL20

    -3.3600

    4197.65

    -0.08%

  • PX1

    -43.9800

    7285.86

    -0.6%

  • ISEQ

    -177.5500

    9967.91

    -1.75%

  • OSEBX

    0.7200

    1447.47

    +0.05%

  • PSI20

    -10.1200

    6735.84

    -0.15%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    3.1800

    2654.25

    +0.12%

  • N150

    5.1900

    3250.59

    +0.16%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

E.Cerny--TPP