ParisTech se présente
 Evénements
 
 Etudier à ParisTech
 La coopération internationale
 Ressources documentaires
 Vivre à ParisTech
 ParisTech et les entreprises
 ParisTech Libres Savoirs
 
 

Enrichissement de la conférence audio en voix sur IP au travers de l'amélioration de la qualité et de la spatialisation sonore.

Accueil || Parcours || Recherche || S'enregistrer || Mon Compte || Contacts || Aide || Langues

Nagle, Arnault (2008) Enrichissement de la conférence audio en voix sur IP au travers de l'amélioration de la qualité et de la spatialisation sonore. Doctorat, ENST p.191.

Plein texte disponible en tant que :

- 2008_Thèse_Nagle.pdf ( 6354 Kb )
Licence: Copyright

Résumé

Ce travail de thèse s'intéresse à la conférence audio en Voix sur IP et plus précisément à son enrichissement au travers de l'amélioration de la qualité (bande élargie et traitement d'amélioration) et de la spatialisation sonore. Cette évolution de la conférence audio sera examinée à la lumière des architectures centralisée et distribuée de la conférence sur IP standard. L'objectif est d'étudier des solutions en termes d'architecture intégrant la spatialisation et des extensions pour gérer et contrôler cette spatialisation. Il conviendra aussi d'effectuer les tests montrant les qualités audio et de spatialisation résultantes.

Notre première contribution a été de proposer des architectures permettant d'allier la conférence audio en voix sur IP, les méthodes de spatialisation retenues, les terminaux ou pont de conférence ainsi que les traitements d'améliorations connus (annulation d'écho ou de bruit, etc.). Nous avons montré qu'il semblait difficile par exemple d'utiliser conjointement la spatialisation et la commutation de flux. Par contre la solution utilisant un pont mixeur ne présentait pas d'inconvénient pour inclure la spatialisation tout en conservant l'ensemble des traitements de qualité. Par cette configuration, nous garantissons en plus l'interopérabilité avec les réseaux voix existants. Les solutions distribuées sont tout autant réalisables dans la théorie mais pâtissent actuellement des limites des terminaux. Pour une interopérabilité avec les autres réseaux voix, il est en plus nécessaire d'avoir une entité de mixage pour créer un contenu monophonique. Par la suite, nous avons souligné les avantages et les inconvénients de l'utilisation de pont de conférence de type mixeur et de type répliquant pour proposer une solution de pont mixte. Cette solution fonctionne tantôt en mode répliquant, tantôt en mode mixeur suivant les capacités des terminaux. Par ailleurs, nous avons validé une méthode de réduction de la bande passante d'un pont répliquant vers un terminal, basée sur le masquage auditif.

La seconde contribution de nos travaux consiste en de nouvelles solutions protocolaires adaptées à la gestion et au contrôle de la spatialisation. Nous avons donc défini les extensions nécessaires à la gestion et au transport du son spatialisé. Nous avons tout d'abord défini les spécifications permettant de commander un positionnement de locuteurs dans une conférence audio spatialisée. Nous avons cherché à présenter toutes les solutions possibles pour les gestions automatique ou manuelle. Dans le cas de la spatialisation sur un pont de conférence, nous avons ainsi souligné le fait que cette gestion ne pouvait se faire par l'intermédiaire du protocole SIP, car ce n'est pas le rôle de ce dernier de transporter dans ses messages des informations sur les contenus ou des commandes de spatialisation. Nous avons proposé une solution basée sur ce qui se fait dans les conférences audio standard : une solution de web-pilotage certes propriétaire à chaque fournisseur de services mais en cohérence avec la gestion des protocoles de Voix sur IP.

Pour la conférence avec un pont mixeur, nous avons établi les paramètres du protocole de signalisation SIP nécessaires au transport de flux asymétriques tout en garantissant une interopérabilité avec les terminaux existants. La nécessité de transporter ces flux asymétriques est due à notre hypothèse de départ concernant l'équipement des terminaux : prise de son monophonique et restitution sur casque ou deux haut-parleurs.

Notre troisième contribution s'exprime au travers d'une campagne de tests pour valider nos solutions en termes de qualité audio et de qualité de spatialisation. Ces tests nous ont amené à définir des nouveaux protocoles adaptés à ces architectures audio spatialisées. Nous justifions dans un premier temps nos choix de codeurs et dans un second temps nos choix de tests. Nous avons montré dans un premier temps que les codeurs n'étaient pas perçus de la même façon suivant que l'on écoute en écoute monaurale ou en écoute diotique. Il ressort de ces tests que les codeurs G.711 (PCM) et G.722 (ADPCM) sont les plus adaptés à la conférence audio centralisée avec une qualité jugée nettement supérieure aux codeurs CELP. Ces deux codeurs sont de plus de faible complexité, robustes au transcodage, à la perte de trames, au transport de contenu binaural et au transport de contenus multi-locuteur. Quant aux codeurs CELP, ils sont à utiliser uniquement lorsque les contraintes de débit sont fortes.

Concernant la conférence audio distribuée wideband, les codeurs AMR-WB à 23.85 kbits/s, G.729.1 à 32 kbits/s et G.722 à 64 kbits/s semblent les plus adaptés quelle que soit la perte de trames. Ils ont une qualité jugée équivalente. En narrowband, les codeurs G.711, AMR à 12.2 kbits/s et G.729.1 à 12 kbits/s obtiennent les meilleures notes de qualité, quelle que soit la perte de trames. Au final, dans tous les cas distribués, le choix du codeur dépendra des contraintes de l'application suivant un compromis complexité/débit.

Type d'EPrint:Thèse (Doctorat)
Directeur de Mémoire:Slock, Dirk
Date:19 Février 2008
Jury de Mémoire:Moreau, Nicolas et Le Bouquin Jeannès, Régine et Gravey, Annie et Slock, Dirk et Scalart, Pascal et Tsingos, Nicolas et Hersent, Olivier et Sollaud, Aurélien
Ecole Doctorale:ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE)
Fonds:ENST
Institution:ENST
Sujets:2. Sciences et technologies de l'information et de la communication
Mots-clés libres:Conférence audio, Son spatialisé, Architectures, Codeurs, Dual-mono, Narrowband, Wideband, Sip, Tests de qualité, Tests de spatialisation, Pont de conférence, Terminal, Audio conferencing, 3D sound, Architectures, Coders, Dual-mono, Narrowband, Wideband, Sip, Quality tests, Tests about spatialization, Conferencing bridge, Terminal.
Code ID:3525
Déposé par :Arnault NAGLE
Déposé le :07 Avril 2008

Références Bibliographiques

[1] Commutation de circuits et Commutation de paquets, http://www.commentcamarche.net/initiation/commutation-circuits-paquets.php3.

[2] H.323 : Systèmes de communication multimédia en mode paquet, ITU (Juillet 2003).

[3] 3GPP, TS 26.073 AMR speech Codec; C-source code. V.5.1.0, (2003).

[4] 3GPP, TS 26.173 ANSI-C code for the Adaptive Multi-Rate - Wideband (AMR-WB) speech codec. Version 5.8.0, (2003).

[5] I.I. 23003-1:2007, MPEG Surround, (2007).

[6] K.S. Abouchacra, J. Breitenbach, T. Mermagen, T. Letowski, Binaural Helmet: Improving Speech Recognition in Noise with Spatialized Sound, Human Factors (2001).

[7] F. Andreasen, Session Description Protocol (SDP) Simple Capability Declaration, IETF RFC 3407 (2002).

[8] F. Andreasen, B. Foster, Media Gateway Control Protocol (MGCP) Version 1.0, IETF RFC 3435 (Janvier 2003).

[9] R. Appel, J.G. Beerends, On the quality of hearing one's own voice, JAES 50 (2002) 237-246.

[10] F. Audet, C. Jennings, Network Address Translation (NAT) Behavioral Requirements for Unicast UDP, IETF RFC 4787 (Janvier 2007).

[11] J.J. Baldis, Effects of Spatial Audio on Memory, Comprehension, and Preference during Desk-top Conferences, in: Computer Human Interaction 2001 (Seattle, WA, USA, 2001).

[12] F. Baumgarte, C. Faller, Binaural Cue Coding, in: IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, Vol. 11 (2003).

[13] D.R. Begault, E.M. Wenzel, Headphone Localization of Speech, The Human Factors and Ergonomics Society (1993).

[14] J. Blauert, Spatial Hearing (The MIT Press, London, England, 1983).

[15] R.S. Bolia, W.T. Nelson, M.A. Ericson, A Speech Corpus for Multitalker Communication Re-search, JASA (2000).

[16] M. Botte, G. Canévet, L. Demany, C. Sorin, Psychoacoustique et perception auditive (1989).

[17] J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, Parametric Coding of Stereo Audio, EURASIP Journal on Applied Signal Processing 9 (2005) 1305-1322.

[18] M. Briand, Etudes d'algorithmes d'extraction des informations de spatialisation sonore : Appli-cation aux formats multicanaux, Signal, Image, Parole, Télécoms, , Thèse de Doctorat, Institut National Polytechnique de Grenoble, 2007.

[19] G. Camarillo, G. Eriksson, J. Holler, H. Schulzrinne, Grouping of Media Lines in the Session Description Protocol (SDP), IETF RFC 3388 (2002).

[20] G. Camarillo, A. Johnston, Conference Establishment Using Request-Contained Lists in the Session Initiation Protocol (SIP), IETF Draft draft-ietf-sip-uri-list-conferencing-01 (Work in Progress) (Janvier 2007).

[21] T.G. Champion, Multi-speaker conferencing over narrowband channels, in: Proc. IEEE Milita-ry Communications Conf. (Washington, D.C., 1991).

[22] A. Chraa, Encodage et restitution d'une scène sonore au format ambisonique : optimisation du décodage spatial pour l'écoute binaurale, Stage de master II, Université de Rennes I, Septembre 2004.

[23] N. Coté, Qualité perçue de parole transmise par voie téléphonique large-bande, Stage de master II, Université Pierre et Marie Curie, 2005.

[24] DECT-NG07_033, ITU-T G.722 PLC selection phase: additional information, in: NG_DECT #7 (2006).

[25] R. Drullman, A.W. Bronkhorst, Multichannel Speech Intelligibility and Talker Recognition using Monaural, Binaural and Three-Dimensional Auditory Presentation, JASA (1999).

[26] P. Escolano, Approche concrète du téléphone fixe - RTC, in: http://stielec.ac-aix-marseille.fr/cours/escolano/download/rtc.pdf (Ed.), (2006).

[27] R. Eslava, Telecoms Strategies & Trends : Strategic analyses inside the world of telecoms, in: (InfoCom, 2006).

[28] H. Fletcher, Auditory Patterns, Review of Modern Physics 12 (1940) 47-65.

[29] H. Fletcher, W. Munson, Loudness, its definition, measurement and calculation, JASA 5 (1933) 82-108.

[30] E. Gallo, G. Lemaître, N. Tsingos, Prioritizing audio signals for selective processing, in: Inter-national Conference on Audio Displays (Limerick, Ireland, 2005).

[31] W. Gardner, 3D audio using loudspeakers (1998).

[32] P. Gasser, Les formats MPEG audio, in: MSH Paris Nord - Plate-forme Arts, Sciences, Technologies (2006).

[33] N. Gleiss, Usability - Concepts and Evaluation (1992).

[34] J.C. Gruber, L. Strawczynski, Subjective Effects of Variable Delay and Speech Clipping in Dynamically Managed Voice Systems, IEEE Transactions on Communications 33 (1985) p801-808.

[35] M. Handley, V. Jacobson, C. Perkins, SDP: Session Description Protocol, IETF RFC 4566 (2006).

[36] S. Haykin, Adaptive Filter Theory (Prentice Hall, 2002).

[37] J. Herre, S. Disch, New concepts in parametric coding of spatial audio : from SAC to SAOC, in: International Conference on Multimedia and Expo (Pekin, Chine, 2007).

[38] O. Hersent, D. Gurle, J. Petit, La Voix sur IP : Codecs, H.323, SIP, MGCP, déploiement et dimensionnement (Dunod, 2004).

[39] Z. Huang, Conferencing forecasts, in: T.a.S.C. (OVUM)- (Ed.), (2006).

[40] ISO/IEC 14496-3, Coding of audio-visual objects – Part 3: Audio (MPEG-4 Audio, 2nd edition), (2001).

[41] ITU-R, Rec. BS.1534 : Method for the subjective assessment of intermediate quality level of coding systems, (2001).

[42] ITU-T, ITU-T Software Tool Library 2005 User’s Manual (ITU, Geneva, 2005).

[43] ITU-T, Rec. E.800 Termes et définitions relatifs à la qualité de service et à la qualité de fonc-tionnement du réseau, y compris la sûreté de fonctionnement, (1994).

[44] ITU-T, REC. G.114 Temps de transmission dans un sens, (2003).

[45] ITU-T, Rec. G.701 Vocabulaire relatif à la modulation par impulsions et codage (MIC), au mul-tiplexage et à la transmission numérique, (1993).

[46] ITU-T, REC. G.729.1 G.729 based Embedded Variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729, (2006).

[47] ITU-T, Rec. P.800 Methods for Subjective Determination of Transmission Quality, in: (1996).

[48] ITU-T, TD AH-06-42 : Draft Handbook STP-Handbook of subjective testing practical proce-dures (2006).

[49] W. Jesteadt, C. Wier, Comparison of monaural and binaural discrimination of intensity and fre-quency, JASA 61 (1977).

[50] D.L. Jones, K.M. Stanney, H. Foaud, An Optimized Spatial Audio System for Virtual Training Simulations : Design and Evaluation, in: International Conference on Auditory Display 2005 (Limerick, Ireland, Juillet 2005).

[51] C. Kayser, C. Petkov, M. Lippert, N. Logothetis, K., Mechanisms for Allocating Auditory At-tention: An Auditory Saliency Map, Current Biology, Current Biology 15 (2005).

[52] M.C. Kelly, A.I. Tew, The continuity illusion in virtual auditory space, in: 112th Audio Engi-neering Society Convention (Munich, Germany, 2002).

[53] M.C. Kelly, Tew, A.I., The continuity illusion revisited: coding of multiple concurrent sound sources., in: 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002) (Leuven, Belgium, 2002).

[54] R. Kilgore, M. Chignell, P. Smith, Spatialized Audioconferencing : What are the Benefits ?, in: Centre for Advanced Studies conference on Collaborative Research (2003).

[55] R. Kilgore, Chignell, M., Listening to Unfamiliar Voices in Spatial Audio : Does Visualization of Spatial Position Enhance Voice Identification ?, in: Human Factors in Telecommunication (2006).

[56] R. Kilgore, Chignell, M., Simple visualizations enhance speaker identification when listening to spatialized voices, in: Human Factors and Ergonomics Society (2005).

[57] R. Le Bouquin-Jeannes, P. Scalart, G. Faucon, C. Beaugeant, Combined Noise and Echo Re-duction in Hands-Free Systems: A Survey, IEEE Trans. on Speech and Audio Processing 9 (November 2001) p808-820.

[58] M. Lutzky, G. Schuller, M. Gayer, U. Krämer, S. Wabnik, A guideline to audio codec delay, in: AES 116 (Berlin, 2004).

[59] R. Mahy, B. Campbell, R. Sparks, J. Rosenberg, D. Petrie, A. Johnston, O. Levin, A Call Con-trol and Multi-Party usage framework for the Session Initiation Protocol (SIP), IETF Draft draft-ietf-sipping-cc-framework-07 (Work in Progress) (Mars 2007).

[60] M. Mealling, Dynamic Delegation Discovery System (DDDS) Part Three: The Domain Name System (DNS) Database, IETF RFC 3403 (Octobre 2002).

[61] H. Möller, Fundamentals of binaural technology, Applied Acoustics 36 (1992) pp. 171-218.

[62] S. Möller, Quality of Telephone-Based Spoken Dialogue Systems (New-York, 2005).

[63] E.D. Montag, Forced Choice and miscellaneous consideration, in: http://www.cis.rit.edu/people/faculty/montag/vandplite/pages/chap_4/ch4p5.html (Ed.), Psychophysics (2003).

[64] A. Nagle, C. Quinquis, A. Sollaud, D. Slock, Quality impact of diotic versus monaural hearing on processed speech, in: Convention AES 123 (New-York, 2007).

[65] A. Nagle, N. Tsingos, G. Lemaitre, A. Sollaud, On the fly auditory masking for scalable VoIP bridges, (2006).

[66] D. Nahumi, Conferencing arrangement for compressed information signals, in: (AT&T Corp, USA, 1995).

[67] W.T. Nelson, R.S. Bolia, M.A. Ericson, R.L. McKinley, Spatial Audio Displays for Speech Communications : A Comparison of Free Field and Virtual Acoustic Environments, in: Human Factors and Ergonomics Society (1999).

[68] R. Nicol, Restitution sonore spatialisée sur une zone étendue : Application à la téléprésence, Acoustique, Thèse de Doctorat, Université du Maine, Décembre 1999.

[69] J.E.M. Painter, S. Spanias, Perceptual Coding of Digital Audio, Proceedings of the IEEE 88 (2000).

[70] Project Group 841, ROBUST VOICE ACTIVITY DETECTION and Noise Reduction-Mechanism USING HIGHER-ORDER STATISTICS, Department of Communication Tech-nology, Institute of Electronic Systems, Aalborg University, 2005.

[71] A. Raake, Speech quality of VoIP : Assessment and Prediction (2006).

[72] R. Rabipour, P. Coverdale, Tandem-free VoX conferencing., in: (Nortel Networks, 1999).

[73] G. Reynolds, S. Stevens, Binaural Summation of Loudness, JASA 32 (1960).

[74] A.B. Roach, Session Initiation Protocol (SIP)-Specific Event Notification, IETF RFC 3265 (Juin 2002).

[75] J. Rosenberg, A Framework For Conferencing with the Session Initiation Protocol (SIP), IETF RFC 4353 (Février 2006).

[76] J. Rosenberg, Interactive Connectivity Establishment (ICE): A Protocol for Network Address Translator (NAT) Traversal for Offer/Answer Protocols, IETF Draft draft-ietf-mmusic-ice-19 (Work in Progress) (Octobre 2007).

[77] J. Rosenberg, M. Handley, H. Schulzrinne, E. Schooler, SIP : Session Initiation Protocol, IETF RFC 2543 (Juin 1999).

[78] J. Rosenberg, C. Huitema, R. Mahy, D. Wing, P. Matthews, Session Traversal Utilities for NAT (STUN), IETF draft draft-ietf-behave-rfc3489bis-11 (Work in Progress) (Octobre 2007).

[79] J. Rosenberg, R. Mahy, C. Huitema, Traversal Using Relays around NAT (TURN): Relay Ex-tensions to Session Traversal Utilities for NAT (STUN), IETF Draft draft-ietf-behave-turn-04 (Work in Progress) (Juillet 2007).

[80] J. Rosenberg, H. Schulzrinne, Reliability of Provisional Responses in SDP, IETF RFC 3262 (Juin 2002).

[81] J. Rosenberg, H. Schulzrinne, Session Initiation Protocol (SIP): Locating SIP Servers, IETF RFC 3263 (Juin 2002).

[82] J. Rosenberg, H. Schulzrinne, G. Camarillo, A. Johnston, J. Peterson, R. Sparks, M. Handley, E. Schooler, SIP : Session Initiation Protocol, IETF RFC 3261 (Juin 2002).

[83] J. Rosenberg, H. Schulzrinne, O. Levin, A Session Initiation Protocol (SIP) Event Package for Conference State, IETF RFC 4575 (Août 2006).

[84] J. Rosenberg, Schulzrinne, H., An Offer/Answer Model with the Session Description Protocol (SDP), IETF RFC 3264 (Juin 2002).

[85] H. Schulzrinne, S. Casner, R. Frederick, V. Jacobson, RTP : A Transport Protocol for Real-Time Applications, IETF RFC 3550 (Juillet 2003).

[86] F. Simard, P.K. Edholm, N.K. Burns, Apparatus and method for packetbased media communi-cations., in: (Nortel Networks, Canada, 2001).

[87] K. Siyan, TCP/IP (Janvier 2003) 706.

[88] P.J. Smith, Voice Conferencing over IP Networks, Department of Electrical & Computer En-gineering, Master of Engineering - McGill University - Canada, 2002.

[89] P. Srisuresh, M. Holdrege, IP Network Address Translator (NAT) Terminology and Considera-tions, IETF RFC 2663 (Août 1999).

[90] R. Stewart, Q. Xie, K. Morneault, C. Sharp, H. Schwarzbauer, T. Taylor, I. Rytina, M. Kalla, L. Zhang, V. Paxson, Stream Control Transmission Protocol, IETF RFC 2960 (Octobre 2000).

[91] J.D. Tardelli, P.D. Gatewood, E.W. Kreamer, P.A. La Follette, The benefits of multi-speaker conferencing and the design of conference bridge control algorithms, in: Proc. IEEE Int. Conf. on Acoustics, Speech, Signal Processing, Vol. 2 (Minneapolis, USA, 1993) 435-438.

[92] N. Tsingos, Scalable Perceptual Mixing and Filtering of Audio Signals using an Augmented Spectral Representation, in: 8th Int. Conference on Digital Audio Effects (DAFx'05) (Madrid, Spain, 2005).

[93] N. Tsingos, E. Gallo, G. Drettakis, Perceptual Audio Rendering of Complex Virtual Environ-ment, ACM Transactions on Graphics 23 (2004).

[94] N. Tsingos, O. Warusfel, J.C. Lombardo, J. Soula, B. Katz, A. Raake, H. Goidell, J. Hognon, A. Sollaud, A. Nagle, M. Emerit, OPERA : Optimisation PErceptive du Rendu Audio (2006).

[95] P. Vary, R. Martin, Digital Speech Transmission (John Wiley and Sons, UK - Chichester, 2006).

[96] Z.H. Zhou, The Role of 3D Sound in Human Reaction and Performance in Augmented Reality Gaming Environment, (2002).

[97] S. Znaty, Le réseau Sémaphore Numéro 7 : Principes, Architecture et Protocoles, in: http://efort.com/r_tutoriels/SS7_EFORT.pdf (Ed.).

[98] E. Zwicker, H. Fastl, Psychoacoustics: Facts and Model (1999).

Table des Matières

RÉSUMÉ i

ABSTRACT iii

TABLE DES MATIÈRES vii

ACRONYMES x

INTRODUCTION 1

CONTEXTE ET ENJEUX 1

PROBLEMATIQUE, ORIENTATIONS ET PLAN DE LA THESE 2

1. ETAT DE L'ART SUR LA CONFERENCE AUDIO SPATIALISEE EN VOIX SUR IP 3

1.1 LA CONFERENCE AUDIO STANDARD 3

1.2 LA CONFERENCE AUDIO SUR IP 7

1.3 LES DIFFERENTS ELEMENTS DE LA CONFERENCE AUDIO SUR IP 16

1.4 LES PROBLEMATIQUES LIEES AUX COMMUNICATIONS EN GENERAL ET AU TRANSPORT DE LA VOIX SUR IP 20

1.5 AVANTAGES DE LA VOIP 23

1.6 UN APPEL VOIP 24

1.7 LA CONFERENCE AUDIO SPATIALISEE 34

1.8 AXES DE RECHERCHE 43

2. DEFINITION D'ARCHITECTURES POUR UN ENRICHISSEMENT DE LA CONFERENCE AUDIO SUR IP 45

2.1 LES BLOCS JOUANT SUR LA QUALITE 46

2.2 LA SPATIALISATION SUR UN PONT DE CONFERENCE IP 55

2.3 LA SPATIALISATION SUR UN TERMINAL 60

2.4 PROPOSITION D'UNE ARCHITECTURE DE PONT DE CONFERENCE MIXTE POUR OPTIMISER L'UTILISATION DES TERMINAUX ET DES PONTS DE CONFERENCES 65

2.5 MASQUAGE AUDITIF TEMPS REEL POUR UN PONT REPLIQUANT EN VOIP 77

2.6 CONCLUSIONS ET PERSPECTIVES 84

3. EXTENSIONS NECESSAIRES POUR LA GESTION DE LA CONFERENCE SPATIALISEE SUR IP 87

3.1 POSITIONNEMENT DES LOCUTEURS DE LA CONFERENCE AUDIO 87

3.2 L'ASYMETRIE DU CONTENU DANS LE CAS DE LA CONFERENCE AUDIO CENTRALISEE AVEC PONT MIXEUR 101

3.3 CONCLUSION ET PERSPECTIVES 105

4. EVALUATION DE LA QUALITE AUDIO SUIVANT LES DIFFERENTES ARCHITECTURES DE CONFERENCE 107

4.1 PRESENTATION DU CONTEXTE DES ETUDES EFFECTUEES 107

4.2 ETUDE DE L'IMPACT SUR LA QUALITE PERÇUE D'UNE ECOUTE DIOTIQUE PAR RAPPORT A UNE ECOUTE MONAURALE 114

4.3 EVALUATION DE LA QUALITE DE SIGNAUX DE PAROLE BINAURAUX MONO-LOCUTEUR ENCODES-DECODES EN DUAL-MONO PAR DES CODEURS MONOPHONIQUES DE PAROLE 124

4.4 EVALUATION DES DEUX CONFIGURATIONS DE CONFERENCE AUDIO AVEC DES CODEURS MONOPHONIQUES DE PAROLE 135

4.5 EVALUATION DE LA QUALITE DE SIGNAUX DE PAROLE BINAURAUX MULTI-LOCUTEUR ENCODES-DECODES EN DUAL-MONO PAR DES CODEURS MONOPHONIQUES DE PAROLE 147

4.6 CONCLUSION ET PERSPECTIVES 163

CONCLUSION 165

CONTRIBUTIONS DE LA THESE 165

PERSPECTIVES DE RECHERCHE 167

ARTICLES & BREVETS 168

ARTICLES ACCEPTES 168

ARTICLES A SOUMETTRE 168

BREVETS DEPOSES 168

BREVETS EN COURS DE DEPOT 168

Bibliographie 169

Statistiques de consultation

Administrateurs de l'archive uniquement : éditer cet enregistrement

 
ParisTech
 
droits de reproduction et de diffusion réservés © ParisTech 2007