Actes de TALN 2014

Éditeur : Brigitte Bigi
Assistantes d’édition : Joëlle Lavaud, Claudia Pichon-Starke
Diffusé par : Laboratoire Parole et Langage, 5 avenue Pasteur, 13100 Aix-en-Provence, France.
ISBN :

Organisée par le LPL (Laboratoire Parole et Langage) et le LIF (Laboratoire d’Informatique Fondamentale), la conférence TALN (Traitement Automatique des Langues Naturelles) a lieu pour son 20ème anniversaire à Marseille (Faculté Saint-Charles, Aix-Marseille Université) du 1er au 4 juillet 2014.


Table des matières

Articles longs

Fouille de données et TAL
[O-RI.1] Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d’opinion au niveau du texte 1
Morgane Marchand, Olivier Mesnard, Romaric Besançon, Anne Vilnat
[O-RI.3] Influence des domaines de spécialité dans l’extraction de termes-clés 13
Adrien Bougouin, Florian Boudin, Béatrice Daille
[O-RI.4] Etiquetage en rôles événementiels fondé sur l’utilisation d’un modèle neuronal 25
Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau
Sémantique
[O-S1.1] Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet 36
William Léchelle, Philippe Langlais
[O-S1.4] Cross-lingual Word Sense Disambiguation for Predicate Labelling of French 46
Lonneke Van Der Plas, Marianna Apidianaki
Parsing 1
[O-P1.1] Améliorer l’étiquetage de “que” par les descripteurs ciblés et les règles 56
Assaf Urieli
[O-P1.2] Jouer avec des analyseurs syntaxiques 67
Eric Villemonte De La Clergerie
Lexique 1
[O-L1.1] Principes de modélisation systémique des réseaux lexicaux 79
Alain Polguère
[O-L1.2] Un modèle pour prédire la complexité lexicale et graduer les mots 91
Nuria Gala, Thomas François, Delphine Bernhard, Cédrick Fairon
[O-L1.3] Annotations et inférences de relations dans un réseau lexico-sémantique: Application à la radiologie 103
Lionel Ramadier, Manel Zarrouk, Mathieu Lafourcade, Antoine Micheau
Gestion des erreurs en TAL
[O-E.1] Correction automatique par résolution d’anaphores pronominales 113
Maud Pironneau, Éric Brunelle, Simon Charest
[O-E.2] Peut-on bien chunker avec de mauvaises étiquettes POS ? 125
Iris Eshkol, Isabelle Tellier, Yoann Dupont, Ilaine Wang
[O-E.3] Normalisation de textes par analogie: le cas des mots inconnus 137
Marion Baranes, Benoît Sagot
Modèles linguistiques
[O-F.1] Une évaluation approfondie de différentes méthodes de compositionalité sémantique 149
Antoine Bride, Tim Van de Cruys, Nicholas Asher
[O-F.2] Génération de textes : G-TAG revisité avec les Grammaires Catégorielles Abstraites 161
Laurence Danlos, Aleksandre Maskharashvili, Sylvain Pogodalla
Méthodes numériques pour le TAL
[O-N1.1] Apprentissage partiellement supervisé d’un étiqueteur morpho-syntaxique par transfert cross-lingue 173
Guillaume Wisniewski, Nicolas Pécheux, Elena Knyazeva, Alexandre Allauzen, François Yvon
[O-N1.3] Construire un corpus monolingue annoté comparable 184
Nicolas Hernandez
[O-N1.4] Vers une approche simplifiée pour introduire le caractère incrémental dans les systèmes de dialogue 196
Hatim Khouzaimi, Romain Laroche, Fabrice Lefevre
Lexique 2
[O-L2.1] La base lexicale Démonette : entre sémantique constructionnelle et morphologie dérivationnelle 208
Nabil Hathout, Fiammetta Namer
[O-L2.2]
Explorer le graphe de voisinage pour améliorer les thésaurus distributionnels
220
Vincent Claveau, Ewa Kijak, Olivier Ferret
[O-L2.3]
Réduction de la dispersion des données par généralisation des contextes distributionnels : application aux textes de spécialité
232
Amandine Périnet, Thierry Hamon
[O-L2.4]
Extraction non supervisée de relations sémantiques lexicales
244
Juliette Conrath, Stergos Afantenos, Nicholas Asher, Philippe Muller
Traduction Automatique
[O-T.1]
Modèles de langue neuronaux: une comparaison de plusieurs stratégies d’apprentissage
256
Quoc-Khanh Do, Alexandre Allauzen, François Yvon
[O-T.2] Etude de l’impact de la translittération de noms propres sur la qualité de l’alignement de mots à partir de corpus parallèles français-arabe 268
Nasredine Semmar, Houda Saadane
[O-T.3] Adaptation thématique pour la traduction automatique de dépêches de presse 280
Souhir Gahbiche-Braham, Hélène Bonneau-Maynard, François Yvon
Traitement de corpus
[O-S2.1] Étude quantitative des disfluences dans le discours de schizophrènes : automatiser pour limiter les biais 292
Maxime Amblard, Karën Fort
[O-S2.2] Repérage et analyse de la reformulation paraphrastique dans les corpus oraux 304
Iris Eshkol-Taravella, Natalia Grabar
[O-S2.3] Evaluation d’une approche possibiliste pour la désambiguïsation des textes arabes 316
Raja Ayed, Brahim Bounhas, Bilel Elayeb, Narjès Bellamine, Fabrice Evrard
Parsing 2
[O-P2.1] Un analyseur discriminant de la famille LR pour l’analyse en constituants 328
Benoit Crabbé
[O-P2.2] Détection automatique de la structure organisationnelle de documents à partir de marqueurs visuels et lexicaux 340
Jean-Philippe Fauconnier, Laurent Sorin, Mouna Kamel, Mustapha Mojahid, Nathalie Aussenac-Gilles
[O-P2.3] Jugement exact de grammaticalité d’arbre syntaxique probable 352
Jean-Philippe Prost
Lexique 3
[O-L3.1] Annotation sémantique et validation terminologique en texte intégral en SHS 363
Mokhtar-Boumeyden Billami, José Camacho-Collados, Evelyne Jacquey, Laurence Kister
[O-L3.2] Identification des noms sous-spécifiés, signaux de l’organisation discursive 377
Charlotte Roze, Thierry Charnois, Dominique Legallois, Stéphane Ferrari, Mathilde Salles

Articles courts

Traduction
[P-T.1] Traduction automatisée d’une oeuvre littéraire: une étude pilote 389
Laurent Besacier
[P-T.2] Vers un développement plus efficace des systèmes de traduction statistique : un peu de vert dans un monde de BLEU 395
Li Gong, Aurélien Max, François Yvon
[P-T.3] On-going Cooperative Research towards Developing Economy-Oriented Chinese-French SMT Systems with a New SMT Framework 401
Yidong Chen, Lingxiao Wang, Christian Boitet, Xiaodong Shi
Lexique 1
[P-L1.1] Extraction automatique de termes combinant différentes informations: linguistique, statistique et Web 407
Juan Antonio Lossio Ventura, Clement Jonquet, Mathieu Roche, Maguelonne Teisseire
[P-L1.2] Analyse automatique d’espaces thématiques 413
Gilles Boyé, Anna Kupsc
[P-L1.3] Extraction et représentation des constructions à verbe support en espagnol 419
Sandra Castellanos
[P-L1.4]
Sous-catégorisation en “pour” et syntaxe lexicale
425
Benoît Sagot, Laurence Danlos, Margot Colinet
Étiquetage 1
[P-Et1.1] Étiquetage morpho-syntaxique pour des mots nouveaux 431
Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry
[P-Et1.2] Méthodes de lissage d’une approche morpho-statistique pour la voyellation automatique des textes arabes 437
Amine Chennoufi, Azzeddine Mazroui
[P-Et1.3]
De la quenelle culinaire à la quenelle politique : identification de changements sémantiques à l’aide des Topic Models.
443
Ingrid Falk, Delphine Bernhard, Christophe Gérard
[P-Et1.4]
Détection et correction automatique d’entités nommées dans des corpus OCRisés
449
Benoît Sagot, Kata Gábor
Traitement de corpus 1
[P-S1.1] Évaluation d’un système d’extraction de réponses multiples sur le Web par comparaison à des humains 455
Mathieu-Henri Falco, Véronique Moriceau, Anne Vilnat
[P-S1.2] Centrality Measures for Non-Contextual Graph-Based Unsupervised Single Document Keyword Extraction 461
Natalie Schluter
[P-S1.3] Détection de périodes musicales d’une collection de musique par apprentissage 467
Rémy Kessler, Nicolas Béchet, Audrey Laplante, Dominic Forest
[P-S1.4] AMesure: une plateforme de lisibilité pour les textes administratifs 473
Thomas Francois, Laetitia Brouwers, Hubert Naets, Cédrick Fairon
Sentiments
[P-Se.1]
Décomposition des « hash tags » pour l’amélioration de la classification en polarité des « tweets »
479
Caroline Brun, Claude Roux
[P-Se.2] Modélisation des questions de l’agent pour l’analyse des affects, jugements et appréciations de l’utilisateur dans les interactions humain-agent 485
Caroline Langlet, Chloé Clavel
Outils
[P-Ou.1] KNG: un outil pour l’écriture facile de cascades de transducteurs 491
Francois Barthelemy
[P-Ou.2] Comparaison de deux outils d’analyse de corpus japonais pour l’aide au linguiste, Sagace et Mecab 497
Blin Raoul
[P-Ou.3] Un concordancier multi-niveaux et multimédia pour des corpus oraux 505
Giulia Barreca, George Christodoulides
Étiquetage 2
[P-Et2.1] Simulation de l’apprentissage des contextes nominaux/verbaux par n-grammes 511
Perrine Brusini, Pascal Amsili, Emmanuel Chemla, Anne Christophe
[P-Et2.2] Impact de la nature et de la taille des corpus d’apprentissage sur les performances dans la détection automatique des entités nommées 517
Anaïs Ollagnier, Sébastien Fournier, Patrice Bellot, Frédéric Béchet
[P-Et2.3] RENAM: Système de Reconnaissance des Entités Nommées Amazighes 523
Meryem Talha, Siham Boulaknadel, Driss Aboutajdine
Langue des signes
[P-LS.1] Grammaire récursive non linéaire pour les langues des signes 531
Michael Filhol
[P-LS.2]
Vers un traitement automatique en soutien d’une linguistique exploratoire des LS
537
Rémi Dubot, Arturo Curiel, Christophe Collet
Résumé automatique
[P-R.2] Résumé Automatique Multilingue Expérimentations sur l’Anglais, l’Arabe et le Français 543
Houda Oufaida, Omar Nouali, Philippe Blache
[P-R.3] Porting a Summarizer to the French Language 550
Rémi Bois, Johannes Leveling, Lorraine Goeuriot, Gareth Jones, Liadh Kelly
Corpus
[P-C.1] Extraction de données orales multi-annotées 556
Brigitte Bigi, Tatsuya Watanabe
[P-C.2] Annotation de la temporalité en corpus : contribution à l’amélioration de la norme TimeML 562
Anaïs Lefeuvre, Jean-Yves Antoine, Agata Savary, Emmanuel Schang, Lotfi Abouda, Denis Maurel, Iris Eshkol
[P-C.3] Identification automatique de zones dans des documents pour la constitution d’un corpus médical en français 568
Louise Deleger, Aurélie Névéol
[P-C.4] Un schéma d’annotation en dépendances syntaxiques profondes pour le français 574
Guy Perrier, Marie Candito, Bruno Guillaume, Corentin Ribeyre, Karën Fort, Djamé Seddah
Traitement de corpus 2
[P-S2.1] Analyse argumentative du corpus de l’ACL (ACL Anthology) 580
Elisa Omodei, Yufan Guo, Jean-Philippe Cointet, Thierry Poibeau
Lexique 2
[P-L2.1] Intégration relationnelle des exemples lexicographiques dans un réseau lexical 586
Veronika Lux-Pogodalla
[P-L2.2] Les couleurs des gens 592
Mathieu Lafourcade, Nathalie Le Brun, Virginie Zampa
[P-L2.3] Induction de sens pour enrichir des ressources lexicales 598
Mohammad Nasiruddin, Didier Schwab, Andon Tchechmedjiev, Gilles Serasset, Hervé Blanchon
[P-L2.4] Un dictionnaire et une grammaire de composés français 604
François Trouilleux