Actes de TALN 2014

Éditeur : Brigitte Bigi
Assistantes d’édition : Joëlle Lavaud, Claudia Pichon-Starke
Diffusé par : Laboratoire Parole et Langage, 5 avenue Pasteur, 13100 Aix-en-Provence, France.
ISBN :

Organisée par le LPL (Laboratoire Parole et Langage) et le LIF (Laboratoire d’Informatique Fondamentale), la conférence TALN (Traitement Automatique des Langues Naturelles) a lieu pour son 20ème anniversaire à Marseille (Faculté Saint-Charles, Aix-Marseille Université) du 1er au 4 juillet 2014.

Table des matières

Articles longs

Fouille de données et TAL
[O-RI.1] Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d’opinion au niveau du texte	1
Morgane Marchand, Olivier Mesnard, Romaric Besançon, Anne Vilnat
[O-RI.3] Influence des domaines de spécialité dans l’extraction de termes-clés	13
Adrien Bougouin, Florian Boudin, Béatrice Daille
[O-RI.4] Etiquetage en rôles événementiels fondé sur l’utilisation d’un modèle neuronal	25
Emanuela Boros, Romaric Besançon, Olivier Ferret, Brigitte Grau
Sémantique
[O-S1.1] Utilisation de représentations de mots pour l’étiquetage de rôles sémantiques suivant FrameNet	36
William Léchelle, Philippe Langlais
[O-S1.4] Cross-lingual Word Sense Disambiguation for Predicate Labelling of French	46
Lonneke Van Der Plas, Marianna Apidianaki
Parsing 1
[O-P1.1] Améliorer l’étiquetage de “que” par les descripteurs ciblés et les règles	56
Assaf Urieli
[O-P1.2] Jouer avec des analyseurs syntaxiques	67
Eric Villemonte De La Clergerie
Lexique 1
[O-L1.1] Principes de modélisation systémique des réseaux lexicaux	79
Alain Polguère
[O-L1.2] Un modèle pour prédire la complexité lexicale et graduer les mots	91
Nuria Gala, Thomas François, Delphine Bernhard, Cédrick Fairon
[O-L1.3] Annotations et inférences de relations dans un réseau lexico-sémantique: Application à la radiologie	103
Lionel Ramadier, Manel Zarrouk, Mathieu Lafourcade, Antoine Micheau
Gestion des erreurs en TAL
[O-E.1] Correction automatique par résolution d’anaphores pronominales	113
Maud Pironneau, Éric Brunelle, Simon Charest
[O-E.2] Peut-on bien chunker avec de mauvaises étiquettes POS ?	125
Iris Eshkol, Isabelle Tellier, Yoann Dupont, Ilaine Wang
[O-E.3] Normalisation de textes par analogie: le cas des mots inconnus	137
Marion Baranes, Benoît Sagot
Modèles linguistiques
[O-F.1] Une évaluation approfondie de différentes méthodes de compositionalité sémantique	149
Antoine Bride, Tim Van de Cruys, Nicholas Asher
[O-F.2] Génération de textes : G-TAG revisité avec les Grammaires Catégorielles Abstraites	161
Laurence Danlos, Aleksandre Maskharashvili, Sylvain Pogodalla
Méthodes numériques pour le TAL
[O-N1.1] Apprentissage partiellement supervisé d’un étiqueteur morpho-syntaxique par transfert cross-lingue	173
Guillaume Wisniewski, Nicolas Pécheux, Elena Knyazeva, Alexandre Allauzen, François Yvon
[O-N1.3] Construire un corpus monolingue annoté comparable	184
Nicolas Hernandez
[O-N1.4] Vers une approche simplifiée pour introduire le caractère incrémental dans les systèmes de dialogue	196
Hatim Khouzaimi, Romain Laroche, Fabrice Lefevre
Lexique 2
[O-L2.1] La base lexicale Démonette : entre sémantique constructionnelle et morphologie dérivationnelle	208
Nabil Hathout, Fiammetta Namer
[O-L2.2] Explorer le graphe de voisinage pour améliorer les thésaurus distributionnels	220
Vincent Claveau, Ewa Kijak, Olivier Ferret
[O-L2.3] Réduction de la dispersion des données par généralisation des contextes distributionnels : application aux textes de spécialité	232
Amandine Périnet, Thierry Hamon
[O-L2.4] Extraction non supervisée de relations sémantiques lexicales	244
Juliette Conrath, Stergos Afantenos, Nicholas Asher, Philippe Muller
Traduction Automatique
[O-T.1] Modèles de langue neuronaux: une comparaison de plusieurs stratégies d’apprentissage	256
Quoc-Khanh Do, Alexandre Allauzen, François Yvon
[O-T.2] Etude de l’impact de la translittération de noms propres sur la qualité de l’alignement de mots à partir de corpus parallèles français-arabe	268
Nasredine Semmar, Houda Saadane
[O-T.3] Adaptation thématique pour la traduction automatique de dépêches de presse	280
Souhir Gahbiche-Braham, Hélène Bonneau-Maynard, François Yvon
Traitement de corpus
[O-S2.1] Étude quantitative des disfluences dans le discours de schizophrènes : automatiser pour limiter les biais	292
Maxime Amblard, Karën Fort
[O-S2.2] Repérage et analyse de la reformulation paraphrastique dans les corpus oraux	304
Iris Eshkol-Taravella, Natalia Grabar
[O-S2.3] Evaluation d’une approche possibiliste pour la désambiguïsation des textes arabes	316
Raja Ayed, Brahim Bounhas, Bilel Elayeb, Narjès Bellamine, Fabrice Evrard
Parsing 2
[O-P2.1] Un analyseur discriminant de la famille LR pour l’analyse en constituants	328
Benoit Crabbé
[O-P2.2] Détection automatique de la structure organisationnelle de documents à partir de marqueurs visuels et lexicaux	340
Jean-Philippe Fauconnier, Laurent Sorin, Mouna Kamel, Mustapha Mojahid, Nathalie Aussenac-Gilles
[O-P2.3] Jugement exact de grammaticalité d’arbre syntaxique probable	352
Jean-Philippe Prost
Lexique 3
[O-L3.1] Annotation sémantique et validation terminologique en texte intégral en SHS	363
Mokhtar-Boumeyden Billami, José Camacho-Collados, Evelyne Jacquey, Laurence Kister
[O-L3.2] Identification des noms sous-spécifiés, signaux de l’organisation discursive	377
Charlotte Roze, Thierry Charnois, Dominique Legallois, Stéphane Ferrari, Mathilde Salles

Articles courts

Traduction
[P-T.1] Traduction automatisée d’une oeuvre littéraire: une étude pilote	389
Laurent Besacier
[P-T.2] Vers un développement plus efficace des systèmes de traduction statistique : un peu de vert dans un monde de BLEU	395
Li Gong, Aurélien Max, François Yvon
[P-T.3] On-going Cooperative Research towards Developing Economy-Oriented Chinese-French SMT Systems with a New SMT Framework	401
Yidong Chen, Lingxiao Wang, Christian Boitet, Xiaodong Shi
Lexique 1
[P-L1.1] Extraction automatique de termes combinant différentes informations: linguistique, statistique et Web	407
Juan Antonio Lossio Ventura, Clement Jonquet, Mathieu Roche, Maguelonne Teisseire
[P-L1.2] Analyse automatique d’espaces thématiques	413
Gilles Boyé, Anna Kupsc
[P-L1.3] Extraction et représentation des constructions à verbe support en espagnol	419
Sandra Castellanos
[P-L1.4] Sous-catégorisation en “pour” et syntaxe lexicale	425
Benoît Sagot, Laurence Danlos, Margot Colinet
Étiquetage 1
[P-Et1.1] Étiquetage morpho-syntaxique pour des mots nouveaux	431
Ingrid Falk, Delphine Bernhard, Christophe Gérard, Romain Potier-Ferry
[P-Et1.2] Méthodes de lissage d’une approche morpho-statistique pour la voyellation automatique des textes arabes	437
Amine Chennoufi, Azzeddine Mazroui
[P-Et1.3] De la quenelle culinaire à la quenelle politique : identification de changements sémantiques à l’aide des Topic Models.	443
Ingrid Falk, Delphine Bernhard, Christophe Gérard
[P-Et1.4] Détection et correction automatique d’entités nommées dans des corpus OCRisés	449
Benoît Sagot, Kata GÃ¡bor
Traitement de corpus 1
[P-S1.1] Évaluation d’un système d’extraction de réponses multiples sur le Web par comparaison à des humains	455
Mathieu-Henri Falco, Véronique Moriceau, Anne Vilnat
[P-S1.2] Centrality Measures for Non-Contextual Graph-Based Unsupervised Single Document Keyword Extraction	461
Natalie Schluter
[P-S1.3] Détection de périodes musicales d’une collection de musique par apprentissage	467
Rémy Kessler, Nicolas Béchet, Audrey Laplante, Dominic Forest
[P-S1.4] AMesure: une plateforme de lisibilité pour les textes administratifs	473
Thomas Francois, Laetitia Brouwers, Hubert Naets, Cédrick Fairon
Sentiments
[P-Se.1] Décomposition des « hash tags » pour l’amélioration de la classification en polarité des « tweets »	479
Caroline Brun, Claude Roux
[P-Se.2] Modélisation des questions de l’agent pour l’analyse des affects, jugements et appréciations de l’utilisateur dans les interactions humain-agent	485
Caroline Langlet, Chloé Clavel
Outils
[P-Ou.1] KNG: un outil pour l’écriture facile de cascades de transducteurs	491
Francois Barthelemy
[P-Ou.2] Comparaison de deux outils d’analyse de corpus japonais pour l’aide au linguiste, Sagace et Mecab	497
Blin Raoul
[P-Ou.3] Un concordancier multi-niveaux et multimédia pour des corpus oraux	505
Giulia Barreca, George Christodoulides
Étiquetage 2
[P-Et2.1] Simulation de l’apprentissage des contextes nominaux/verbaux par n-grammes	511
Perrine Brusini, Pascal Amsili, Emmanuel Chemla, Anne Christophe
[P-Et2.2] Impact de la nature et de la taille des corpus d’apprentissage sur les performances dans la détection automatique des entités nommées	517
Anaïs Ollagnier, Sébastien Fournier, Patrice Bellot, Frédéric Béchet
[P-Et2.3] RENAM: Système de Reconnaissance des Entités Nommées Amazighes	523
Meryem Talha, Siham Boulaknadel, Driss Aboutajdine
Langue des signes
[P-LS.1] Grammaire récursive non linéaire pour les langues des signes	531
Michael Filhol
[P-LS.2] Vers un traitement automatique en soutien d’une linguistique exploratoire des LS	537
Rémi Dubot, Arturo Curiel, Christophe Collet
Résumé automatique
[P-R.2] Résumé Automatique Multilingue Expérimentations sur l’Anglais, l’Arabe et le Français	543
Houda Oufaida, Omar Nouali, Philippe Blache
[P-R.3] Porting a Summarizer to the French Language	550
Rémi Bois, Johannes Leveling, Lorraine Goeuriot, Gareth Jones, Liadh Kelly
Corpus
[P-C.1] Extraction de données orales multi-annotées	556
Brigitte Bigi, Tatsuya Watanabe
[P-C.2] Annotation de la temporalité en corpus : contribution à l’amélioration de la norme TimeML	562
Anaïs Lefeuvre, Jean-Yves Antoine, Agata Savary, Emmanuel Schang, Lotfi Abouda, Denis Maurel, Iris Eshkol
[P-C.3] Identification automatique de zones dans des documents pour la constitution d’un corpus médical en français	568
Louise Deleger, Aurélie Névéol
[P-C.4] Un schéma d’annotation en dépendances syntaxiques profondes pour le français	574
Guy Perrier, Marie Candito, Bruno Guillaume, Corentin Ribeyre, Karën Fort, Djamé Seddah
Traitement de corpus 2
[P-S2.1] Analyse argumentative du corpus de l’ACL (ACL Anthology)	580
Elisa Omodei, Yufan Guo, Jean-Philippe Cointet, Thierry Poibeau
Lexique 2
[P-L2.1] Intégration relationnelle des exemples lexicographiques dans un réseau lexical	586
Veronika Lux-Pogodalla
[P-L2.2] Les couleurs des gens	592
Mathieu Lafourcade, Nathalie Le Brun, Virginie Zampa
[P-L2.3] Induction de sens pour enrichir des ressources lexicales	598
Mohammad Nasiruddin, Didier Schwab, Andon Tchechmedjiev, Gilles Serasset, Hervé Blanchon
[P-L2.4] Un dictionnaire et une grammaire de composés français	604
François Trouilleux