@inproceedings{raymond-fayolle-2010-reconnaissance,
title = "Reconnaissance robuste d{'}entit{\'e}s nomm{\'e}es sur de la parole transcrite automatiquement",
author = "Raymond, Christian and
Fayolle, Julien",
editor = "Langlais, Philippe and
Gagnon, Michel",
booktitle = "Actes de la 17e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jul,
year = "2010",
address = "Montr{\'e}al, Canada",
publisher = "ATALA",
url = "https://aclanthology.org/2010.jeptalnrecital-long.20",
pages = "191--200",
abstract = "Les transcriptions automatiques de parole constituent une ressource importante, mais souvent bruit{\'e}e, pour d{\'e}crire des documents multim{\'e}dia contenant de la parole (e.g. journaux t{\'e}l{\'e}vis{\'e}s). En vue d{'}am{\'e}liorer la recherche documentaire, une {\'e}tape d{'}extraction d{'}information {\`a} caract{\`e}re s{\'e}mantique, pr{\'e}c{\'e}dant l{'}indexation, permet de faire face au probl{\`e}me des transcriptions imparfaites. Parmis ces contenus informatifs, on compte les entit{\'e}s nomm{\'e}es (e.g. noms de personnes) dont l{'}extraction est l{'}objet de ce travail. Les m{\'e}thodes traditionnelles de reconnaissance bas{\'e}es sur une d{\'e}finition manuelle de grammaires formelles donnent de bons r{\'e}sultats sur du texte ou des transcriptions propres manuellement produites, mais leurs performances se trouvent fortement affect{\'e}es lorsqu{'}elles sont appliqu{\'e}es sur des transcriptions automatiques. Nous pr{\'e}sentons, ici, trois m{\'e}thodes pour la reconnaissance d{'}entit{\'e}s nomm{\'e}es bas{\'e}es sur des algorithmes d{'}apprentissage automatique : les champs conditionnels al{\'e}atoires, les machines {\`a} de support, et les transducteurs {\`a} {\'e}tats finis. Nous pr{\'e}sentons {\'e}galement une m{\'e}thode pour rendre consistantes les donn{\'e}es d{'}entrainement lorsqu{'}elles sont annot{\'e}es suivant des conventions l{\'e}g{\`e}rement diff{\'e}rentes. Les r{\'e}sultats montrent que les syst{\`e}mes d{'}{\'e}tiquetage obtenus sont parmi les plus robustes sur les donn{\'e}es d{'}{\'e}valuation de la campagne ESTER 2 dans les conditions o{\`u} la transcription automatique est particuli{\`e}rement bruit{\'e}e.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="raymond-fayolle-2010-reconnaissance">
<titleInfo>
<title>Reconnaissance robuste d’entités nommées sur de la parole transcrite automatiquement</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christian</namePart>
<namePart type="family">Raymond</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Fayolle</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2010-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Langlais</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Michel</namePart>
<namePart type="family">Gagnon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montréal, Canada</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les transcriptions automatiques de parole constituent une ressource importante, mais souvent bruitée, pour décrire des documents multimédia contenant de la parole (e.g. journaux télévisés). En vue d’améliorer la recherche documentaire, une étape d’extraction d’information à caractère sémantique, précédant l’indexation, permet de faire face au problème des transcriptions imparfaites. Parmis ces contenus informatifs, on compte les entités nommées (e.g. noms de personnes) dont l’extraction est l’objet de ce travail. Les méthodes traditionnelles de reconnaissance basées sur une définition manuelle de grammaires formelles donnent de bons résultats sur du texte ou des transcriptions propres manuellement produites, mais leurs performances se trouvent fortement affectées lorsqu’elles sont appliquées sur des transcriptions automatiques. Nous présentons, ici, trois méthodes pour la reconnaissance d’entités nommées basées sur des algorithmes d’apprentissage automatique : les champs conditionnels aléatoires, les machines à de support, et les transducteurs à états finis. Nous présentons également une méthode pour rendre consistantes les données d’entrainement lorsqu’elles sont annotées suivant des conventions légèrement différentes. Les résultats montrent que les systèmes d’étiquetage obtenus sont parmi les plus robustes sur les données d’évaluation de la campagne ESTER 2 dans les conditions où la transcription automatique est particulièrement bruitée.</abstract>
<identifier type="citekey">raymond-fayolle-2010-reconnaissance</identifier>
<location>
<url>https://aclanthology.org/2010.jeptalnrecital-long.20</url>
</location>
<part>
<date>2010-07</date>
<extent unit="page">
<start>191</start>
<end>200</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Reconnaissance robuste d’entités nommées sur de la parole transcrite automatiquement
%A Raymond, Christian
%A Fayolle, Julien
%Y Langlais, Philippe
%Y Gagnon, Michel
%S Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2010
%8 July
%I ATALA
%C Montréal, Canada
%G French
%F raymond-fayolle-2010-reconnaissance
%X Les transcriptions automatiques de parole constituent une ressource importante, mais souvent bruitée, pour décrire des documents multimédia contenant de la parole (e.g. journaux télévisés). En vue d’améliorer la recherche documentaire, une étape d’extraction d’information à caractère sémantique, précédant l’indexation, permet de faire face au problème des transcriptions imparfaites. Parmis ces contenus informatifs, on compte les entités nommées (e.g. noms de personnes) dont l’extraction est l’objet de ce travail. Les méthodes traditionnelles de reconnaissance basées sur une définition manuelle de grammaires formelles donnent de bons résultats sur du texte ou des transcriptions propres manuellement produites, mais leurs performances se trouvent fortement affectées lorsqu’elles sont appliquées sur des transcriptions automatiques. Nous présentons, ici, trois méthodes pour la reconnaissance d’entités nommées basées sur des algorithmes d’apprentissage automatique : les champs conditionnels aléatoires, les machines à de support, et les transducteurs à états finis. Nous présentons également une méthode pour rendre consistantes les données d’entrainement lorsqu’elles sont annotées suivant des conventions légèrement différentes. Les résultats montrent que les systèmes d’étiquetage obtenus sont parmi les plus robustes sur les données d’évaluation de la campagne ESTER 2 dans les conditions où la transcription automatique est particulièrement bruitée.
%U https://aclanthology.org/2010.jeptalnrecital-long.20
%P 191-200
Markdown (Informal)
[Reconnaissance robuste d’entités nommées sur de la parole transcrite automatiquement](https://aclanthology.org/2010.jeptalnrecital-long.20) (Raymond & Fayolle, JEP/TALN/RECITAL 2010)
ACL