Bienvenue au site Web du PROJET TerminoWeb
Information importante
Le site Web que vous êtes sur le point de visiter est destiné aux
chercheurs seulement et ne peut pas être considéré comme
un service grand public. Par conséquent, et en raison de la nature hautement
technique et dynamique de ces sites, le contenu peut être présenté dans
la langue d'origine et ne pas répondre aux attentes de la Normalisation
des sites Internet du gouvernement du Canada. Si vous ne pouvez pas accéder à l'information,
veuillez communiquer avec Caroline Barrière.
Les opinions et l'information présentées dans cette page ne
représentent pas les points de vue du gouvernement du Canada. Les données
de ce site Web sont provisoires, et les procédures décrites n'ont
peut-être pas été mises à l'essai. Le gouvernement
du Canada décline toute responsabilité à l'égard
des actions découlant de l'information trouvée sur ce site Web.
Le matériel présenté ici peut être protégé par
un brevet ou des droits d'auteur.
Description
L'environnement logiciel TerminoWeb est un outil expérimental
pour les terminologues et chercheurs en terminologie, conçu pour la construction et l’analyse semi-automatiques de corpus.
Dans son état actuel, TerminoWeb possède trois fonctionnalités principales:
- la recherche sur le web de documents riches en connaissance dans un domaine
- l’extraction de termes
- l’exploration de contextes riches en connaissance
TerminoWeb repose sur l’hypothèse que les contextes riches en connaissance sont utiles
aux terminologues dans leur recherche d’information définitionnelle pour des termes.
Ces contextes riches en connaissance sont exprimés dans les textes recherchés par des patrons informatifs.
Par exemple, la phrase:
"Un arbre syntaxique est une représentation abstraite de la structure grammaticale d'une phrase."
est un énoncé définissant en partie le terme technique "arbre syntaxique". Ce contexte intéressant
est signalé par la présense du patron linguistique informatif "X est un Y" que nous
appelons "patron de connaissance" (knowledge pattern). Il existe plusieurs patrons tel
celui-ci dans la langue naturelle, et nous appelons les contextes les entourants des
"contextes riches en connaissances" (knowledge-rich contexts).
TerminoWeb fournit une aide à la construction de corpus composés de documents ayant une haute
densité de patrons informatifs, et permet également l’exploration de ces patrons autour de termes d’intérêt.
Pour l’instant, TerminoWeb est prévu pour effectuer la recherche et le traitement de documents en anglais
en français. Nous sommes ouverts aux collaborations qui nous permettraient d'étendre notre étude à d'autres langues.
Avertissements :
- TerminoWeb est présentement en développement et mis à la disposition des usagers 'TEL QUEL'.
Le CNRC ne fournira aucun soutien aux usagers de TerminoWeb, mais souhaite recevoir les commentaires,
observations et notifications d’erreurs de la part des usagers; le CNRC se réserve le droit d’entreprendre ou non un suivi
aux commentaires reçus des usagers.
- TerminoWeb s’appuie sur des engins de recherche de tierces parties (Google, Yahoo) et ces tierces parties
limitent le nombre de requêtes possibles au courant d’une journée : en conséquence, les usagers de TerminoWeb sont
encouragés à faire un usage modéré de TerminoWeb et de l’utiliser comme un outil de R-D.
- TerminoWeb permet aux usagers de sauvegarder des corpus, mais le CNRC ne guarantit aucunement que les données
sauvegardées seront disponibles en tout temps.
La version courante, rendue disponible en mai 2009, est la Version 2.0.
Le contexte et les buts généraux du projet TerminoWeb sont décrits sur
la Page TerminoWeb.
Des publications techniques sur TerminoWeb et autres sujets connexes se retrouvent sur le site de
Caroline Barrière, chercheure
en charge du projet.
TerminoWeb est un des projets du Groupe de Technologies Langagières Interactives.
Personne-ressource
Caroline Barrière
Agente de recherche
Groupe de Technologies Langagières Interactives
Institut de technologie de l'information du CNRC
101 Jean-Bosco
Gatineau, QC J8Y 3G5 Canada
Téléphone: +1 (819) 934-3450
Télécopieur: +1 (819) 934-2607
Courriel: Caroline.Barriere@nrc-cnrc.gc.ca |