Conseil national de recherches CanadaGouvernement du Canada
Éviter tous les menus (touche d'accès : 2)Éviter le menu latéral (touche d'accès : 1)Menu latéral (touche d'accès : M)
Conseil national de recherches CanadaInstitut de technologie de l'information

Bienvenue au site Web du PROJET TerminoWeb

Information importante

Le site Web que vous êtes sur le point de visiter est destiné aux chercheurs seulement et ne peut pas être considéré comme un service grand public. Par conséquent, et en raison de la nature hautement technique et dynamique de ces sites, le contenu peut être présenté dans la langue d'origine et ne pas répondre aux attentes de la Normalisation des sites Internet du gouvernement du Canada. Si vous ne pouvez pas accéder à l'information, veuillez communiquer avec Caroline Barrière.

Les opinions et l'information présentées dans cette page ne représentent pas les points de vue du gouvernement du Canada. Les données de ce site Web sont provisoires, et les procédures décrites n'ont peut-être pas été mises à l'essai. Le gouvernement du Canada décline toute responsabilité à l'égard des actions découlant de l'information trouvée sur ce site Web.

Le matériel présenté ici peut être protégé par un brevet ou des droits d'auteur.

Description

L'environnement logiciel TerminoWeb est un outil expérimental pour les terminologues et chercheurs en terminologie, conçu pour la construction et l’analyse semi-automatiques de corpus.

Dans son état actuel, TerminoWeb possède trois fonctionnalités principales:

  • la recherche sur le web de documents riches en connaissance dans un domaine
  • l’extraction de termes
  • l’exploration de contextes riches en connaissance
TerminoWeb repose sur l’hypothèse que les contextes riches en connaissance sont utiles aux terminologues dans leur recherche d’information définitionnelle pour des termes. Ces contextes riches en connaissance sont exprimés dans les textes recherchés par des patrons informatifs. Par exemple, la phrase:

    "Un arbre syntaxique est une représentation abstraite de la structure grammaticale d'une phrase."

est un énoncé définissant en partie le terme technique "arbre syntaxique". Ce contexte intéressant est signalé par la présense du patron linguistique informatif "X est un Y" que nous appelons "patron de connaissance" (knowledge pattern). Il existe plusieurs patrons tel celui-ci dans la langue naturelle, et nous appelons les contextes les entourants des "contextes riches en connaissances" (knowledge-rich contexts).

TerminoWeb fournit une aide à la construction de corpus composés de documents ayant une haute densité de patrons informatifs, et permet également l’exploration de ces patrons autour de termes d’intérêt.

Pour l’instant, TerminoWeb est prévu pour effectuer la recherche et le traitement de documents en anglais en français. Nous sommes ouverts aux collaborations qui nous permettraient d'étendre notre étude à d'autres langues.

Avertissements :

  • TerminoWeb est présentement en développement et mis à la disposition des usagers 'TEL QUEL'. Le CNRC ne fournira aucun soutien aux usagers de TerminoWeb, mais souhaite recevoir les commentaires, observations et notifications d’erreurs de la part des usagers; le CNRC se réserve le droit d’entreprendre ou non un suivi aux commentaires reçus des usagers.
  • TerminoWeb s’appuie sur des engins de recherche de tierces parties (Google, Yahoo) et ces tierces parties limitent le nombre de requêtes possibles au courant d’une journée : en conséquence, les usagers de TerminoWeb sont encouragés à faire un usage modéré de TerminoWeb et de l’utiliser comme un outil de R-D.
  • TerminoWeb permet aux usagers de sauvegarder des corpus, mais le CNRC ne guarantit aucunement que les données sauvegardées seront disponibles en tout temps.

La version courante, rendue disponible en mai 2009, est la Version 2.0.

Le contexte et les buts généraux du projet TerminoWeb sont décrits sur la Page TerminoWeb.

Des publications techniques sur TerminoWeb et autres sujets connexes se retrouvent sur le site de Caroline Barrière, chercheure en charge du projet.

TerminoWeb est un des projets du Groupe de Technologies Langagières Interactives.

Personne-ressource

Caroline Barrière
Agente de recherche
Groupe de Technologies Langagières Interactives
Institut de technologie de l'information du CNRC
101 Jean-Bosco
Gatineau, QC  J8Y 3G5  Canada

Téléphone: +1 (819) 934-3450
Télécopieur: +1 (819) 934-2607
Courriel: Caroline.Barriere@nrc-cnrc.gc.ca

   
  spacer
Date de publication : 2006-12-21