AccueilAccueil  FAQFAQ  RechercherRechercher  S'enregistrerS'enregistrer  MembresMembres  GroupesGroupes  Connexion  

Partagez | 
 

 Linguistique de Corpus CM - L6F01

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
culfinwen
Déesse du parrainage
Déesse du parrainage
avatar

Nombre de messages : 408
Age : 30
Localisation : Liège (Belgique)
qq ch à dire ? : Il n'y a que l'ours blanc qui s'étonne que sa banquise fonde... c'est l'effet papillon
Cursus : M1 FLE Télé3
Date d'inscription : 14/09/2008

MessageSujet: Linguistique de Corpus CM - L6F01   Mer 28 Jan 2009 - 22:46

Bonjour à tous!

Je rappelle brièvement ici que ce cours est assuré par plusieurs enseignants, à savoir: M. Gendrot, M. Salem et M. Gerdes (et bien-sûr Luiggi, mais en TD)...

Allez, on est hyper motivé avant la grève!! ^^
On va faire de la... LINGUISTIQUE DE CORPUS!!
Revenir en haut Aller en bas
culfinwen
Déesse du parrainage
Déesse du parrainage
avatar

Nombre de messages : 408
Age : 30
Localisation : Liège (Belgique)
qq ch à dire ? : Il n'y a que l'ours blanc qui s'étonne que sa banquise fonde... c'est l'effet papillon
Cursus : M1 FLE Télé3
Date d'inscription : 14/09/2008

MessageSujet: CM1 du 28/01/09   Sam 31 Jan 2009 - 2:53

CM 1 du 28/01/09
Linguistique de corpus


Bonjour, ô tous!
Chanceux que vous êtes, rendez-vous compte! Ce cours vous est posté un vendredi soir à 2h du matin bien tassé depuis une chambre polonaise, eh oui! Au lieu d'être en train de subir la musique trop forte et le tabagisme passif des boites de nuits (oui, en Pologne, on peut fumer en boite et le paquet de clopes est à 2,50 euros), je suis devant un écran, sage et bien coiffée, pour mettre en ligne les notes du premier cm de linguistique de corpus.
Ah la jeunesse... c'est plus ce que c'était...
Je dois avoir passé l'âge d'être jeune, remarquez.

Alors les notes...!

Ce premier CM fut dispensé par M. Gendrot, qui, fidèle à lui-même, nous avait préparé un ppt super complet qui devrait être en ligne sur agora dans peu de temps.

Les notes qui suivent sont essentiellement des séries d'exemples censées éclaircir les définitions du ppt. Comme disait en cours M. Gendrot, c'est surtout du bon sens, mais je les remets ici quand même. Merci de vous rapporter au ppt.

Habert -> connu en TAL; a travaillé avec A. Salem (oui oui, celui de chez nous).

Un corpus -> des corpora... sauf que personne ne le dit jamais.

travail préparatoire: on doit décider AVANT d'enregistrer de ce qu'on veut analyser.
On n'enregistre pas au hasard et ensuite on ne se demande pas "qu'est-ce que je vais bien pouvoir tirer de cet enregistrement?".

Site de base de données orales: CRDO
(centre de ressources de données orales)

Annotation
p.ex. en TD la semaine prochaine -> transcription. On s'apercevra qu'un dixième, voire un cinquième, des mots n'est pas audibles.
=> cf les cours sur la perception du premier semestre.

étiquetage prosodique -> cf TD aussi.

Pour éviter les bêtises, il est bon de se renseigner de ce qui a été fait avant.

Recherches dans les années 90.
_ PFC -> toujours en cours.
site internet : points d'enquête précis en France.
p.ex. en Vendée...
Monsieur Gendrot est de Vendée mais il a un accent non vendéen (oui, on apprend des choses super en cours ^^).
_ ValiBel -> même chose que PFC mais belge (wallon).
_ etc.

2 types de corpora:
_ corpus de référence: en général, très grand, international, financé ... p.ex. PFC.
_ corpus de spécialité: plus petit, p.ex. des corpora d'étudiants en master ou en thèse -> il faut cibler ce qu'on veut et on a l'occasion d'enregistrer à peine 3 ou 4 locuteurs.

"Du tout venant": p.ex. enregistrer des émissions radiophoniques.
Ensuite, on peut en analyser la syntaxe, etc.
Autre exemple: corpus ESTER -> émissions journalistiques (50h) transcrites en synt et en morphèmes.
=> c'est tellement énorme qu'on a tous les contextes disponibles.
On peut donc réutiliser ces corpora pour diverses recherches sans être obligé de refaire un corpus.
D'où l'importance de l'annotation (pour ceux qui se resservent des corpora après nous!).

corpus parallèle -> vu en CM avec André Salem.

W. Labov -> il a établi une liste de mots à faire prononcer et enregistrer aux locuteurs lorsqu'on veut travailler sur la variation régionale.

Eviter les biais...

Corpus de spé:
tata nadia blablablabla...
Le "Na" est toujours la cinquième syllabe.
=> il faut essayer de maîtriser le plus de paramètres possibles, cela donne parfois des phrases tordues... :-S

Il faut équilibrer le plus possible: nombre de locuteurs par groupe, tranche d'âge, sexe, milieu social, etc.
Si on prend dans le Poitou une dizaine de femmes de cinquante à cinquante-cinq ans et puis en Normandie une trentaine d'hommes de moins de trente ans, ça ne va pas... comparaison délicate car biaisée!

Les socioling considèrent que si le locuteur sait qu'il y a un micro, ce n'est plus de la parole spontanée.
Du coup, un truc, c'est de brancher le micro sans le dire aux locuteurs et de faire semblant d'avoir oublié quelque chose et, ensuite, on les laisse parler, ce qui donne parfois lieu à des trucs marrants du genre "c'est quoi, ce truc bidon?" ^^'

Les entretiens guidés: super longs...! On veut faire prononcer un mot à un locuteur mais on ne doit pas lui dire lequel car c'est un biais: le locuteur a tendance à le prononcer de la même façon que nous...
Donc il faut l'amener à dire ce mot... (ça doit être super marrant, un jeu de devinette comme ça! :-D)
C'est ce qu'a fait M. Jean-Léo Léonard cet été en Amérique du Sud, par exemple.

ELDA -> entreprise qui embauche svt des étudiants pour enregistrer ou annoter des données; travaille avec des entreprises qui font des logiciels en reconnaissance de la parole (transcription de parole, etc.).
=> p.ex. Quaero (= sorte de google pour doc multimédia) ou 888 teletex (sous-titres à la télé, en direct) etc.

Transcription lexicale:
Cela inclut une segmentation.
Cf TD 2, extrait Roger (environ 5 min)

CM arrêté à la dia 41.

Bon, allez, il recommence à neiger... Bien le bonsoir depuis Lodz et on se retrouve pour de prochaines aventures! XD
Revenir en haut Aller en bas
Maximilien Guérin
Modo
Modo
avatar

Nombre de messages : 343
Age : 30
Cursus : Doctorat
Date d'inscription : 06/10/2006

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Jeu 5 Fév 2009 - 15:34

Message d'André Salem :

Citation :
Chers étudiants de L6F01

Aux dernières nouvelles, en raison de l'absence de réponse sérieuse de la part du gouvernement, la grève des enseignants va se poursuivre cette semaine. Pour ce qui me concerne, comme je l'ai annoncé, je suivrai les résolutions votées par les AG des personnels de Paris 3. J'accueillerai les étudiants qui se présenteront mercredi 4 Février à 14h (horaire prévu) mais le cours n'aura pas lieu, sauf évolution de dernière heure.

Le planning de notre module L6F01 ne prévoyait que quelques CM (dont 2 avec moi) sur les 13 semaines du deuxième semestre. Je vous propose donc de considérer que les cours que nous devons avoir ensemble sont, pour l’instant, remis à plus tard. Je vous invite à vous informer de la suite des événements sur le site web que je crée pour notre communication :
http://www.cavi.univ-paris3.fr/ilpga/as/l6f01/
je poserai rapidement sur le même site un jeu de diapositives qui vous permettront de prendre connaissance des questions dont je souhaite vous entretenir.

Très cordialement, espérant encore une fois que ce conflit trouvera très rapidement une issue favorable.

_________________
Esperanto au bac


Dernière édition par Belladon le Jeu 5 Fév 2009 - 16:10, édité 2 fois
Revenir en haut Aller en bas
http://maximilien.guerin.free.fr/
luiggisanso
Professeur
Professeur
avatar

Nombre de messages : 94
Age : 41
Localisation : quelque part, pas loin
qq ch à dire ? : beaucoup mais pas de place...
Cursus : 2002 --> 2009 et ...
Date d'inscription : 15/11/2008

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Jeu 5 Fév 2009 - 15:55

bonjour
le lien est le suivant pour l'instant :
http://www.cavi.univ-paris3.fr/ilpga/as/l6f01/
avec L6F01 en MINUSCULE !
Revenir en haut Aller en bas
luiggisanso
Professeur
Professeur
avatar

Nombre de messages : 94
Age : 41
Localisation : quelque part, pas loin
qq ch à dire ? : beaucoup mais pas de place...
Cursus : 2002 --> 2009 et ...
Date d'inscription : 15/11/2008

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Mer 20 Mai 2009 - 21:07

vous trouverez sur agora 2 ressources pour les CM de Kim Gerdes dont la dernière a été mise ce matin
Revenir en haut Aller en bas
Jaaade
Consultant(e)


Nombre de messages : 5
Age : 29
Cursus : 3è année
Date d'inscription : 17/12/2008

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Mar 26 Mai 2009 - 15:54

Bonjour,

est-ce que M. Gerdes a précisé sur quoi portait le partiel demain? (je n'ai pas assisté au cours de la semaine dernière) Sur les 2 textes entiers?
Revenir en haut Aller en bas
Maximilien Guérin
Modo
Modo
avatar

Nombre de messages : 343
Age : 30
Cursus : Doctorat
Date d'inscription : 06/10/2006

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Mar 26 Mai 2009 - 18:27

Le partiel portera sur les deux cours qu'il a fait la semaine dernière et il y a deux semaines. Les deux textes sont également à lire dans la mesure où ils reprennent ce que Gerdes a dit en l'approfondissant. Il n'est donc pas à exclure qu'il y est des questions sur des points présents dans les textes que le prof n'a pas eu le temps d'aborder en cours.

_________________
Esperanto au bac
Revenir en haut Aller en bas
http://maximilien.guerin.free.fr/
Polyphile
Aide active
Aide active
avatar

Nombre de messages : 122
Age : 28
Localisation : Antipodes
qq ch à dire ? : LA, CA
Cursus : M2 Documents Électroniques et Flux d'Information + M2 DIAPASON Handicap langagier, prévention, diagnostic, réhabilitation
Date d'inscription : 03/10/2007

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Ven 19 Fév 2010 - 16:18

Bonjour à tous!


Voici le CM2 de M. Gerdes pour l'année 2009-2010


CM2
Revenir en haut Aller en bas
31lalo
Consultant(e)
avatar

Nombre de messages : 11
Age : 29
Cursus : Sciences du langage
Date d'inscription : 10/11/2009

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Mer 26 Mai 2010 - 17:39

je poste un peu tard mais voici le sujet de l'année 2008-2009.

[img][/img]
Revenir en haut Aller en bas
31lalo
Consultant(e)
avatar

Nombre de messages : 11
Age : 29
Cursus : Sciences du langage
Date d'inscription : 10/11/2009

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Ven 28 Mai 2010 - 21:30

ATTENTION PAS DE PARTIEL POUR CETTE MATIÈRE. En effet nous seront notés uniquement grâce à nos dossiers.

Je crois que je vais devenir chèvre, je viens de l'apprendre aujourd'hui même par M.Gerdes et beaucoup ne sont pas au courant.

Voici sa réponse au mail que je lui ai envoyé:


Citation :
bonjour,
oui, si vous êtes en contrôle continu.
une annonce devrait être affichée à l'institut à ce propos.
bien cordialement
kim gerdes
--
gerdes.fr


2010/5/20 l.zidani
Monsieur,

Je suis élève dans votre cours de linguistique de corpus en L3 et des rumeurs circulent comme quoi le partiel de cette matière n'aura pas lieu et que seules nos notes de dossier compteront.
Est-ce vrai?

Cordialement,
Laura ZIDANI
Revenir en haut Aller en bas
Polyphile
Aide active
Aide active
avatar

Nombre de messages : 122
Age : 28
Localisation : Antipodes
qq ch à dire ? : LA, CA
Cursus : M2 Documents Électroniques et Flux d'Information + M2 DIAPASON Handicap langagier, prévention, diagnostic, réhabilitation
Date d'inscription : 03/10/2007

MessageSujet: Re: Linguistique de Corpus CM - L6F01   Mar 20 Juil 2010 - 11:17

Pour l'année prochaine, voici les cours de 2009-2010 pour ceux que cela intéresse.

Voir le Fichier : Linguistique_de_corpus.zip
Revenir en haut Aller en bas
Contenu sponsorisé




MessageSujet: Re: Linguistique de Corpus CM - L6F01   

Revenir en haut Aller en bas
 
Linguistique de Corpus CM - L6F01
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» Corpus littéraire et corpus linguistique : une solidarité nécessaire à la description de l’« africanité » du français
» CORPUS CHRISTI (vidéo)
» Récit du corpus biblique dans la tradition chrétienne
» [eaf] diverses questions sur la question sur corpus
» Le problème linguistique de l'humanité

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
Forum des Étudiants de l'ILPGA :: Sciences Du Langage :: Licence 3 - Semestre 6-
Sauter vers: