1. bookVolumen 72 (2022): Edición 4 (June 2022)
    Building Web corpora as sources for linguistic research and its applications
Detalles de la revista
License
Formato
Revista
eISSN
1338-4287
Primera edición
05 Mar 2010
Calendario de la edición
2 veces al año
Idiomas
Inglés
access type Acceso abierto

Extracting fishing terminology using GNU/Linux tools

Publicado en línea: 17 Aug 2022
Volumen & Edición: Volumen 72 (2022) - Edición 4 (June 2022) - Building Web corpora as sources for linguistic research and its applications
Páginas: 916 - 926
Detalles de la revista
License
Formato
Revista
eISSN
1338-4287
Primera edición
05 Mar 2010
Calendario de la edición
2 veces al año
Idiomas
Inglés
Abstract

The technological revolution that has occurred in recent decades has made accessible for researches large textual data collections. At the same time, the development of increasingly sophisticated computer tools provides them with new methods of analyzing texts. In the present study however we examine the functionalities offered by traditional tools, namely GNU/Linux tools, easily accessible via the command line but still unknown among linguists with little or no computer knowledge. Our goal is to show how using the web corpus on the one hand and the processing GNU/Linux tools on the other, we can extract key-terms of fishing jargon.

Keywords

AMITAY, Einat : Anchors in context: A corpus analysis of web pages authoring conventions. In : Words on the Web – Computer Mediated Communication. Eds. L. Pemberton – S. Shurville. Éd. Intellect Books 1999. Search in Google Scholar

BLANCHET, Philippe : La linguistique de terrain. Méthode et théorie. Rennes : Presses universitaires de Rennes 2012. Search in Google Scholar

DROUIN, Patrick : Acquisition automatique de termes : simuler le travail du terminologue. In : Études de linguistique appliquée, 2015, Vol. 180, No 4, pp. 417–427.10.3917/ela.180.0417 Search in Google Scholar

FOUQUERÉ, Christophe – ISSAC, Fabrice : Corpus issus du Web : constitution et analyse informationnelle. In : Revue québécoise de linguistique, 2003, Vol. 32, No 1, pp. 111–134.10.7202/012246ar Search in Google Scholar

FRANÇOIS-GEIGER, Denise : 1988, Les paradoxes des argots. In : Actes du Colloque culture et pauvretés. Eds. A. Lion – P. de Meca. 1988, pp. 17–24, Tourette 13-15 décembre 1985, La Documentation française. Search in Google Scholar

GANASCIA Jean-Gabriel : Les big data dans les humanités. In : Critique, 2015, No 819-820, pp. 627–636.10.3917/criti.819.0627 Search in Google Scholar

KALISKA, Agnieszka : Potoczność a terminologiczność socjolektu wędkarskiego. Polskie i francuskie nazwy technik wędkarskich. In : Orbis Linguarum, Vol. 49, Dresden-Wrocław : Neisse Verlag & Oficyna Wydawnicza ATUT 2018, pp. 109–126. Search in Google Scholar

LABOV, William : Some Principles of Linguistic Methodology. In : Language in Society, 1972, Vol. 1, No 1, pp. 97–120.10.1017/S0047404500006576 Search in Google Scholar

LONGHI, Julien : Humanités, numérique : des corpus au sens, du sens aux corpus. In : Questions de communication, 2017, Vol. 31, pp. 7–17.10.4000/questionsdecommunication.11039 Search in Google Scholar

ORTIZ, Pedro J. – SAGOT, Benoît – ROMARY, Laurent : OSCAR – Open Super-large Crawled ALMAnaCH coRpus. Disponible sur : https://oscar-corpus.com/ux normes (accès : 12-14 octobre 2020). Search in Google Scholar

PANCKHURST, Rachel : Discours électronique médié : quelle évolution depuis une décennie ? In : La langue du cyberespace : de la diversité aux normes. Ed. J. Gerbault. Paris : L’Harmattan 2007, pp. 121–136. Search in Google Scholar

PIASECKI, Maciej : User-driven language technology infrastructure – the case of Clarin-PL. In : Proceedings of the 9th Language Tehnologies Conference. Ljubliana : Information Society 2014. Search in Google Scholar

SCHEER, Tobias : Le corpus heuristique : un outil qui montre mais ne démontre pas. In : Corpus, 2004, No 3, pp. 153–192.10.4000/corpus.210 Search in Google Scholar

SHOTTS, William E., Jr. : The Linux Command Line. Éd. No Starch Press 2012. Search in Google Scholar

SOURDOT, Marc : Les mots de la pêche ou « emprunter c’est jouer ». In : Journée d’hommage à A.-M. Houdebine. La Rochelle 17 juin 2011. Disponible sur : l.brunethunault.free.fr/17juin/marcSourdot.pdf]. Search in Google Scholar

SOURDOT, Marc : Il faut appeler un « shad » un shad. In : Le poids des mots. Hommage à Alicja Kacprzak. Eds. A. Konowska – A. Woch – A. Napieralski – A. Bobińska. Łódź : Wydawnictwo Uniwersytetu Łódzkiego 2018, pp. 275–281.10.18778/8142-075-4.25 Search in Google Scholar

Mots vides français en ligne. Disponible sur : https://countwordsfree.com/stopwords/french Search in Google Scholar

Ressources lexicales sur le site d’Yann van der Cruyssen. Disponible sur : http://www.nurykabe.com Search in Google Scholar

TLFi : Trésor de la langue Française informatisé. Disponible sur : http://www.atilf.fr/tlfi, ATILF - CNRS & Université de Lorraine. Search in Google Scholar

Artículos recomendados de Trend MD

Planifique su conferencia remota con Sciendo