1. bookVolumen 72 (2022): Edición 4 (June 2022)
    Building Web corpora as sources for linguistic research and its applications
Detalles de la revista
License
Formato
Revista
eISSN
1338-4287
Primera edición
05 Mar 2010
Calendario de la edición
2 veces al año
Idiomas
Inglés
access type Acceso abierto

Kladenští type as a problem of automatic morphological analysis

Publicado en línea: 17 Aug 2022
Volumen & Edición: Volumen 72 (2022) - Edición 4 (June 2022) - Building Web corpora as sources for linguistic research and its applications
Páginas: 862 - 872
Detalles de la revista
License
Formato
Revista
eISSN
1338-4287
Primera edición
05 Mar 2010
Calendario de la edición
2 veces al año
Idiomas
Inglés
Abstract

The aim of our paper is to demonstrate the procedures by which the data needed to refine tools for automatic morphological analysis of Czech can be obtained using a corpus, namely the Araneum Bohemicum IV Maximum (Czech, 20.03) 7.10 G web corpus of the ARANEA series and Araneum Bohemicum Maximum (Czech, 15.04) 3,20 G (hereinafter Araneum). Particularly, we will focus on propria of the Kladenští type, i.e., substantivized adjectives of denoting groups of persons according to affiliation. The goal of the probe into the Aranea web corpus is: 1) a corpus-based description of frequented properties of the Kladenští type, which can be used as a starting point for rule disambiguation; 2) creating a list of the most frequent lemmas belonging to the Kladenští type, which can then be included into dictionaries of automatic morphological analyzers (e.g. the MorfFlex dictionary by Hajič and Hlaváčová). We believe that the probe can help improve the results of tools for automatic morphological analysis of Czech.

Keywords

BENKO, Vladimír: Araneum Bohemicum IV Maximum (Czech, 20.03) 7.10 G. Bratislava: Comenius University 2020. Dostupný na: http://unesco.uniba.sk/aranea_about [cit. 14. 12. 2020]. Search in Google Scholar

BENKO, Vladimír: Aranea: Yet Another Family of (Comparable) Web Corpora. In: TSD 2014, LNAI 8655. Eds. P. Sojka – A. Horák – I. Kopeček – K. Pala. Springer International Publishing 2014, s. 257–264. Search in Google Scholar

HAJIČ, Jan – HLAVÁČOVÁ, Jaroslava: MorfFlex CZ 161115. Praha: LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics(ÚFAL), Faculty of Mathematics and Physics, Charles University 2016. Dostupné na: http://hdl.handle.net/11234/1-1834 [cit. 14. 12. 2020]. Search in Google Scholar

HLAVÁČKOVÁ, Dana – HRABALOVÁ, Barbora – MACHURA, Jakub – MASOPUSTOVÁ, Markéta – MRKÝVKA, Vojtěch – VALÍČKOVÁ, Marie – ŽIŽKOVÁ, Hana: New Online Proofreader for Czech. In: Slavonic Natural Language Processing in the 21st Century. Eds. A. Horák – P. Rychlý – A. Rambousek. Brno: Tribun EU 2019, s. 79–92. Search in Google Scholar

HNÁTKOVÁ, Milena – JELÍNEK, Tomáš – KOPŘIVOVÁ, Marie – PETKEVIČ, Vladimír – ROSEN, Alexandr – SKOUMALOVÁ, Hana – VONDŘIČKA, Pavel: Lepší vrabec v hrsti nežli holub na střeše. Víceslovné lexikální jednotky v češtině: typologie a slovník. In: Korpus – gramatika – axiologie, 2018, roč. 17, s. 3–22. Search in Google Scholar

Internetová jazyková příručka. Praha: Ústav pro jazyk český AV ČR, v. v. i. (2008–2020). Dostupný na: https://prirucka.ujc.cas.cz/?id=181 [cit. 14. 12. 2020]. Search in Google Scholar

JELÍNEK, Tomáš – KOPŘIVOVÁ, Marie – PETKEVIČ, Vladimír – SKOUMALOVÁ, Hana: Variabilita českých frazémů v úzu. In: Časopis pro moderní filologii, 2018, roč. 100, č. 2, s. 151–175. Search in Google Scholar

PETKEVIČ, Vladimír – HLAVÁČOVÁ, Jaroslava – OSOLSOBĚ, Klára – SVÁŠEK, Martin – ŠIMANDL, Josef: Parts of Speech in NovaMorf, a New Morphological Annotation of Czech. In: Jazykovedný časopis, 2019, roč. 70, č. 2, s. 358–369.10.2478/jazcas-2019-0065 Search in Google Scholar

OSOLSOBĚ, Klára – ŽIŽKOVÁ, Hana: Improving Nominalized Adjectives Tagging. In: Jazykovedný časopis, 2019, roč. 70, č. 2, s. 370–379.10.2478/jazcas-2019-0066 Search in Google Scholar

OSOLSOBĚ, Klára – ŽIŽKOVÁ, Hana: Homonymie mezi apelativy a proprii jako problém automatické morfologické analýzy češtiny. In: Acta onomastica, 2020, roč. LXI, č. 1, s. 161–174. Search in Google Scholar

ŠTÍCHA, František a kol.: Velká akademická gramatika spisovné češtiny I. Morfologie: Druhy slov / Tvoření slov. Část I (VAGSČ I). Praha: Academia 2018. Search in Google Scholar

Artículos recomendados de Trend MD

Planifique su conferencia remota con Sciendo