cz| en| ru
O nás | Členové týmu | Korpus českého verše | On‑line nástroje | Publikace / Projekty | Ke stažení | Spolupráce | Kontakt | Odkazy

Korpus českého verše

Korpus českého verše
Korpus českého verše (KČV) je lemmatizovaný, foneticky, morfologicky, metricky a stroficky anotovaný korpus české poezie 19. a počátku 20. století.*
Ke každé slovní jednotce v korpusu je připojena informace o jejím základním slovním tvaru (lemma), fonetickém přepisu a gramatických kategoriích, u každého verše je určeno metrum (jamb, trochej...), rozsah (n-stopý), typ klauzule (mužská, ženská...) a metrický vzorec. (V současnosti jsou z hlediska metriky anotovány pouze verše sylabotónické.) Na vyšších rovinách jsou pak anotovány rýmové dvojice, resp. n-tice a pevné formy (sonet, rondel...). V metrickém a strofickém popisu je možné vyhledávat prostřednictvím Databáze českých meter, rovina lemmatizace je částečně zpřístupněna prostřednictvím Frekvenčních slovníků, rýmové páry lze vyhledávat v aplikaci Gunstick
KČV vychází z textů České elektronické knihovny, která ovšem obsahuje řadu duplictních jednotek (opakovaný výskyt básní v různých vydáních sbírky či sebraných spisech autora). Aby nedocházelo ke zbytečnému zkreslování statistik, rozhodli jsme se do KČV zahrnout vždy pouze nejstarší výskyt každé básně (soupis vyřazených básní). Shoda mezi básněmi přitom byla určována na základě fonetického přepisu. Selekce by tedy neměla být ovlivněna např. odchylkami v interpunkci a zároveň by nemělo docházet k odstranění přetisků, v nichž byly oproti staršímu znění provedeny (byť nepatrné) změny.
* Lemmatizaci a morfologickou anotaci laskavě provedli pracovníci Ústavu teoretické a komputační lingvistiky FF UK (Hana Skoumalová, Milena Hnátková, Tomáš Jelínek a Vladimír Petkevič) ve spolupráci s pracovníky Ústavu formální a aplikované lingvistiky MFF UK (Jan Hajič, Jaroslava Hlaváčová).
Prezentace Korpusu českého verše

Základní charakteristiky Korpusu českého verše

  • 1 689 básnických sbírek
  • 76 699 básní
  • 2 664 989 veršů
  • 14 592 037 slov

Složení korpusu českého verše

Počet básní

» Počet veršů «

Počet slov

» Rok vydání «

Rok narození autora

Na Florenci 3/1420, 110 00 Praha 1
+420 222 828 148
Profil Versologického týmu

Sdílet

Vývoj aplikací umístěných na těchto stránkách, tvorba stránek a jejich překlad do angličtiny (Gabriela Brůhova) a ruštiny (Evgenia Tumanova) byly podpořeny GA ČR (P406/11/1825) a dlouhodobým koncepčním rozvojem výzkumné instituce 68378068.
© 2014 Petr Plecháč