cs| en

Data


Všechna zde publikovaná data podléhají licenci CC-BY-SA.

Doporučený citační formát:
Plecháč, Petr – Kolár, Robert (2017). Korpus českého verše: zdrojová data. Dostupné z <http://versologie.cz>.
Veršové rozměry
Soubor dcm.xml (~ 180 MB) obsahuje strukturované informace o rozměrech (metrum, počet stop, klauzule, vzorec) jednotlivých veršů doložených v Korpusu českého verše.

Pevné formy
Soubor forms.xml (~ 1 MB) obsahuje strukturovaný soupis básní z Korpusu českého verše, které byly označeny jako realizace některé z pevných forem (sonet, limerik...).

Rýmy
Soubor gunstick.xml (~ 120 MB) obsahuje strukturovaný soupis všech rýmů nalezených v Korpusu českého verše.

Klíčová slova
Soubor hex.xml (~ 100 MB) obsahuje strukturovaný soupis klíčových a tematických slov jednotlivých básní v Korpusu českého verše.

Frekvenční slovníky
Frekvenční slovníky české poezie obsahují údaje o četnosti slov v básnických dílech zahrnutých do Korpusu českého verše. Slovníky udávají jednak frekvenci lemmat, jednak frekvenci slovních tvarů (word), a to jak v jednotlivých básnických sbírkách, tak v celých autorských subkorpusech i v celém Korpusu českého verše.

[slovníky »]

Tyto stránky byly vytvořeny s podporou Grantové agentury ČR v rámci projektů P406/11/1825 (Dějiny a teorie českého verše 19. století) a 17-01723S (Stylometrická analýza básnických textů) a s podporou na dlouhodobý koncepční rozvoj výzkumné instituce 68378068.
© 2017 Petr Plecháč