cs| en

Hex – klíčová slova

Nástroje » Hex
HLEDAT KLÍČOVÉ SLOVO
PROCHÁZET DATABÁZI
Lemma: [?]
Rok: [?] od: do:
Autor: [?]
Sbírka: [?]
Báseň: [?]
řadit dle příjmení autora
řadit dle názvu sbírky
řadit dle roku vydání
řadit dle názvu básně
frekvenční seznam výběru
podstatná jména
přídavná jména
zájmena
číslovky
slovesa
příslovce
předložky
spojky
částice
citoslovce
Metoda:
Klíčová slova
Tematická slova (h-bod)

Minimální četnost:

Hladina významnosti (α):

Referenční korpus:
Korpus českého verše
Dílo autora

Minimální velikost
autorského subkorpusu:

Aplikace Hex umožňuje vyhledávat v Korpusu českého verše texty, které obsahují uživatelem specifikované klíčové/tematické slovo, nebo naopak u uživatelem specifikovaného okruhu textů zobrazit všechna klíčová/tematická slova v nich nalezená.

Jako klíčová jsou určena ta lemmata, jejichž frekvence v dané básni statisticky významně převyšuje jejich frekvenci v celém Korpusu českého verše. Statistická významnost je ověřována zároveň testem χ2 s Yatesovou korekcí a testem log-likelihood. Uživatel má možnost specifikovat, zda budou testy provedeny na hladině významnosti α = 0,001 (tedy s 0,1% rizikem, že za klíčové slovo bude chybně označeno lemma, jehož vyšší frekvence v dané básni je pouze dílem náhody) nebo α = 0,01 (tedy s 1% rizikem téhož). Spolu s tím má uživatel možnost specifikovat, které slovní druhy mají být z analýzy klíčových slov vypuštěny (ve výchozím stavu jsou povolena pouze podstatná jména, přídavná jména a slovesa), určit minimální počet výskytů lemmatu v básni potřebný pro zařazení mezi klíčová slova a zvolit referenční korpus (zda budou hodnoty porovnány s celým korpusem nebo jen s díly daného autora .
Pro analýzu klíčových slov ve vlastních textech doporučujeme aplikaci KWords vyvinutou Ústavem českého národního korpusu FF UK, jíž jsme se při tvorbě Hexu nechali inspirovat.

Jako tematická jsou označena ta lemmata, jejichž absolutní frekvence je vyšší, než jejich pořadí v rankové frekvenční distribuci dané básně (objevuí se v básni víckrát, než kolikáté nejfrekventovanější jsou), srov. Čech-Popescu-Altmann 2014.

Tyto stránky byly vytvořeny s podporou Grantové agentury ČR v rámci projektů P406/11/1825 (Dějiny a teorie českého verše 19. století) a 17-01723S (Stylometrická analýza básnických textů) a s podporou na dlouhodobý koncepční rozvoj výzkumné instituce 68378068.
© 2017 Petr Plecháč