Narodil se okolo Hradce, ve čtyřiceti mu vyšel román. Nejpravděpodobnější z 267 tisíc českých spisovatelů

Seriál datových článků o české literatuře a knižní produkci obecně pokračuje druhým dílem, věnovaným spisovatelům a spisovatelkám, ale také těm, kteří knihy ilustrovali či překládali.

Brno Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

Sudičky nejčastěji přály dětem literární dráhu v pásu, který míří právě z východních Čech přes Vysočinu směrem na jih

Sudičky nejčastěji přály dětem literární dráhu v pásu, který míří právě z východních Čech přes Vysočinu směrem na jih | Zdroj: Koláž iROZHLAS

I když se při učení na maturitu může česká literatura zdát být nekonečná, většina z ní vznikla během pouhých dvou životů anebo tří spisovatelských kariér. Lidskou červí dírou, která provrtává náš literární časoprostor z jednoho konce na druhý, byl lyrický básník Adolf Heyduk.

Narodil se v roce 1835, tedy ještě před vydáním Máje a úmrtím Karla Hynka Máchy. Dožil se roku 1923, kdy by mohl coby téměř devadesátiletý kmet požehnat do kolíbky Vladimíru Benediktu Holotovi. Tomu je teď 102 let a za svůj dlouhý život stihl protifašistický odboj, komunistický lágr, tajné vysvěcení na kněze, youtubing a také několik knih; poslední Nechtěl jsem být farářem vyšla v roce 2022.

Netřeba dodávat, že k těmto setkáním nedošlo. Méně hypotetickou zkratku napříč moderní českou literaturou lze vést po literárních současnících. Začátek 21. století takto propojují s Májem tři páry autorů, kteří se mohli potkat u výloh knihkupectví, když tam koukali na svoje knihy.

Omlouváme se, ale alternativní text se nepodařilo vygenerovat. Texty v grafu by měly být čitelné ze zdrojového souboru SVG.

Pro tyto cesty napříč časem sáhl datový tým Českého rozhlasu do dat publikovaných Národní knihovnou, vedle Národní bibliografie především do Databáze národních autorit. V tomto datasetu lze najít víc než milion lidí, kteří knihy psali, ilustrovali, uspořádali nebo třeba doplnili doslovem. Ve zbytku dnešního zastavení se zaměříme na 267 tisíc z nich, které data označují za Čechy či Češky (viz metodologický boxík na konci článku).

Začněme autory a autorkami. Ze školních hodin literatury lze snadno nabýt dojem, že zatímco poezie je polem mladých a rozervaných duší, s přibývajícími lety člověk spíše přesedlá na prózu. Data tuto hypotézu spíš nepotvrzují: střední věk básníků i prozaiků je prakticky stejný, 50 a 52 let. Jak ale dříve ukázala knihovnická data, na prózu z poezie přesedláváme jako čtenáři.

Pohled na tvar sesumírované literární kariéry odhaluje ještě jednu věc: knihy si autoři a autorky nadělují ke kulatinám.

Graf s titulkem „V jakém věku čeští autoři a autorky publikují…“. Další texty by měly být čitelné ze zdrojového souboru SVG.

Okolo Hradce

Další hypotéza vycházející z povinné četby: jsou českým knižním vřídlem východní Čechy? Pocházejí odtud přece bratři Čapkové, Božena Němcová, Alois Jirásek i Josef Škvorecký.

Zde se analýza dat začíná komplikovat: například kvůli porodnicím, které od druhé půlky minulého století kradou rodáky a rodačky menším obcím, kvůli výměně obyvatel v Sudetech, kvůli nejednotným záznamům v databázi autorit (u některých lidí jsou jako rodiště uvedeny bývalé samostatné obce, které jsou dnes součástí velkých měst) či kvůli možnosti, že si u specifických obcí dali knihovníci či wikipedisté záležet na vyplnění svých spolurodáků.

Z různých pohledů na statistiky, kterými jsme se tyto vlivy pokusili odfiltrovat, ale dostáváme podobný obrázek: sudičky nejčastěji přály dětem literární dráhu v pásu, který míří právě z východních Čech přes Vysočinu směrem na jih. Už jsme o něm dříve psali v jiné souvislosti: oblast se nápadně překrývá s Vysočinsko-orlickým pásem štěstí, který se vyznačuje vysokou kvalitou života.

Omlouváme se, ale alternativní text se nepodařilo vygenerovat. Texty v grafu by měly být čitelné ze zdrojového souboru SVG.

„Předně jde historicky o stabilní region s vysokou hustotou obyvatel a o etnicky českou oblast,“ nabízí první vysvětlení literární historička Veronika Faktorová z Ústavu pro českou literaturu Akademie věd. „Zároveň byly východní Čechy prostorem bohatých mezikonfesijních vztahů: žili zde katolíci, evangelíci, židé i skupiny inklinující k sektářství. Tihle lidé tíhli k četbě a vzdělání obecně, i když založeném na biblickém půdorysu.“

Knižní datatýden

Nezvyklý pohled na českou literaturu a knižní produkci obecně přináší datový tým Českého rozhlasu.

Dále Faktorová připomíná, že region měl už od dob Marie Terezie dobrou školskou i kulturní infrastrukturu. „V Hradci Králové byl biskupský seminář, který se od 19. století profiloval česky a vychovával českou elitu. Ne všichni se přitom stávali kněžími a zároveň ti, kteří se jimi stali, často šířili českou kulturu mezi široké vrstvy, cpali lidem české knížky. Ještě zajímavější je Litomyšl, kde bylo Piaristické gymnázium a do roku 1848 také filozofická přípravka, nultý stupeň před univerzitou. Obě instituce se opět profilovaly česky,“ upozorňuje. Tedy další magnet na čtenáře a později i autory.

Poslední východočeská karta: „V devatenáctém století se rozvíjí tisková kultura, nakladatelství schopná tisknout ve velkém. A právě v Hradci Králové fungovala tiskárna Jana Hostivíta Pospíšila, což byl tahoun produkce. Vedle knih, například kuchařek Rettigové nebo Komenského Orbis pictus, vydával i časopis Květy, ve kterém publikovali Tyl nebo Mácha,“ říká Faktorová.

Nejméně českých spisovatelů a spisovatelek se nepřekvapivě rodilo v Sudetech, do roku 1945 převážně německých. Například v Karlových Varech se podle Databáze národních autorit doplněné o data z Wikidat dodnes narodilo méně českých autorů než ve Vídni nebo Bratislavě. Největší obcí, u které v datech nejde dohledat žádného českého spisovatele-rodáka, je s více než osmi tisíci obyvateli Štětí v okresu Litoměřice.

Telefonát z Pelhřimova

Sudičky přály dětem i ledasco dalšího. Obrázek o dějinách 20. století si lze udělat například z toho, jak velká část autorů a autorek měla v různých obdobích za sebou nebo před sebou vězení. Zde si opět pomůžeme údaji z projektu Wikidata, na který Česká národní bibliografie u 197 tisíc lidí odkazuje.

Graf s titulkem „['Co měli čeští autoři za sebou nebo před sebou']“. Další texty by měly být čitelné ze zdrojového souboru SVG.

Od abstraktního spisovatelstva ke konkrétním jménům. Hned nejbanálnější možný žebříček, tedy autorů a autorek, kterým vyšlo nejvíce knih pod unikátními názvy, nám ukáže dva limity takového čistě datového pohledu.

Za prvé, Božena Němcová nenapsala 274 různých knih. To se jen liší tituly různých výborů stejných pohádek i próz pro dospělé vydaných dlouho poté, co její dílo uzavřela smrt ve 42 letech. Za druhé, i když mohou mít lidé v příslušných datových polích uvedenou autorskou roli, neznamená to ještě, že knihu skutečně sami napsali. A právě tato skutečnost dostala na čelo žebříčku Jiřího Vedrala, uvedeného jako autora pestré řádky slovníků, mezi nimiž je Kosovsko-albánsko-český katalog odpadů, Německo-český slovník nádorů nebo Čínsko-český slovník surovin tradiční čínské medicíny.

Omlouváme se, ale alternativní text se nepodařilo vygenerovat. Texty v grafu by měly být čitelné ze zdrojového souboru SVG.

„Nejvhodnější slovo by bylo editor,“ vrací se k více než šesti stovkám knih vydaných v prvních dvou dekádách století sám Vedral. „Dlouho jsem byl ve výkonném výboru Jednoty tlumočníků a překladatelů. Hromada našich členů vytvářela slovníky, já je sbíral a vydával je jako editor. Proto jich je tak obrovské množství,“ vysvětluje. Jsou mezi nimi také interní slovníky vytvořené výzkumnými ústavy, vytvořené na zakázku, nebo nikdy nevydané, které Vedral s kolegy digitalizoval. Je však také skutečným autorem několika cvičebnic chemie a Anglicko-českého slovníku sexu.

V pravém slova smyslu nejproduktivnější spisovatelkou je zřejmě autorka dětských knížek Zuzana Pospíšilová. „V květnu mě Agentura Dobrý den z Pelhřimova ocení jako Rekordmana roku,“ nepřekvapilo jí, že ji kontaktuje redakce serveru iROZHLAS.cz. Jak se dá v díle čítajícím 249 knih vůbec vyznat? „Pravdou je, že když vymýšlím třeba veršované hádanky, naskakují mi verše automaticky, a tak musím vždy kontrolovat v již vydaných knihách, jestli se náhodou neopakuji,“ říká Pospíšilová.

Ne všechny knihy napsal samojediný člověk. Žebříčku nejproduktivnějších autorských dvojic se 156 knihami a velkým náskokem vládnou Petr David a Vladimír Soukup. Přes třicet let společně píší turistické průvodce: začali v roce 1993 Okolím Prahy, posledním je loňský Špalíček výletů. Pro srovnání: ikonické duo Voskovce s Werichem je podepsáno „jen“ pod 35 publikacemi.

Sporné vítězství Čtyřlístku

Ikonická dua nejsou jen autorská; možná ještě známější dvojce jsou ty, z nichž půlka píše a půlka ilustruje. Zde konečně jeden žebříček bez překvapení: zástup slavných dvojic vede Ljuba Štíplová a Jaroslav Němeček, tvůrci Čtyřlístku. Narážíme tu ovšem na další z mnoha limitů podobné analýzy: Čtyřlístky jsou přece časopisy. Jenže v České národní bibliografii mají některé atributy typičtější spíše pro knihy, například jména autorů v údajích o odpovědnosti nebo rozdílné hlavní tituly pro každý díl tamtéž.

Omlouváme se, ale alternativní text se nepodařilo vygenerovat. Texty v grafu by měly být čitelné ze zdrojového souboru SVG.

Podle očekávání vychází i pořadí ilustrátorů a ilustrátorek podle počtu knih, na kterých se podíleli.

Omlouváme se, ale alternativní text se nepodařilo vygenerovat. Texty v grafu by měly být čitelné ze zdrojového souboru SVG.

S nejvíce různými spisovateli a spisovatelkami pak spolupracoval Adolf Born, bylo jich 154. Pravda, někdy šlo jen o spolupráci s rukopisem: Jane Austenová, Miguel de Cervantes nebo Lúkianos byli již pochopitelně dávno po smrti.

Werich dělá to a zas tohle

V posledních letech se stává zvykem dávat větší uznání překladatelům a překladatelkám, například prostřednictvím uvedení jejich jmen přímo na obálce. Nevynecháme je.

Rekordmany jsou zde alespoň papírově germanista Tomáš Butala a anglistka Veronika Volhejnová. První je v datech uveden u 501 knih, z většiny jde o westerny Gerta Ungera. Druhá jako jediná překladatelka v součtu překonala 100 tisíc tiskových stran, mimo jiné sérii o malém poseroutkovi Jeffa Kinneyho. Zdůrazněme ono „alespoň papírově“: jednak u části knih informace o překladu zcela chybí, jednak jde z datasetu opět obtížně stoprocentně vyřadit překlady recyklované, vyjde-li kniha znovu například s mírně odlišným názvem.

Mnohem přesnější obrázek nám data dávají o tom, ze kterých jazyků nejčastěji překládají stejní lidé. Buď to znamená, že jde o jazyky podobné, jako v případě velmi zřetelného shluku jihoslovanských jazyků: srbštiny, chorvatštiny, srbochorvatštiny, bosenštiny a makedonštiny. Nebo to může znamenat, že se na ně lidé často zaměřují zároveň, i když si podobné nejsou: to je případ řečtiny a biblické aramejštiny anebo klasická „čapkovská“ kombinace angličtiny a francouzštiny.

Nakonec poukažme na knižní univerzály, kteří jsou do České národní bibliografie zapsání v nejvíce různých tvůrčích úlohách. Čtrnáct jich posbírali Jan Werich, který pracoval převážně s písmeny (autor, autor předmluvy, autor doslovu, překladatel, editor…) a Karel Svolinský, který zase tíhnul k obrazům (ilustrátor, typograf, litografik, dřevorytec…).

Z čeho a jak jsme počítali

Datový tým Českého rozhlasu vycházel z dat České národní bibliografie a databáze Národních autorit, která v případě potřeby doplňoval daty z dalších platforem jako Wikidata; na využití takovýchto alternativních datasetů v příslušných grafech upozorňujeme.

Základní filtr pro naprostou většinu výpočtů vypadá takto: z národní bibliografie bereme záznamy, které jsou v poli „leader“ označeny jako jazykový materiál (83 % záznamů) a zároveň tam nejsou označeny jako časopy nebo například mapy (zůstává 79 % záznamů). Dále ponecháváme jen záznamy, které mají v poli „008“ kód pro vydání na českém území a v českém jazyce (zůstává 71 %). Knihám s přibližným rokem vydání od-do přiřazujeme náhodný rok, pokud je toto rozmezí do pěti let včetně; v opačném případě je vyřazujeme (zůstává 70 % původního rozsahu národní bibliografie).

Za české autory a autorky považujeme ty, kteří mají v datech o autoritách v poli 370$c řetězec „Česk“. Projdou tedy i hodnoty „České království“ a „Československo“. Lidí náležejících spíše ke slovenské nebo německé kultuře ale ve vyfiltrovaných datech mnoho nenajdeme – jednak jsou v datech lidé tvořící v 19. a 20. století přiřazeni k dnešním státům, a jenak právě kvůli výše uvedeným jazykovým filtrům.

Výpočty lze zkontrolovat na GitHubu, kde v sešitech č. 902 až 906 také dovysvětlujeme některé naše úvahy a postupy při přípravě tohoto seriálu. Pro replikaci výpočtů je nejprve nutné z původních zdrojů stáhnout data a pak je očistit, k tomu slouží skripty 050 až 070. (Mohou běžet až desítky hodin a postahují desítky GB dat.)

Barevnou paletu pro grafy jsme převzali z diagramu fungování kladky v knize Jak s tím pohnu, kterou výtvarně zpracoval František Škoda.

Michal Kašpárek Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

Nejčtenější

Nejnovější články

Aktuální témata

Doporučujeme