pátek 30. září 2011

Blbůstka s potenciálem, co potěší přemýšlivé hračičky

Ngram Viewer je projekt Googlu, za kterým stojí jednoduchá myšlenka. Na Google Books jsou miliony knih, proč je neprojet OCR procedurou, nepřevést na text a neindexovat každé slovo, takže bude možné udělat fantastické statistiky? Jinými slovy tento projekt nabízí každému možnost instantně vytvořit graf s poměrným zastoupením jakéhokoliv slova v rámci knih publikovaných v určitém roce. Databáze je poměrně reprezentativní, nabízí přes pět miliónů knih, což je asi desetina všech knih kdy vydaných (většina z nich je v angličtině, takže vzorek v tomto jazyce bude ještě více vypovídající).

Ačkoliv mohou být tyto statistiky poněkud zavádějící, určitou vypovídající hodnotu mají. Popravdě řečeno právě naopak, jedna z úžasných věcí, které si člověk může vyzkoušet je vytvoření nějaké zajímavé manipulativní statistiky.
Třeba tahle statistika může být jasně čtena jako mizení pojmu Boha z kultury, ale ve skutečnosti jede především o změnu poměru náboženské a světské literatury během posledních 4 století.

S pomocí této stránky si můžete lehce ověřit, jak moc jsou propíráni v literatuře vaši oblíbení papežové nebo spisovatelé (další z mnoha možných způsobů manipulace - u Waugha vidíte, že Evelyn zřejmě nebyl jediný slavný nositel tohoto jména):

Nebo se můžete ujistit, že Elvis není mrtvý.
K debatě o převládajících narativech dnešní doby přikládám tento graf. Ten může být ještě ošidnější než hledání jmen, poněvadž vyjadřovací prostředky se proměňují a obecné pojmy mohou být často nahrazovaný módnějším synonymem, ale přesto podle mne tento graf promlouvá o posunu myšlení člověka 20. století.

A hrbaté 20. století má i poslední slovo:

Žádné komentáře:

Okomentovat