Сети принесли занятный пост из блога Impure — визуального языка для обработки данных от авторов известного в узких кругах Бестиария. Я тут его бегленько перескажу, а заинтересовавшимся рекомендую почитать оригинал.
Как известно, Уильям наш Шекспир был большой выдумщик и, помимо сонетов и стишков, при случае придумывал новые слова. Термин “придумывал” не совсем точный, т.к. по большей части он калькировал понравившиеся корни из латинского и французского языков, но, так или иначе, ныне ему приписывается авторство более тысячи английских слов, в том числе таких, как “hint”, “manager” или “label”.
Автор поста, некто santiago, собрал из ряда источников список из более 500 таких слов и рассчитал (по числу результатов возвращаемых гуглом) частоту употребления этих слов вообще и в связке с именем Шекспира. На log-log диаграмме результаты выглядят так:

Дальше автор выделил группу наиболее “оторвавшихся от корней” (deracinated — тоже шекспировский термин) слов, т.е. слов, чье происхождение почти не упоминается; и, наоборот, тех, авторство которых наиболее часто (относительно общего числа употреблений) приписывается Шекспиру.
В визуальную программу на Impure, которой это всё обсчитывалось, можно повтыкать тут.



