Google изучил эволюцию языка за двести лет
Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований.
Фото: Юрий Гречко / Югополис
С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет Lenta.ru со ссылкой на New Scientist.
До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов.
Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.
Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году эта цифра возросла до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов.
Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.
Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, которыми пользуются специалисты по естественным наукам.
Первая полоса
Последние новости
-
Убили, расчленили и сожгли: задержаны подозреваемые в расправе над двумя жителями Дона 16:03
-
ГК ТОЧНО вошла в топ-5 всероссийского рейтинга по потребительским качествам ЖК 15:24
-
Российский суд впервые присудил компенсацию за плагиат рилса в Instagram 15:22
-
На Кубани погибла женщина, сбитая машиной на ночной трассе 15:06
-
Жители краснодарской многоэтажки пожаловались на школьника, избивающего собаку 14:35
-
"Тунеядцы, они как черви на нашем теле": томский депутат предложила рассмотреть вопрос о создании трудовых лагерей 13:57
-
На конном заводе в Ставрополье возбудили уголовное дело после огласки ситуации с массовой гибелью животных 13:33
-
Кредиторы будут чаще отказывать в выдаче займов и ссуд? 13:03
-
Росфинмониторинг начал активнее следить за доверенностями на открытие счетов в банках 13:01
-
В аварии в Кореновском районе травмы получил четырехлетний ребенок 12:58
-
"Ъ": МВД хочет сделать обязательным российский флаг на автомобильных номерах 12:34
Комментариев еще нет
Последние обсуждения