Google изучил эволюцию языка за двести лет
Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований.
Фото: Юрий Гречко / Югополис
С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет Lenta.ru со ссылкой на New Scientist.
До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов.
Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.
Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году эта цифра возросла до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов.
Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.
Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, которыми пользуются специалисты по естественным наукам.
Первая полоса
Последние новости
-
Краснодарская стримерша извинилась за оскорбления россиян и военнослужащих 15:16
-
В очереди в «Японский сад» в парке «Краснодар» люди стоят с 5 часов утра (фото) 14:14
-
На Кубани поезд отрезал железнодорожнику ноги, спасти мужчину не удалось 13:31
-
В краснодарском детсаду в постелях воспитанников обнаружили тараканов 12:56
-
1 мая в сочинским парке «Дендрарий» вновь заработает канатная дорога 12:03
-
Берега реки Восточный Дагомыс усеяны тушками погибших рыб и животных 11:15
-
1 мая кубанцы встретят под дождем 10:49
-
Ростовчанина и четверых его подельников обвиняют в поджоге вертолета на аэродроме в Москве 09:54
-
Шашлыки без штрафа: власти Краснодара рассказали, где можно без проблем провести пикник 09:02
-
В Новороссийске целый день бушевал ураганный ветер (фото) 08:21
-
Запуск пригородных поездов Анапа – Темрюк – Анапа отложен 18:00
Комментариев еще нет
Последние обсуждения