*
7

Языковые базы данных

|

Сегодня я хотела поговорить о специальных сайтах, которые по-английски называются Corpus и Concordance, я же по-русски назвала бы их языковыми базами данных.

Корпус- это собрание большого количества текстов разного стиля, объединение их в справочную систему с возможностью поиска.

С помощью корпуса можно получить самую разную информацию, в том числе по поводу частотности употребления лексики. Многие современные словари и учебники составляются именно на основе таких баз данных.

Зачем вам нужен корпус?

Корпус пригодится, если вы хотите проверить сочетаемость слов, если вам нужно подобрать примеры предложений с определенными словами, чтобы посмотреть, как используется какое-то слово.

Начнем с Национального корпуса русского языка.

В нем есть разные разделы, но для нас, конечно, особую ценность представляет Параллельный корпус (английский), т.к., вставив в строку поиска слово на русском или английском языке, мы получим параллельные тексты (русский-английский) из художественных произведений с этим словом.

Вот, например, я поискала слово баклуши, а теперь слово mercantile.

Следующим рассмотрим базу данных исключительно на английском языке. Это BNC (British National Corpus), Британский национальный корпус.

На главной странице вы увидите строку поиска, в которую необходимо вставить интересующее вас слово. В результате откроется страница с 50 примерами предложений, в которых оно встречается.

Например, я решила проверить, а используется ли глагол “recommend” с инфинитивом, т.е., а можно ли сказать “recommend to do”. Вставила в строку поиска “recommend to“, и выяснила, что нельзя. Только “recommend to somebody”.

Вот еще одна база данных, которая состоит из разных корпусов, в том числе и BNC.

Здесь поиск того же “recommend to” дал другие результаты, и выяснилось, что хоть и редко, но “recommend to do” все-таки встречается.

Вот еще интересный Корпус современного американского английского.

Если вы заинтересовались этой темой, то можете перейти по этой ссылке, чтобы посмотреть очень большой список различных языковых баз.

Если вы попробуете что-то новенькое из этого списка, и вам понравится, оставляйте свои комментарии.

Опубликовать в LiveJournal
Опубликовать в Мой Мир
Опубликовать в Одноклассники
Опубликовать в Яндекс

Комментарии

  • Марго Василева:

    Можете ли сделать синтаксический анализ глагола place используя BNC Corpus Query Language”

  • goldi:

    здравствуйте, можно ли найти в НБК фразеологизмы

  • Варя:

    Здравствуйте! Подскажите, пожалуйста, как можно посмотреть в каких жанрах и регистрах литературы чаще употребляются какие либо слова (Британский либо Американский корпус СОСА).

  • Marina:

    Concordance – это не сайт. Это программное обеспечение для обработки текста, например, для определения частотности употребления лексической единицы. Есть и онлайн конкордансы, а есть и оффлайновые, с установкой на компьютер. Concordance и corpus -это вовсе не синонимы.

  • Marina:

    Concordance – это не сайт. Это программное обеспечение для обработки текста, например, для определения частотности употребления лексической единицы. Есть и онлайн конкордансы, а есть и оффлайновые, с установкой на компьютер. Concordance и corpus -это вовсе не синонимы.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Subscribe without commenting

Copyright © 2013-2016 English is Fun! All rights reserved.