Студопедия
rus | ua | other

Home Random lecture






Корпусы в сети Интернет


Date: 2015-10-07; view: 542.


British National Corpus http://www.natcorp.ox.ac.uk/

v Большой представительный корпус британского английского языка

v По его образцу создавались многие современные корпуса различных языков.

v Включает метатекстовую и частеречную разметку, характеризуется использованием полных текстов и наличием подкорпуса устной речи.

v Объем корпуса – свыше 100 млн. словоупотреблений.

Нац корп русского языка http://www.ruscorpora.ru/

Включает следующие подкорпуса:

¢ основной корпус, в который входят прозаические (включая драматургию) письменные тексты XVIII — начала XXI века;

¢ синтаксический (глубоко аннотированный) корпус, в котором для каждого предложения построена полная морфологическая и синтаксическая структура (дерево зависимостей);

¢ газетный корпус (корпус современных СМИ), в котором представлены статьи из средств массовой информации 1990-2000-х годов;

¢ параллельные корпуса, в которых можно найти все переводы для определенного слова или словосочетания на русский язык или с русского языка. В настоящее время для поиска доступны англо-русский, русско-английский, немецко-русский, украинско-русский, русско-украинский, белорусско-русский, русско-белорусский и многоязычный параллельные корпуса;

¢ корпус диалектных текстов, включающий запись диалектной речи различных регионов России с сохранением их грамматической специфики; предусмотрен специальный поиск с учётом диалектной морфологии;

¢ корпус поэтических текстов, в котором возможен поиск не только по лексическим и грамматическим, но и по специфическим для стиха признакам (поиск определённого сочетания в сонетах, в эпиграммах, в стихотворениях, написанных амфибрахием, с определённым типом рифмовки и т. п.);

¢ обучающий корпус русского языка — корпус со снятой омонимией, разметка которого ориентирована на школьную программу русского языка;

¢ корпус устной речи

Объем корпуса – свыше 300 млн. словоупотреблений.


<== previous lecture | next lecture ==>
Обсуждение лекции | Cambridge International Corpus
lektsiopedia.org - 2013 год. | Page generation: 0.304 s.