|
Корпусы в сети ИнтернетDate: 2015-10-07; view: 542. British National Corpus http://www.natcorp.ox.ac.uk/ v Большой представительный корпус британского английского языка v По его образцу создавались многие современные корпуса различных языков. v Включает метатекстовую и частеречную разметку, характеризуется использованием полных текстов и наличием подкорпуса устной речи. v Объем корпуса – свыше 100 млн. словоупотреблений. Нац корп русского языка http://www.ruscorpora.ru/ Включает следующие подкорпуса: ¢ основной корпус, в который входят прозаические (включая драматургию) письменные тексты XVIII — начала XXI века; ¢ синтаксический (глубоко аннотированный) корпус, в котором для каждого предложения построена полная морфологическая и синтаксическая структура (дерево зависимостей); ¢ газетный корпус (корпус современных СМИ), в котором представлены статьи из средств массовой информации 1990-2000-х годов; ¢ параллельные корпуса, в которых можно найти все переводы для определенного слова или словосочетания на русский язык или с русского языка. В настоящее время для поиска доступны англо-русский, русско-английский, немецко-русский, украинско-русский, русско-украинский, белорусско-русский, русско-белорусский и многоязычный параллельные корпуса; ¢ корпус диалектных текстов, включающий запись диалектной речи различных регионов России с сохранением их грамматической специфики; предусмотрен специальный поиск с учётом диалектной морфологии; ¢ корпус поэтических текстов, в котором возможен поиск не только по лексическим и грамматическим, но и по специфическим для стиха признакам (поиск определённого сочетания в сонетах, в эпиграммах, в стихотворениях, написанных амфибрахием, с определённым типом рифмовки и т. п.); ¢ обучающий корпус русского языка — корпус со снятой омонимией, разметка которого ориентирована на школьную программу русского языка; ¢ корпус устной речи Объем корпуса – свыше 300 млн. словоупотреблений.
|