|
Cambridge International CorpusDate: 2015-10-07; view: 573. The Bank of English (Cobuild Corpora) Международный корпус английского языка v Отражает словоупотребление в различных вариантах английского языка (Австралия, Великобритания, Гонконг, Индия, Ирландия, Канада, Кения, Малайзия, Новая Зеландия, Сингапур, США, Танзания, Филиппины, Шри-Ланка, Южная Африка, Ямайка). v Каждый подкорпус включает письменные тексты разных типов и записи устной речи. v В настоящее время полностью подготовлен Британский компонент корпуса (ICE-GB), его тексты снабжены морфологической и синтаксической разметкой. v Предполагается дополнить записи устной речи аудиозаписями. v Объем каждого национального подкорпуса–1 млн. словоупотреблений.
v Постоянно пополняемый корпус английского языка, характеризующийся очень большим объемом (524 млн. словоупотреблений). v В состав корпуса входят различные типы письменных текстов и устной речи. v Корпус включает метатекстовую разметку, а также частеречную с элементами морфологической разметку. v В общедоступной версии корпуса существует возможность выбора подкорпуса: британские книги, газеты, журналы, радиопередачи и др. ¢ Cоздавался как база для составления учебных материалов и словарей английского языка. ¢ Он представляет собой очень большую коллекцию текстов, в которую вошли британские тексты разных типов (500 млн. словоупотреблений), американские тексты разных типов (237 млн. словоупотреблений), записи устной речи носителей британского (18 млн.) и американского (22 млн.) вариантов английского языка. Отдельный подкорпус (Cambridge Learner Corpus, 20 млн. словоупотреблений) образуют тексты экзаменационных работ студентов из разных стран, изучающих английский язык в качестве иностранного. ¢ Корпус постоянно пополняется новыми текстами. ¢ Свыше 700 млн. словоупотреблений. ¢ На настоящий момент к корпусу имеют доступ только авторы, работающие над книгами для издательства Cambridge University Press.
|