Главная страница Случайная лекция Мы поможем в написании ваших работ! Порталы: БиологияВойнаГеографияИнформатикаИскусствоИсторияКультураЛингвистикаМатематикаМедицинаОхрана трудаПолитикаПравоПсихологияРелигияТехникаФизикаФилософияЭкономика Мы поможем в написании ваших работ! |
Системы распознавания символов (OCR - Optical Character Recognition)Офисные системы
Функционирование любой экономической системы сопровождается движением документов между ее подразделениями, как по вертикали, так и по горизонтали. Поэтому делопроизводство является неотъемлемой частью деятельности любого предприятия или учреждения. Для совершенствования делопроизводства используется разнообразное ПО, в том числе: - СУБД, - текстовые редакторы, - системы оптического распознавания образов, - системы распознавания голоса, - электронные словари, системы перевода, - электронные архивы, поисковые системы, - средства комплексной автоматизации работы офиса
Автоматизация работы с документами невозможна без средств ввода их в компьютер. До недавнего времени текстовые документы вводились лишь при помощи клавиатуры, изображения сканировались и хранились в виде файла в графическом формате.
Задача создания технологии компьютерного распознавания речи также далеко не нова. Еще в 60-е гг. был опубликован прогноз, согласно которому уже через 3-5 лет ожидалось появление слушающего компьютера, однако и до настоящего времени не удается полностью отказаться от ввода данных с клавиатуры. Тем не менее определенные успехи на пути создания голосовых технологий все же имеются. В 1996 г. несколько российских и зарубежных фирм ("Агама", "Медиалингва", Intel) представили совместную разработку - голосовую мышь. Это система, имеющая то же назначение, что и обычная мышь, но позволяющая вводить команды голосом. Произнесенные команды распознаются программой JustVoice,в памяти которой содержится несколько сотен слов-команд для различных Windows-приложений. Последовательность действий, задаваемая каждой командой (клавиатурный макрос),определяется пользователем. JustVoice можно настроить так, чтобы произнесенные команды выводились в виде текста, т.е. превратить голосовую мышь в простейший диктофон. Качество распознавания команд составляет 98%. В настоящее время среди известных разработчиков голосовых технологий: Dragon Systems - в 1997г. ей разработана система "Dragon Naturally Speaking", распознающая слитную речь; выполненный фирмой White Computers русский вариант системы - "Горыныч" является первой программой, способной воспринимать до 10 тыс. русских слов.); IBM - технология "ViaVoice" позволяет преобразовать слитную речь в документ (Microsoft) Word со скоростью 140 слов.мин.; точность распознавания составляет 95%.); Kurzweil - пакет "KurzweilVoice" позволяет начитывать текст со скоростью 60 слов/мин., точность распознавания составляет 90%.) Все вышеназванные пакеты относятся к так называемым горизонтальным системам, то есть они не имеют определенной профессиональной ориентации и допускают неограниченное увеличение словаря. Объемы их словарей колеблются от десятков до сотен тысяч слов (для сравнения: Большой англо-русский словарь под ред. Апресяна содержит 250 000 слов, однотомник под ред. Мюллера - 70 000, в обыденной жизни активно используется около 2000). Ясно, что чем больше объем словаря, тем ниже % распознавания, т.е. точность системы. Системы, в которых высокое качество распознавания достигается за счет ограниченного словарного запаса, называются вертикальными. Впервые такие пакеты появились в США, они предназначались для облегчения работы младшего медицинского персонала при составлении протоколов врачебных осмотров. В настоящее время голосовые интерфейсы эффективно применяются в системах, предназначенных для создания документов с узкопрофессиональным содержанием (например, в рентгенологии где произносимый текст процентов на 80 состоит из стандартных формулировок). Создание же голосовой технологии, удовлетворительной по всем критериям: - высокая точность восприятия - высокая скорость речи - неограниченный объем словаря - независимость от диктора - нечувствительность к условиям работы представляет собой задачу, для которой не найдено пока даже принципиального, теоретического решения - это, по-существу, проблема, граничащая с проблемой создания искусственного интеллекта. Фирма SYMANTEC разработала продукты TalkWalks и WinFax, предназначенные для управления голосовой почтой и работы с факсимильными сообщениями. · Продукт рассчитан на использование в офисах небольших фирм и на домашних ПК. · Отслеживает входящие и исходящие звонки и факсы. Обеспечивает переадресацию звонков, автодозвон. Компания SpeechWorks, известная своими разработками в области распознавания речи, представила новую технологию, которая позволяет идентифицировать по голосу человека. Звуковые технологии используются также в некоторых мультимедийных обучающих программах, главным образом, в системах обучения иностранным языкам. В пакетах "Learn to speak English", "Think and Talk" на экране появляется шкала со стрелкой, которая в зависимости от чистоты произношения обучаемого колеблется между позициями "Tourist" и "Native".
Дата добавления: 2014-03-04; просмотров: 362; Нарушение авторских прав Мы поможем в написании ваших работ! |