Категории

Проза
- Проза
- Историческая проза
- Русская современная проза
- Советская классическая проза
- Повести
- Сентиментальная проза
- Зарубежная классика
- Рассказы
- Зарубежная современная проза
- Эпистолярная проза
- Афоризмы
- Очерки
- Разное
- Эссе
- Магический реализм
- Семейный роман/Семейная сага
- Феерия
- Антисоветская литература
- Новелла
- Русская классическая проза
- Современная проза
- О войне
- Контркультура
- Классическая проза
Любовные романы
- Любовные романы
- Исторические любовные романы
- Зарубежные любовные романы
- Эротика
- Слэш
- love
- Порно
- Роман
- Прочие любовные романы
- Фемслэш
- Остросюжетные любовные романы
- Современные любовные романы
- Короткие любовные романы
- Любовно-фантастические романы
Фантастика и фэнтези
- Социально-философская фантастика
- Социально-философская фантастика
- Социально-философская фантастика
- Детективная фантастика
- Киберпанк
- Попаданцы
- LitRPG
- Космоопера
- Технофэнтези
- Городская фантастика
- Русское фэнтези
- Юмористическая фантастика
- Космическая фантастика
- Разное фэнтези
- Городское фэнтези
- Стимпанк
- Мистика
- Боевое фэнтези
- Книги магов
- Разная фантастика
- Романтическая фантастика
- Эпическая фантастика
- Социально-философская фантастика
- Иностранное фэнтези
- Любовное фэнтези
- Сказочная фантастика
- Историческое фэнтези
- Зарубежная фантастика
- Романтическое фэнтези
- Историческая фантастика
- Ироническая фантастика
- Ироническое фэнтези
- Ужасы и Мистика
- Постапокалипсис
- Героическая фантастика
- Фэнтези
- Научная Фантастика
- Социально-психологическая
- Альтернативная история
- Боевая фантастика
Бизнес
- Личная эффективность
- О бизнесе популярно
- Малый бизнес
- Государственное и муниципальное управление
- Бизнес
- Личные финансы
- Менеджмент и кадры
- Экономика
- Управление, подбор персонала
- Банковское дело
- Ценные бумаги и инвестиции
- Корпоративная культура, бизнес
- Личная эффективность
- Поиск работы
- Интернет-бизнес
- Финансы
- Менеджмент
- Работа с клиентами
- Кадровый менеджмент
- Переговоры
- Краткое содержание
- Продажи
- Делопроизводство, офис
- Бухучет и аудит
- Тайм-менеджмент
- Зарубежная деловая литература
- Ораторское искусство / риторика
Справочная литература
- Энциклопедии
- Прочая справочная литература
- Словари
- Руководства
- Справочники
Приключения
- Путешествия и география
- Исторические приключения
- Прочие приключения
- Природа и животные
- Морские приключения
- Вестерн
- Приключения про индейцев
- Зарубежные приключения
Старинная литература
- Античная литература
- Зарубежная старинная литература
- Мифы. Легенды. Эпос
- Европейская старинная литература
- Древнерусская литература
- Древневосточная литература
- Фольклор
- Прочая старинная литература
Религия и духовность
- Религия: окультизм
- Бизнес
- Религия
- Эзотерика
- Прочая религиозная литература
- Самосовершенствование
- Православие
- Религия: христианство
- Религия: протестантизм
- Язычество, паганизм
- Буддизм
- Индуизм
- Зарубежная религиозная литература и эзотерика
- Религии: разное
- Религия: ислам
- Религия: иудаизм
Компьютеры и Интернет
- Прочая околокомпьтерная литература
- Программы
- Программное обеспечение
- Интернет
- Программирование
- Базы данных
- Компьютерное "железо"
Поэзия, Драматургия
- Драматургия
- Сценарии
- Драма
- Песенная поэзия
- Басни
- Киносценарии
- Кино, театр
- Зарубежная поэзия
- В стихах
- Бизнес
- Театр
- Лирика
- Трагедия
- Экспериментальная поэзия
- Верлибры
- Водевиль
- Мистерия
- Эпическая поэзия
- Поэзия
Детская литература
- Детская фантастика
- Детские остросюжетные
- Детские стихи
- Детские приключения
- Зарубежные детские книги
- Учебная литература
- Школьные учебники
- Детские детективы
- Внеклассное чтение
- Книги для дошкольников
- Детский фольклор
- Загадки
- Книги для подростков
- Детская познавательная и развивающая литература
- Прочая детская литература
- Сказка
- Детская проза
- Детская образовательная литература
Юмор
- Комедия
- Любовные романы
- Любовные романы
- Анекдоты
- Юмористическая проза
- Юмористическое фэнтези
- Юмористические стихи
- Драматургия
- Сатира
- Прочий юмор
Документальные книги
- Бизнес
- Бизнес
- Искусство и Дизайн
- Критика
- Публицистика
- Прочая документальная литература
- Военная документалистика
- Биографии и Мемуары
Научные и научно-популярные книги
- Шпаргалки
- Рефераты
- Экология
- Биофизика
- Культурология
- Юриспруденция
- Политика
- Языкознание
- Психотерапия
- Науки: разное
- Биология
- Медицина
- Научпоп
- Воспитание детей, педагогика
- Психология, личное
- Архитектура
- Образовательная литература
- Филология
- Физика
- Радиотехника
- География
- Деловая литература
- Детская психология
- Литературоведение
- Педагогика
- Альтернативная медицина
- Науки о космосе
- Ботаника
- Иностранные языки
- Государство и право
- Обществознание
- Беременность, ожидание детей
- Химия
- Учебники
- О животных
- Социология
- Математика
- Зарубежная психология
- Астрология
- Ветеринария
- География
- Зоология
- Биохимия
- Зарубежная публицистика
- История Европы
- Транспорт, военная техника
- Религиоведение
- История
- Техническая литература
- Прочая научная литература
- Психология
Разная литература
- Шахматы
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Готические новеллы
- Гиды, путеводители
- Фанфик
- Визуальные искусства
- Военное
- Цитаты из афоризмов
- Истории из жизни
- Кино
- Военная история
- Литература 19 века
- Культура и искусство
- Музыка, музыканты
- Великолепные истории
- Зарубежная образовательная литература
- Современная зарубежная литература
- Отраслевые издания
- Начинающие авторы
- Зарубежная прикладная литература
- Авто и ПДД
- Музыка, танцы
- Изобразительное искусство, фотография
- Спецслужбы
- Недвижимость
- Современная литература
- Боевые искусства
- Подростковая литература
- Шахматы
- Прочее
- Военная техника, оружие
- Газеты и журналы
- Периодические издания
Домоводство, Дом и семья
- Ремонт в квартире
- Здоровье
- Спорт
- Домашние животные
- Кулинария
- Прочее домоводство
- Сад и огород
- Развлечения
- Дом, семья
- Отдых / туризм
- Интерьеры
- Рыбалка
- Охота
- Семейная психология
- Эротика, Секс
- Сделай сам
- Хобби и ремесла
Бизнес
- Маркетинг, PR, реклама
Детективы и Триллеры
- Юридический триллер
- Исторический детектив
- Детектив
- Триллер
- Боевик
- Криминальный детектив
- Полицейский детектив
- Иронический детектив
- Крутой детектив
- Маньяки
- Иностранный детектив
- Политический детектив
- Зарубежные боевики
- Дамский детективный роман
- Классический детектив
- Шпионский детектив
Бизнес
- Торговля
- Тайм-менеджмент
Любовные романы
Биографии
Блог

Меню

Самые читаемые

Выжившая из Ходо. Эльфийский турнир - Ольга Дмитриева

Мессалина. Трагедия императрицы - Ирена Гарда

Правила карьеры. Все, что нужно для служебного роста - Ричард Темплар

Пилот штрафной эскадрильи - Юрий Корчевский

PochitayKnigi » Научные и научно-популярные книги » Языкознание » Прикладное программное обеспечение: системы автоматической обработки текстов - Михаил Мальковский

Прикладное программное обеспечение: системы автоматической обработки текстов - Михаил Мальковский

Читать онлайн Прикладное программное обеспечение: системы автоматической обработки текстов - Михаил Мальковский

Шрифт:

Интервал:

Закладка:

Сделать

1 ... 5 6 7 8 9 10 11 12 13 ... 15

Перейти на страницу:

Также отметим, что описанные методы позволяют автоматически обнаружить ошибку только тогда, когда не удаётся построить связный синтаксический граф для рассматриваемого предложения. Однако ошибки, при которых возможно получение формально приемлемой, но по сути неверной интерпретации, остаются невыявленными. При этом никаких сообщений об ошибках не поступает.

3.2. Система комплексного контроля качества текста ЛИНАР

3.2.1. Функции системы ЛИНАР; сценарии работы с системой

Построение автокорректоров сталкивается с рядом принципиальных и не решенных пока в полном объеме проблем: компактное хранение словарей, эффективные методы морфологического и синтаксического анализа и т.д. Тем не менее на очереди - создание систем, способных производить более сложное по сравнению с автокорректорами автоматическое или автоматизированное редактирование текстов на естественном языке. В идеале же необходима система, выполняющая функции научного редактора - человека, осуществляющего литературную и научную правку научно-технических текстов. Такое направление развития представляет разрабатывавшаяся в 1986-1990 гг. на кафедре алгоритмических языков факультета ВМК МГУ система ЛИНАР (ЛИтературно-НАучный Редактор) - интеллектуальная система комплексного контроля качества и редактирования русскоязычных текстов.

Суть подхода заключалась в существенном расширении возможностей имевшихся в то время автокорректоров за счет:

– ограничения предметной области, к которой относились обрабатываемые тексты (методы, алгоритмы и программы обработки данных телеметрии на многопроцессорных вычислительных комплексах);

– ограничения видов текстов (научно-технические отчеты, деловая переписка);

– использования средств синтаксического и семантического анализа текста;

– привлечения более полных моделей русского языка.

Пользователем ЛИНАР является человек, оценивающий с помощью системы качество некоторого текста с позиций лица, которому адресован этот текст (адресата), и вносящий в текст необходимые исправления. В качестве адресата могут выступать литературный или научный редактор, корректор, потенциальные читатели (конструкторы, программисты, руководители). Пользователем ЛИНАР может быть, например, автор обрабатываемого текста, желающий взглянуть на него "со стороны", или научный руководитель работы, обеспокоенный терминологическими и стилистическими неувязками в текстах разделов, подготовленных различными участниками проекта.

Обработка текста с помощью системы ЛИНАР включает в себя в общем случае несколько циклов (как и при подготовке текста "вручную"), каждый из которых оформляется как самостоятельный сеанс работы с системой. В начале сеанса пользователь формирует задание на обработку текста, для выполнения которого система загружает необходимые информационные модули и вызывает программы контроля текста. Каждая программа проверяет некоторое определенное свойство текста, т.е. реализует одноаспектный контроль текста. Таким образом, в структурном плане систему ЛИНАР можно считать пакетом прикладных программ; сеанс работы с ней состоит из серии одноаспектных проверок текста или его фрагментов.

Основная технологическая схема использования системы ЛИНАР предусматривает, что текст хранится на машинных носителях и обрабатывается программами контроля, формирующими протокол замечаний по тексту (иногда система предлагает свой вариант исправления). Далее пользователь просматривает эти замечания и, если он с ними соглашается, вносит необходимые изменения в текст с помощью текстового редактора. Измененная версия текста может быть объектом обработки в следующем сеансе. В зависимости от объема текста пользователь может выбрать диалоговый или пакетный режим работы с системой. В последнем случае протокол замечаний формируется на внешнем носителе.

Отметим, что используемые в ЛИНАР знания позволяют системе фиксировать различные типы конфликтных ситуаций (и формировать соответствующие замечания). Однако как бы полны ни были знания ЛИНАР, обнаружить все неточности, противоречия, неопределенности система самостоятельно не может. Поэтому часть программ контроля собирает некоторую вспомогательную информацию о тех или иных характеристиках (свойствах) текста, не давая ей оценки.

Например, при написании отдельных фрагментов текста разными авторами для обозначения одной и той же сущности могут быть использованы различные термины, что усложняет понимание текста. Автоматическое обнаружение подобных конфликтов требует привлечения глубоких знаний о понятийном и терминологическом аппарате предметной области, и в ЛИНАР не реализуется. Однако в составе системы имеется программа контроля, которая может сформировать по фрагментам текста списки используемых терминологических словосочетаний. На основе этой информации решить терминологические проблемы человеку будет значительно проще, чем при обработке текста "вручную".

ЛИНАР не только обнаруживает неточности, ошибки, но и может "объяснить" пользователю суть своих замечаний, а также предложить способы устранения ошибок. Так, например, в случае орфографической ошибки система предлагает свой вариант исправления слова, в случае нарушения естественного порядка слов - правильный порядок слов и т.д. Рекомендации системы призваны помочь пользователю в улучшении текста, направляют его деятельность.

3.3.2. База знаний системы

Контроль текста, осуществляемый системой ЛИНАР, основывается на использовании знаний о том, что такое правильный, хороший текст. Совокупность этих знаний называется контролирующими знаниями, или К-знаниями. При формировании К-знаний учитывались результаты лингвистических, психологических работ, исследований по эргономике; принят во внимание опыт редакторов, корректоров, нормоконтролеров.

К-знания должны обеспечить возможность оценки текста с различных сторон:

– соответствие общеязыковым нормам;

– соответствие "внешним" нормам, например, требованиям ГОСТов, регламентирующих форму изложения материала в научно-технических документах;

– сложность восприятия текста потенциальным читателем;

– семантическая корректность текста (соответствие выявляемых в тексте семантических отношений и понятийной модели предметной области).

Часть К-знаний (процедурная составляющая) представлена программами одноаспектного контроля. Каждая программа фиксирует строго определенное свойство текста или строго определенный дефект текста (конфликтную ситуацию). Затем формируется соответствующее диагностическое сообщение, которое, в зависимости от выбранного режима работы, либо сразу предъявляется пользователю, либо включается в протокол замечаний.

Важным компонентом информационного обеспечения системы ЛИНАР является и лингвистическая база знаний, содержащая базовые общие знания о русском языке. Кроме того, ЛИНАР использует тематический словарь и тезаурус предметной области, к которой относятся обрабатываемые тексты, и описания нормативных требований, предъявляемых к текстам. Соответствующие информационные массивы создавались разработчиками системы на основе общеязыковых и предметно-ориентированных словарей и справочников, Государственных стандартов и отраслевых инструкций по оформлению текстовых документов.

База знаний ЛИНАР содержит также заранее формируемый - и пополняемый в ходе эксплуатации системы - банк адресатов: конкретных читателей или определенных однородных групп читателей (конкретный руководитель научно-исследовательского проекта; конкретный представитель руководства организации-заказчика; инженеры, которые будут создавать описываемый программно-аппаратный комплекс и др.). Настройка на адресата производится в начале очередного сеанса работы с ЛИНАР. При такой настройке могут меняться базовые и тематические лингвистические знания (состав словаря, совокупность грамматических правил), степень жесткости требований по соблюдению тех или иных норм и условий.

Чтобы задать эту информацию, следует указать имя одного из известных ЛИНАР адресатов (или идентификатор известной группы адресатов) и выбрать значения дополнительных параметров программ контроля.

С помощью такой настройки удается моделировать процесс восприятия текста разными адресатами и, следовательно, оценивать качество текста с разных точек зрения.

Таким образом, К-знания ЛИНАР (которые служат критерием корректности текста и используются для обнаружения "дефектов" текста - отклонений от требований, предъявляемых К-знаниями) формируются динамически в каждом конкретном сеансе работы с системой и являются комплексными по своей природе. Они включают как процедурные знания об исследуемом аспекте текста (воплощенные в соответствующих программах контроля), так и декларативные знания, фильтруемые и конкретизируемые в начале каждого сеанса.

1 ... 5 6 7 8 9 10 11 12 13 ... 15

Перейти на страницу:

Тут вы можете бесплатно читать книгу Прикладное программное обеспечение: системы автоматической обработки текстов - Михаил Мальковский.

Пожаловаться на ошибку