Вестник ОмГУ Выпуск Тематика Литература

Вестник Омского университета, 1999, Вып. 1. С.115-119.
© Омский государственный университет, 1999
УДК 51.007:372.8

О содержании вводных уроков спецкурса "Системы обработки текстовой информации"
для классов с углубленным изучением информатики

З.В. Семенова

Омский государственный университет, кафедра МПМ
644077, Омск, пр. Мира, 55-А

Получена 10 января 1999 г.


The contents of the special course "The system of processing of text information" for pupils of classes and schools with advanced level in Computer Science is represented in this article. The contents of introductory lessons is given.

Процесс гуманизации современной Российской школы требует всестороннего учета интересов, наклонностей и способностей подрастающего поколения. Не секрет, что последние несколько лет учащиеся различных возрастов проявляют значительный интерес к информатике. Это обусловило появление школ и классов с профильной подготовкой в этой области. Вместе с тем, объявить о наборе учащихся в класс с углубленным изучением информатики - еще не означает решить все вопросы, касающиеся удовлетворения соответствующих потребностей школьников. Представляется, что такая школа (класс) обязаны предоставить учащимся еще и широкий выбор дополнительных образовательных услуг в этом направлении. Среди них - широкий спектр спецкурсов.

Анализируя информационную составляющую деятельности специалистов различных профилей, неизбежно приходится констатировать, что немалую долю ее составляет работа с текстовой информацией. В этой связи представляется целесообразным особое внимание при формировании знаний, умений и навыков в области информатики учащихся старшего звена обучения уделить теме "Системы обработки текстовой информации", предложив им соответствующий курс по выбору.

Теоретический материал такого курса, рассчитанного на 34 часа, должен включать в себя рассмотрение следующих вопросов:

- классификация средств обработки текстовой информации;

- сравнительная характеристика текстовых редакторов (для рассмотрения можно взять текстовые редакторы систем Turbo-Pascal, FoxPro и (или) встроенные редакторы Norton Commander и системы Turbo-Basic, то есть целесообразно ориентироваться на те программные средства, которые так или иначе рассматриваются в основном курсе);

- cравнительная характеристика текстовых процессоров (например, Лексикон и Word);

- функциональное наполнение и назначение программ синтаксического контроля текста (например, DIACOR или ОРФО);

- перекодировщики текстов;

- редакторы шрифтов;

- основные возможности издательских систем (например, Ventura Publisher);

- создание документов на основе гипертекстовых технологий;

- печатающие устройства.

Следует обратить внимание на то, что теоретический материал по ряду тем достаточно широко освещен в печати. В этой связи представляется целесообразным некоторые теоретические вопросы дать учащимся для самостоятельного изучения, а при необходимости организовать соответствующий семинар, на котором школьники могли бы выступить с короткими сообщениями.

Среди основных организационных форм практической работы школьников должен быть лабораторный практикум. Вместе с тем вся практическая работа учащихся должна быть ориентирована на подготовку рефератов, темы для которых определяются совместно с преподавателями различных дисциплин, или подготовку другой печатной продукции, например школьной или классной газеты.

Одним из менее освещенных в печати теоретических вопросов курса с указанным содержанием является вопрос, касающийся классификации средств обработки текстовой информации. Среди причин этого - то, что на сегодня фактически нет единого подхода, общепризнанной классификации и продолжается процесс ее становления. Вниманию читателей предлагается авторский вариант решения этого вопроса.

Классификация средств обработки текстовой информации (2 часа)

Подготовкой разнообразных документов (текстов) занимаются специалисты различных направлений. Писатель, ученый, инженер, экономист, бухгалтер, учитель и многие другие работники составляют документы различного содержания и вида. Подготовить документы можно, используя пишущую машинку. При этом следует учитывать, что возможности редактирования такого документа минимальные. Можно исправить букву, расставить недостающие знаки препинания. Если же вы пропустили слово или фразу, вам, по-видимому, придется перепечатать весь лист. Делая перепечатку листа, можно снова допустить какие-либо ошибки или опечатки. С появлением персонального компьютера процесс подготовки и редактирования текста значительно изменился. Просматривая текст на экране дисплея, можно исправить допущенные при наборе ошибки и опечатки. При этом вы не рискуете наделать опечаток там, где их не было, как это может случиться при перепечатке текста на пишущей машинке. Разрезая строки, можно осуществлять вставку пропущенных слов и фраз. После этой процедуры вы имеете возможность выровнять текст по левому или по правому краю, отформатировать его по заданному формату. При необходимости можно переносить, копировать и удалять отдельные слова или части текста. Для выделения заголовков, слов или фраз можно использовать различные шрифты. Текст можно вывести на печать, когда процесс редактирования будет закончен. Его можно сохранить во внешней памяти (например на жестком или гибком магнитном диске) и при необходимости вносить в него новые изменения.

Очень часто среди преимуществ подготовки документа с использованием ПЭВМ указывают возможность получения большого количества копий на принтере. Однако хотелось бы заметить, что для этого существует множительная техника. Существуют и многие другие преимущества подготовки документов с использованием ПЭВМ: контекстный поиск и замена подстрок текста; задание произвольных межстрочных промежутков; автоматическая нумерация страниц; набор текста в несколько столбцов; использование операции "откатки" (отказа от нескольких последних операций, произведенных с текстом); проверка правописания и подбор синонимов; построение оглавлений и многое другое.

Эти возможности пользователю ПЭВМ предоставляют различные программы подготовки и редактирования текстов. Программ таких очень много, и их возможности отличны. В этой связи целесообразно говорить о классификации средств обработки текстовой информации.

Системы
обработки
текстовой информациии
--- Текстовые редакторы
--- Текстовые процессоры --- Текстовые процессоры общего назначения
--- Текстовые процессоры специального назначения
--- Специализированные программы обработки текстовой информации
--- Издательские системы

Текстовый редактор - это инструментальное программное средство, предназначенное для создания и редактирования текстов, не содержащих сложных структур (параграфов, глав и др.), и имеющее малое количество функций.

К текстовым редакторам следует отнести редакторы текстов программ (EdLin, EdiProf) и встроенные редакторы. Как правило, текстовый редактор - это реализованная в виде функций в более сложной системе возможность редактирования текстов. Так, например, в оболочке Norton Commander существует функция Edit, допускающая редактирование текста, объемом не более 26480 байтов. Функция Edit реализована в системе PC Tools, в турбо-системах и т.д. Отличительной особенностью текстовых редакторов является ограниченность их возможностей. Как правило, они не предполагают работу с такими регулярными структурами текста, как глава, параграф, абзац. Заметим, что текст программы на каком-либо алгоритмическом языке сам по себе не содержит таких структур. Используют текстовые редакторы чаще всего для набора текста программ или экстренного внесения незначительных изменений в небольшой по объему текст. Простота текстовых редакторов с точки зрения их функционального наполнения обуславливает и простоту работы с ними.

Множество дополнительных функций реализовано в текстовых процессорах. Текстовый процессор - это инструментальное программное средство, предназначенное для создания и редактирования текстов сложной структуры и имеющее широкое функциональное наполнение. Чаще всего различают текстовые процессоры общего и специального назначения. Отличительной особенностью текстовых процессоров является возможность обрабатывать такие регулярные структуры документа, как абзац, параграф, страница и др. В мире существует сотни текстовых процессоров, различных по своему функциональному наполнению. Чем больше функций реализует тот или иной процессор, тем он более сложен для освоения. Среди наиболее распространенных - текстовые процессоры общего назначения: Лексикон, Фотон, Multe-Edit, Xy Write, Microsoft Wоrd, Word Perfect. Проводя сравнительную характеристику текстовых процессоров, оценивают, как правило, следующие их функции: редактирование, форматирование, слияние файлов, настольное издательство, печать и такую характеристику, как быстродействие.

Рассматривая функцию редактирования, особое внимание уделялось таким возможностям, как: максимальное количество окон, наличие команды Undo (откатки); поиск опечаток; использование перекрестных ссылок; обработка структурированных текстов; режим, редактор и язык программирования макрокоманд.

Функция форматирования оценивается в зависимости от наличия следующих возможностей: контроль за висячими заголовками; управление заголовками, многоколонковый набор, задание таблицы стиля.

Под слиянием файлов подразумевается возможность считывания файлов, подготовленных в системах Lotus 1-2-3, dBASE: считывание ASCII- файлов; возможность использования условного оператора и математики; создание табличной формы.

Важнейшими возможностями настольного издательства, которые чаще всего реализованы в текстовых процессорах - это импорт графики, предварительный просмотр страниц, размещение текста вокруг графики, рисование линий или прямоугольников с текстом.

При оценке функции печати рассматривают возможность организации пропорциональной разрядки, постановки документов в очередь на печать, фоновой печати и поддержки языка PostScript.

В нашей стране широкое распространение получил текстовый процессор Лексикон, который реализует такие функции, как: работа с абзацем, фрагментом, страницей; поиск и замена, форматирование, выход в DOS и многие другие.

Среди текстовых процессоров специального назначения следует отметить такие, как Unv Editor (до версии 4,0 этот процессор назывался ChiWriter) и Rt-chk, пригодных для подготовки научных текстов, содержащих математические, физические или химические формулы, допускающие возможность использования до 20-ти различных шрифтов одновременно (для одного документа). Кроме того, они позволяют готовить документы с использованием верхних и нижних индексов, готическими, греческими, латинскими и русскими буквами и специальными знаками, такими как, например, или . Rt-chk имеет встроенный перекодировщик, работающий с 4-мя кодовыми таблицами (Основной, Альтернативной, КОИ-8 и Болгарской). Повысить эффективность и возможности текстового процессора позволяют специализированные программы корректировки документов. Специализированные программы обработки текстовой информации - это программные средства, имеющие узкую специализацию. Среди таких программ следует отметить программы проверки правописания и подбора синонимов, формирования текстов, перекодировщики, программы групповой записи текстов, словарные программы. Многие текстовые процессоры в качестве функций содержат некоторые из таких программ. Однако, как правило, возможности встроенных программ ограничены по сравнению со специализированными. В качестве примера рассмотрим возможность орфографического контроля текста (иногда такие программы называют спеллерами - от английского слова speller).

Текстовый процессор Лексикон реализует функцию орфографического контроля. Однако словарь последней некоммерческой версии 6,67 содержит около 15 тысяч слов. Самой популярной специализированной программой по проверке правописания русских текстов является программа ОРФО. Словарь этой программы (V3.0) содержит 220 тыс. лексем (около 3.5 миллионов форм слов). Программа обладает уникальным словарем синонимов в 30 тыс. слов и выражений. В ОРФО реализованы такие функции, как поиск ошибок согласования слов в предложении по роду, числу и падежу; поиск нарушения правил пунктуации и неправильного использования заглавных и строчных букв; поддержка работы манипулятора "мышь". Программа является резидентной и совместимой со многими текстовыми процессорами (в том числе с Microsoft Word, Word Perfect, Multi-Edit, Лексикон).

Программы формирования текстов помогают составить (задать) общий вид документа. Кроме того многие из них могут сжать или расширить весь текст или его часть, а также, что делает документ более читаемым; при необходимости осуществить динамическое копирование заголовков (при сжатии или расширении одного из них соответственно изменяются и все другие). Некоторые программы формирования текстов содержат образцы форм текста; глоссарий; спеллер; поддерживают сортировку заголовков и сбор примечаний под одним заголовком. Программы могут загружаться в компьютер резидентно, автономно или совместно с текстовым процессором, базой данных или электронными таблицами. Среди наиболее распространенных: Grand Viwe (Symantek), Max-89, PC-Outline (Broun Bag Software).

Проблема совместимости текстовых процессоров в некоторых случаях может быть решена с помощью так называемых перекодировщиков текста или программ преобразования файлов. Среди наиболее распространенных - перекодировщик CONV, позволяющий достичь совместимости текстов, написанных в системах, использующих три различных вида кодовых таблиц (Основную, Альтернативную и Болгарскую). Другой перекодировщик с таким же названием работает с Альтернативной кодовой таблицей и старым вариантом КОИ-8. Тем самым он обеспечивает совместимость текстовых процессоров компьютеров IBM PС и Yamaha, последний из которых используется в некоторых высших педагогических учебных заведениях и школах (более подробно о перекодировщиках в следующих уроках). Кроме того существуют программы, обеспечивающие преобразование файлов, подготовленных на одном и том же типе техники, но с использованием различных процессоров текстов. Так, например, программа Software Bridge (V.3.11) обеспечивает преобразование форматов файлов между 19 текстовыми процессорами (в том числе Word Perfect, Microsoft Word). Эта программа позволяет изменять подстрочные примечания, шрифты. А программа Word Transformer (V.4.01) преобразует файлы в формат ASCII, поддерживает 18 наиболее распространенных текстовых процессоров (в том числе Microsoft Word, Xy Write, Word Perfect).

Огромную помощь в подготовке документа, над которым одновременно работают несколько авторов, могут оказать программы групповой записи текстов. Они позволяют вносить поправки и комментарии в документ, не уничтожая оригинала. Некоторые из этой группы программ позволяют сравнить два текста и выделить в них, например цветом, отличные части. Другие - используют различные шрифты для изменений, вносимых в текст. Одной из наиболее популярных программ групповой записи текстов является программа ForComment, разработанная фирмой Braderbund. С документом могут работать до 15 соавторов. Внесения изменения помечаются именем соавтора и датируются. Однако вносить поправки в оригинал может только редактор. Программа позволяет хранить до 26 вариантов документа и до 15 замечаний или комментариев к каждой строке.

Словарные программы ориентированы на использование специалистами различных отраслей знаний и содержат определение слов и фраз. Многие из них могут: содержать перекрестные ссылки; отыскивать синонимы; давать множество определений для слов, имеющих более одного значения; проверять правильность написания слов. В качестве примера можно привести программу Stedmans Medical Dictionary, которая является медицинским словарем на 68 тыс. терминов. Программа Chace Wards позволяет дать определение 80 тыс. слов (в том числе и из "Краткого словаря по электронике издательства Webster") и 40 тыс. синонимов. Все эти программы позволяют наиболее профессионально редактировать различные документы. Однако для подготовки такой печатной продукции, как книги, журналы, рекламные буклеты, в большей степени подходят издательские системы. Чаще всего они позволяют работать в режиме WYSIWYG (What You See Is What You Get - что Вы видите, то и получаете). Имея менее низкие показатели при наборе текста по сравнению со многими текстовыми процессорами, они располагают уникальными возможностями по их верстке. Среди наиболее типичных следующие возможности: загрузить текстовый или графический файл; осуществить элементарную корректировку текста; выделить участки текста иным шрифтом; осуществить многоколонковый набор; воспользоваться графическими примитивами (линия, прямоугольник, круг, окружность, закрашенный прямоугольник и др.); наложить объекты друг на друга; создать стилевой файл или новый шрифт; задать полиграфические параметры каждого абзаца и многое другое. Кроме того, издательские системы ориентированы на использование лазерных принтеров или фотонаборных автоматов. Среди наиболее распространенных - издательские системы Page Maker, Ventura Publisher, Legend, The Office Publisher.

В заключение следует заметить, что предложенный материал должен стать не только частью содержания спецкурса "Системы обработки текстовой информации" для классов с углубленным изучением информатики, но и может органично войти в содержание профильного курса информатики для школ и классов гуманитарного направления.


Литература

[1] Персональный компьютер для всех: В 4-х кн. Кн. 2. Подготовка и   редактирование документов: Практ. пособие для вузов / А.Я. Савельев, Б.А. Сазонов, С.Э. Лукьянов; Под ред. А.Я. Савельева. М.: Высш. шк., 1991.   207 с.
[2] Современные текстовые процессоры и 38 программ для эффективного редактирования // КомпьютерПресс. 1989. N 2.
[3] Каптелининин В., Дроздова Т. Опыт обучения работе с текстовыми редакторами // ИНФО. 1990. N 4.
[4] Русаков С.В., Семакин И.Г. Базовый курс ОИВТ: "Пермская версия" (часть 3) // ИНФО. 1994. N 6.
[5] Зуев Е.А. Расширяемый текстовый процессор Multi-Edit. М.: ЮНИТИ, Компьютер, 1994. 400 с.
[6] Фигурнов В.Э. IBM PC для пользователя: Изд. 3-е, испр. и доп. Уфа: Партнерская компания "Дегтярев и сын", НПО "Информатика и компьютеры", 1993. 300 с.