Средства и
технологии обработки текстовой информации: аппаратные и программные средства. Создание гипертекстовых информационных
моделей.
Аппаратные средства.
§ Клавиатура – основное устройство для ввода текста, для управления текстовым редактором (ТР). При работе с ТР задействованы все группы клавиш: символьные, функциональные, управляющие, переключения режимов, перемещения курсора и др.
§
Дисплей. Любое изображение на экране
получается из совокупности светящихся точек – пикселей. Символы текста
формируются не из непрерывных линий, а из отдельных точек. ОС MS-DOS и все ее приложения различают два
режима работы дисплея: символьный и графический. Все текстовые редакторы,
работающие под DOS,
используют символьный режим экрана. В этом режиме на экране строго
определены позиции и размеры выводимых символов. Можно говорить о том, что экран разделен на клетки,
выстроенные в строки и столбцы, подобно тетрадному листу в клетку. Каждая такая
клетка экрана – знакоместо для одного символа. ТР, ориентированные на символьный
режим экрана, не позволяют изменять размеры символов, использовать различные
типы шрифтов. Существует один стандартный шрифт. ОС Windows и все ее
приложения работают с дисплеем только в графическом режиме, т.е. при выводе на
экран текста отсутствуют понятия: фиксированное знакоместо, стандартный размер
символов, стандартный тип шрифта. Символы
могут выводиться на экран в разных позициях, разных размеров и форм. Однако
дискретная пиксельная структура экрана остается.
§
Память ЭВМ. При работе над текстовым
документом задействована как внутренняя (оперативная), так и внешняя память
компьютера. Сам ТР как и все ПО ПК хранится на магнитном диске. Запуск ТР
происходит путем переписывания содержимого файла с программой редактора в
оперативную память и инициализации его выполнения. В течение всей работы
программа ТР занимает определенную часть памяти. Память освобождается только
после выхода, закрытия ТР. Вводимый пользователем текст заносится в специально
отведенную для этого область оперативной памяти – рабочую область ТР. Еще один раздел оперативной памяти занимает буфер для копирования фрагментов текста.
В него попадают фрагменты, с которыми выполняются команды ВЫРЕЗАТЬ, КОПИРОВАТЬ.
Буфер хранит лишь один занесенный в него фрагмент. При выполнении вставки фрагмента
в текст содержимое буфера сохраняется. При копировании следующего фрагмента предыдущий
из буфера удаляется. Сохранение текста, сформированного в рабочей области
оперативной памяти, ведет к созданию файла
документа на магнитном диске. Пользователю предоставляется возможность
указать место сохранения файла на диске (имя диска, каталог) и задать имя
файла. Некоторые ТР присваивают таким файлам стандартные расширения. Это характерно
для всех приложений Windows.
Например, MS Word создает файлы с расширением .doc. Текст сохраненного на диске
документа может быть снова вызван в рабочую область ТР при выполнении команды
ОТКРЫТЬ. Для поиска в тексте грамматических ошибок на магнитном диске хранится файл с
орфографическим словарем. Справочник по работе с ТР также постоянно хранится на
магнитном диске. Вывод документа на печать происходит путем заполнения буфера принтера, а затем из буфера текст
переносится на бумагу.
Классификация
инструментальных программных средств обработки текстовой информации
· текстовые редакторы (предназначены для создания, редактирования и обработки текстовой информации, не содержащей сложных структур. Это как правило программа встроенная в мощную систему: встроенные редакторы Паскаля, Нортона и т.п.);
· текстовые процессоры (средства
для набора и редактирования текстовой информации, позволяющие оперировать
сложными структурными средствами: абзацем, главой, страницей и т.д.):
- общего назначения (Word, WordPad, Work и др.);
- специального
назначения (поддержка ввода
математических, химических символов и т.д.);
· издательские системы (инструментальные
средства, предназначенные для подготовки рекламных буклетов, макетов журналов
или книг и т.д.
Они мало ориентированы на редактирование,
текст подготавливается в текстовом редакторе, изображение – в графическом, а
издательская система позволяет эту информацию скомбинировать в нужном виде.
Пример: издательская система PageMaker);
· специализированные программы
обработки текстов:
- перекодировщики;
- программы
стилистического, орфографического, грамматического контроля текста;
- словари (например,
для подбора синонимов);
- переводчики.
Основные функции текстового редактора – ввод текста в память компьютера, его редактирование, сохранение на внешнем носителе и его печать на бумаге.
Среда текстового редактора. Общими элементами среды любого ТР являются:
§ рабочее поле – пространство на экране, на котором отображается текст;
§ курсор – место активного воздействия на рабочее поле (отмечается знаком _ или █ );
§ строка состояния – содержит информацию о текущем состоянии ТР;
§ строка меню – содержит команды переключения режимов работы ТР и др. действий;
§ линейки прокрутки;
§ панель инструментов и др.
Режимы работы ТР.
1. Ввод и редактирование текста. Состояние ТР, находящегося в этом режиме, отражается в строке состояний. Основные компоненты состояния:
- координаты курсора,
- вставка/удаление,
- строчные/заглавные,
- шрифт,
- разметка строки (абзац, длина строки),
- выравнивание по краям, перенос.
2. Форматирование. Работа в этом режиме позволяет скомпоновать текст в требуемом виде, установив размеры полей, красную строку, число позиций в строке и т.д.
3. Обращение за подсказкой. При переходе в этот режим на экране открывается дополнительное окно, содержащее краткую справочную информацию о работе ТР.
4. Орфографическая проверка. Этот режим работы возможен лишь при наличии словаря. При проверке текста фиксируются слова, отсутствующие в словаре, что является косвенным свидетельством орфографической ошибки.
5. Обмен с ВЗУ возможен в двух направлениях: сохранение и загрузка текста, который при сохранении на ВЗУ называется текстовым файлом.
6. Печать. В этом режиме осуществляется вывод текста на бумагу.
Система команд ТР.
Систему команд ТР можно условно разделить на следующие группы команд:
§ команды интерфейса – вход в меню и выход из него, перемещение маркера по меню, выбор нужного пункта меню;
§ команды изменения состояния ТР, позволяющие в режиме редактирования выбрать шрифт, строчные/заглавные буквы, режим вставки/замены и т.д.
§ команды перемещения по тексту, которые разделяются на две группы: пошаговое перемещение (стрелки вправо, влево, вверх, вниз); быстрое перемещение по тексту (переход в начало/конец строки, начало/конец текста, листание страниц и т.д.);
§ команды посимвольного редактирования, позволяющие внести исправления в текст (вставить/удалить/заменить символ, заменить строчную букву на заглавную и т.д.);
§ команды работы со строками, позволяющие манипулировать со строками (удалить, вставить пустую и т.д.);
§ копирование включает в себя выделение копируемого фрагмента текста и помещение его в буфер, воспроизведение содержимого буфера в требуемом месте текста;
§ форматирование позволяет придать тексту требуемый вид: выровнять правый край, выделить поля и красную строку и т.д.
В большинстве ТР команды исполнителя реализуются двумя способами: с помощью функциональных, управляющих и прочих клавиш специального назначения; выбором соответствующего пункта меню.
Данные. ТР работает с символьной информацией, в которой можно выделить следующие виды структур: символы, слова, строки символов, фрагменты текста (блоки), файлы.
В системе команд имеются команды работы с каждой из этих структур как с единым целым.
Символ – минимальный объект, подлежащий обработке ТР. С символами оперируют в основном при вводе текстов и при их посимвольном редактировании.
Слово – набор символов, ограниченный слева и справа пробелами или знаками препинания; используется в командах быстрого перемещения по тексту, удаления фрагментов текста.
Строка символов – данные, занимающие в тексте одну строку, размеры которой могут быть четко очерчены форматированием.
Фрагмент текста – набор последовательных строк, с которым можно работать как с единым целым (удалять, перемещать, копировать и т.д.)
Понятие файла связано с хранением, считыванием и записью информации на магнитный диск.
Создание гипертекстовых информационных моделей средствами MS Word
В последнее время все большую популярность среди широкого круга пользователей завоевывает текстовый процессор MS Word. Word - это многофункциональная программа обработки текстов, настольная издательская система. Ее предназначение:
· набор, редактирование, верстка текстов и таблиц;
· управление всеми пунктами меню, опциями и командами с помощью мыши;
· просмотр на дисплее готового к печати документа без затраты бумаги на дополнительную распечатку;
· вставка рисунков и слайдов;
· заготовка бланков, писем и др. документов;
· обмен информацией с другими программами;
· проверка орфографии и поиск синонимов.
Гипертекст – текст, содержащий в себе связи с другими текстами, графической, видео- или звуковой информацией. Гипертекст позволяет структурировать документ путем выделения в нем слов-ссылок (гиперссылок). При активизации гиперссылки происходит переход на фрагмент текста, заданный в ссылке.
В качестве примера гипертекстового документа создадим текст, содержащий гиперссылки на закладки, которые в свою очередь, являются гиперссылками на начало текста.
1. Создать документ, содержащий обычный текст. Для создания закладки выделить фрагмент текста, которому следует назначить закладку. Выполнить команду Вставка – Закладка. В поле Имя закладки ввести имя закладки, которое должно начинаться с буквы. Щелкнуть по кнопке Добавить.
2. Для
создания гиперссылки выделить фрагмент текста, который будет указателем гиперссылки.
Выполнить команду Вставка – Гиперссылка. На диалоговой панели Вставка гиперссылки в окне выбрать имя
закладки. Щелкнуть по кнопке OK.
В качестве
указателей ссылок и закладок могут использоваться не только фрагменты текста,
но и графические изображения, поэтому такие структуры иногда называют гипермедиа.
Для создание Web-сайта с помощью Word необходимо сохранить набранный документ как веб-страницу (Меню Файл – Сохранить как веб-страницу…)