shkolakz.ru 1 2 ... 8 9

Оглавление


  1. 1234.01.01/ПТ.1234.01

Информационная технология обработки данных. Сканеры и сканирование. 2

Информационная технология обработки данных. Обработка растровых изображений. 8

Информационная технология обработки данных. Обработка фотографий. 13

Информационная технология экспертных систем. Комбинирование растровой графики. 17

Информационная технология обработки данных. Экспертные системы анализа обучения. 20

Информационная технология обработки данных. Самообучающиеся системы. 28

Современные системы программирования. Основы визуального программирования интерфейса. 34

Современные системы программирования. Доступ к функциям Windows API. 47

Итоговое занятие по основным темам дисциплины 58

Информационная технология обработки данных. Сканеры и сканирование.



Код: 1234.01.01/ПТ.1234.01

Продолжительность:

160 мин.

Дисциплина:

Информационные технологии. Юнита № 1.

Предназначено:

Для студентов по направлению информатика и ВТ в соответствии с учебным планом.

Цель:

Знакомство с процессом сканирования.

Результат обучения:

После успешного завершения занятия пользователь должен научиться работать с программой FineReader.

Используемые программы:

Windows 2000,

FineReader 4.0,

Microsoft Paint,

Microsoft Word 2000.

Используемые файлы:

Image1.bmp, Image2.bmp, Image3.bmp, Image4.bmp, Image5.bmp, Image6.bmp, Image7.bmp, Image8.bmp, Pic1.jpg, Pic2.jpg, Pic3.jpg, Pic4.jpg, Pic5.jpg, Pic6,jpg, Pic7.jpg, Pic8.jpg



План занятия:


  1. Работа под руководством преподавателя 130 минут

Знакомство с процессом сканирования

II. Самостоятельная работа 30 минут

Запуск программы:

Предполагается, что требуемые программы уже инсталлированы на диске.

(См. «Инструкцию по установке программы на ПК»)


I. Знакомство с процессом сканирования

Рекомендуемое время

130 минут

Настройка основных параметров сканирования


Один из типовых способов работы состоит в вызове диалогового окна сканера из прикладной программы, например из графического редактора или OCR-системы (программы оптического распознавания символов). В Photoshop сканер вызывается командой File - Import (Файл-Импорт) - Название сканера. При этом открывается диалоговое окно сканера (интерфейс его TWAIN-модуля). Пример такого окна показан на рисунке:




После запуска диалогового окна сканера необходимо открыть крышку сканера, положить на рабочее поле (стекло) оригинал (изображением вниз), закрыть крышку и щелкнуть на кнопку Prescan (Предварительное сканирование) в диало­говом окне. В результате в окне предварительного просмотра появится изобра­жение оригинала, отсканированное с низким разрешением. Это черновой эскиз оригинала. Для окончательного сканирования необходимо выделить область сканирования, то есть участок оригинала, который вам нужен. Для этого с помощью мыши требуется переместить и/или изменить размеры рамки, которая видна на фоне эскиза. Чтобы отсканировать указанную область оригинала при текущих значениях параметров, необходимо щелкнуть на кнопке Scan (Сканировать). В диалоговом окне сканера отображаются размеры изображения в выбранных единицах измерения (пикселах, сантиметрах, миллиметрах или дюймах), а также в килобайтах. В результате отсканиро­ванное изображение будет загружено в новое окно графического редактора. Вы можете обработать его, если необходимо, а затем сохранить в файле графического формата. Однако перед сканированием обычно производят настройку параметров, чтобы получить результат с нужным качеством.


При настройке параметров чаще всего пытаются найти компромисс между каче­ством результирующего изображения, его объемом и временем сканирования. Обычно улучшение качества сопряжено с увеличением объема занимаемой па­мяти и времени. Затраты времени становятся весьма заметными, если требуется отсканировать подряд много оригиналов, например несколько десятков фотогра­фий или страниц журнала. Сканирование с большим запасом разрешения приво­дит к большим затратам памяти и дискового пространства. Например, цветная фотография размером 4х6 дюймов (примерно 10х 15 см) при сканировании с разрешением 600 ppi потребует более 25 Мбайт. Такие большие изображения медленно обрабатываются.

Можно выделить два основных подхода к выбору параметров сканирования.

Первый заключается в том, что качество результата должно определяться в первую очередь характеристиками устройств и материалов вывода (монитор, принтеры различного типа, полиграфическая техника, печать на газетной или мелованной бумаге и т. п.). Согласно этому подходу, не стоит создавать изо­бражение очень высокого качества, если его вывод будет производиться устройствами с низкими характеристиками. Однако при смене типа устрой­ства вывода часто оказывается, что нужно заново сканировать изображение, hq уже при других значениях параметров. Данный подход характерен для офисных работ, но нередко применяется и дизайнерами

Согласно второму подходу, при сканировании следует получить максимально возможную графическую информацию об оригинале, а только затем обработать ее в редакторе применительно к типу устройства вывода. Этот подход применяют, когда заранее не известно, где и как будет использовано изображение. Он типичен в основном для дизайнеров.


Выбор режима сканирования


Существуют следующие режимы сканирования:

Color (Цветной). Цветное изображение, представленное в модели RGB.

Gray или Grayscale (В оттенках серого). Изображения с плавными переходами оттенков серого цвета.


LineArt (Штриховой рисунок). Черно-белое изображение без полутонов.

Halftone (Полутон). Черно-белое изображение, сформированное регулярно расположенными точками различных размеров или штрихами.

В принципе, можно выбрать любой из доступных режимов сканирования независимо от исходного изображения (оригинала). Например, можно сканировать в цветном режиме оригиналы, выполненные в оттенках серого цвета, и, наоборот, цветные оригиналы в режиме оттенков серого. Выбор оптимального режима зависит как от оригинала, так и от вашей цели.

В большинстве практически всех наиболее интересных случаев мы имеем дело с цветными изображениями. Это могут быть фотографии, отдельные иллюстра­ции или целые страницы из журналов, книг и газет, содержащие, кроме карти­нок, тексты. В конце концов, в сканер можно положить лист акварели, холст с масляной живописью или какой-нибудь не очень тяжелый предмет. Если вы хотите получить в результате сканирования цветное изображение, то, очевидно, следует использовать режим Color (Цветной). В этом режиме один пиксел изо­бражения представляется в памяти компьютера посредством 24 бит (8 бит на ка­ждую из трех базовых составляющих цвета).

Если вам нужно получить изображение в оттенках серого (полутоновое) из цвет­ного оригинала, выберите режим Gray. А можно отсканировать его в режиме Color и затем в графическом редакторе преобразовать в полутоновое. Сканирование в режиме Gray требует меньше памяти и происходит быстрее, чем в режиме Color.

Нецветные, но с плавными переходами оттенков серого изображения следует сканировать в режиме Gray. Как правило, это черно-белые фотографии и подоб­ные им нецветные иллюстрации из книг, журналов и газет. Нередко в этом ре­жиме сканируют текстовые документы не очень хорошего качества, чтобы потом обработать их программой OCR.

Черно-белые (двухцветные) изображения без полутоновых переходов обычно сканируются в режиме LineArt. Типичными примерами таких изображений явля­ются чертежи и схемы, в которых преобладают линии, а не области, заполненные цветом. В этом режиме часто сканируют четкие отпечатки текстовых докумен­тов, чтобы потом обработать их программой OCR. Некоторые системы OCR тре­буют, чтобы исходное изображение было отсканировано в режиме LineArt, но к FineReader это не относится. Хотя в режиме LineArt на представление одного пиксела отводится всего 1 бит, сканирование всего изображения в этом режиме обычно требует большого разрешения (около 400 ppi), и таким образом эконо­мия на представлении пиксела нивелируется. Главным образом, именно поэтому вместо режима LineArt часто используют Gray.


Режим Halftone используется нечасто и в основном тогда, когда оригинал имеет довольно заметную печатную растровую структуру или образован множеством штрихов (рисунки и фотографии из газет).


Выбор разрешения сканирования


Сканер, как отмечалось выше, обладает разрешающей способностью, определяемой его конструктивными особенностями. Она может быть аппаратной (оптической) или интерполяционной (реконструированной вычислительными средствами). Разрешающая способность является максимальной характеристикой, определя­емой техническими особенностями сканера. Однако при сканировании изобра­жения вы можете произвольно выбрать, с каким разрешением это следует делать в данном конкретном случае. Установленное разрешение сканирования может быть меньше или равно аппаратному (оптическому) разрешению сканера, но мо­жет и превышать его. В последнем случае речь может идти только об интерполя­ционном разрешении. При установленном интерполяционном разрешении ска­нирования, кроме собственно аппаратных средств, привлекаются программные преобразования. Последние могут быть хорошими или плохими: все зависит от алгоритма преобразования исходного изображения.

От выбора разрешения сканирования зависит качество полученного изображения, занимаемый им объем памяти, а также скорость сканирования. Качество изображения — это, прежде всего, его четкость, плавность цветовых переходов.

Затраты памяти при сканировании изображения размером 4х4 дюйма (11 х 11 см):


Тип

изображения

Объем изображения при различных разрешениях

100 ppi

150 ppi

300 ppi


600 ppi

Color

469Кбайт

1Мбайт

4,12Мбайт

16,5Мбайт

Gray

156Кбайт

352Кбайт

1,37Мбайт

5,5Мбайт

LineArt

19,5Кбайт

44Кбайт

175Кбайт

703Кбайт


Программное обеспечение сканеров обычно позволяет устанавливать параметры тоновой коррекции — яркость, контрастность, гамма и др. (например, уровни черного и белого). Возможность настройки этих параметров до сканирования очень важна.


Сканирование печатных иллюстраций


  1. На диске (например, на E:) \ создайте рабочую папку MyWork. Скопируйте в созданную папку все файлы из директории E:\1234\ПТ_1234_01\.

  2. Запустите приложение FineReader.

  3. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image1.bmp. Нажмите на кнопку Открыть. Это изображение было отсканировано в режиме Gray с разрешением 300 dpi.

  4. Выполните команду Изображение-Повернуть по часовой стрелке.

  5. Выполните команду Вид-Масштаб 50%.

  6. С помощью левой кнопки мыши выделите изображение мобильного телефона. Выполните команду Правка-Копировать.

  7. Вызовите графический редактор Paint. Выполните команду Правка-Вставить. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\1.jpg.
  8. Аналогичным образом получите изображение часов. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\2.jpg.


  9. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image2.bmp. Нажмите на кнопку Открыть. Это изображение было отсканировано в режиме Color с разрешением 300 dpi.

  10. Установите масштаб изображения - 50 %.

  11. Выделите правую часть изображения. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\3.jpg.

  12. Выделите открытые объекты, расположенные в левой части экрана FineReader, и удалите их с помощью клавиши Del. Подтвердите удаление.


Сканирование фотографий


  1. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image3.bmp. Нажмите на кнопку Открыть. Это изображение было отсканировано в режиме Color с разрешением 300 dpi.

  2. Установите масштаб изображения - 50 %.

  3. Выделите верхнюю часть изображения. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\4.jpg.

  4. Выделите нижнюю часть изображения. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\5.jpg.


Сканирование объемных предметов


  1. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image4.bmp. Нажмите на кнопку Открыть. Это изображение было отсканировано в режиме Color с разрешением 300 dpi.

  2. Выделите изображение мобильного телефона. Сохраните изображение в редакторе Paint с именем E:\MyWork\6.jpg.

  3. Выделите изображение часов. Сохраните изображение в редакторе Paint с именем E:\MyWork\7.jpg.

  4. Выделите изображение броши. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\8.jpg.
  5. Выделите открытые объекты, расположенные в левой части экрана FineReader, и удалите их с помощью клавиши Del. Подтвердите удаление.



Сканирование текста


Ввод в компьютер информации из текстовых документов, например из книг, журналов, газет и факсов, — одна из типовых офисных операций. Чтобы ускорить этот процесс, применяют сканеры. Однако результат сканирования — просто графическое изображение. Если вы сохранили его в файле графического формата, то сможете открыть потом лишь в редакторе или программе просмотра графики. Хотя редактировать тексты в графическом редакторе в принципе возможно, на практике никто этого не делает. Текстовая информация вместе с иллюстративной графикой сканируется, чтобы затем передать ее программе оптического распознавания симво­лов (OCR - Optical Character Recognition), например FineReader. С помощью программы OCR результат сканирования будет разде­лен на текст и рисунки (если они есть) и может быть сохранен в файле формата, доступного текстовым редакторам.

Вы можете сначала отсканировать текстовый документ и сохранить результат в файле графического формата, например JPEG или TIFF, а затем открыть его в программе OCR и выполнить распознавание (recognition) символов. Но можно поступить и иначе: выполнить сканирование прямо из программы OCR, а затем произвести распознавание. Мы предпочитаем именно этот путь. Кстати, многие программы OCR позволяют произвести сканирование и распознавание с помо­щью одной команды. Однако в случае, когда вы сканируете много фрагментов, а распознаете лишь некоторые из них, лучше разъединить эти процессы.

Некоторые программы OCR требуют, чтобы текстовый документ был отскани­рован в режиме LineArt. Современные программы OCR не обременят вас этим ограничением.

Если оригинал представляет собой просто текст без графики, то сканировать его следует в режиме LineArt или Gray. Режим LineArt обычно применяют к высококачественным отпечаткам текста без иллюстраций, полученным, например, с помо­щью лазерного или струйного принтера. Разрешение сканирования выбирается в зависимости от размера шрифта. Для шрифтов размером 12 пунктов и менее разрешение в режиме LineArt устанавливают около 400-450 ppi. Для более круп­ных шрифтов разрешение можно уменьшить до 200-300 ppi. В режиме Gray на один пиксел требуется в 8 раз больше памяти, чем в режиме LineArt. Однако при сканировании текстов в этом режиме можно устанавливать меньшее разреше­ние, чем в режиме LineArt, - примерно 150-300 ppi в зависимости от размера и гарнитуры шрифта.


При сканировании документов, содержащих кроме текста картинки, следует выбирать ре­жим Gray (или Color, если требуется получить цветные изображения картинок). В этих режи­мах сканирования удается получить больше графической информации об оригинале, кото­рая важна для высококачественного распознавания символов.

Программа OCR при распознавании текста в графическом изображении использует словари разных языков, что позволяет ей исправлять дефекты сканирова­ния. Тем не менее, ошибки распознавания текста все же остаются. Перед тем как инициировать собственно распознавание, просмотрите результат сканирования.

Прежде всего следует обратить внимание на качество отображения таких букв, как «е» и «с», «к» и «н», «л» и «п», «i» и «|», «r» и «г». Если случаев взаимной замены в перечислен­ных парах букв много, лучше повторить сканирование при большем разрешении. Если ре­зультат распознавания содержит слишком много ошибок, то необходимо повторить про­цедуру сканирования при большем разрешении.

Если вам предстоит сканировать множество страниц с текстовой информацией примерно одинакового качества, целесообразно сначала не спеша правильно по­добрать параметры сканирования. Это можно сделать с помощью экспериментов над небольшим фрагментом документа. Подобрав оптимальные значения пара­метров, можно затем поставить сканирование и распознавание на поток. Про­граммное обеспечение сканеров и OCR обычно имеют специальную команду, за­дающую пакетный режим работы (Buth Mode).


  1. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image5.bmp. Нажмите на кнопку Открыть. Это изображение было отсканировано в режиме LineArt с разрешением 300 dpi.

  2. Выполните команду Изображение-Повернуть по часовой стрелке.

  3. На панели инструментов установите масштаб изображения - Целиком.
  4. Выделите начало раздела 1.2.1. на левой странице и продолжение этого раздела на правой странице.


  5. Выполните команду Сервис-Опции. Выберите вкладку Форматирование. Установите флажок - сохранять начертание букв, шрифт и колонки. Нажмите на кнопку OK.

  6. На панели инструментов установите язык Русско-Английский.

  7. Нажмите на кнопку Распознать.

  8. По окончании распознавания нажмите на кнопку Проверить. Проверьте правописание.

  9. Выполните команду Файл - Передать в - Microsoft Word. Сохраните документ в редакторе Microsoft Word с именем E\MyWork\1.doc.

  10. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image6.bmp. Нажмите на кнопку Открыть. Это изображение было отсканировано в режиме LineArt с разрешением 300 dpi.

  11. Выполните команду Изображение-Повернуть по часовой стрелке.

  12. На панели инструментов установите масштаб изображения - Целиком.

  13. Нажмите на кнопку Сегментировать.

  14. Выделите сегмент 2 и нажмите на клавишу Del.

  15. Выделите сегмент 1 и уменьшите его размер до начала раздела.

  16. Нажмите на кнопку Распознать.

  17. По окончании распознавания нажмите на кнопку Проверить. Проверьте правописание.

  18. Выполните команду Файл - Передать в - Microsoft Word. Сохраните документ в редакторе Microsoft Word с именем E\MyWork\2.doc.

  19. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image6.bmp. Нажмите на кнопку Открыть.

  20. Выделите рисунок. Сохраните полученное изображение в редакторе Paint с именем E:\MyWork\9.jpg. Добавьте рисунок в созданный документ с помощью команды Вставка-Рисунок из файла.
  21. Выделите открытые объекты, расположенные в левой части экрана FineReader, и удалите их с помощью клавиши Del. Подтвердите удаление.


  22. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image7.bmp. Нажмите на кнопку Открыть.

  23. Выполните команду Файл-Открыть. Выберите файл E:\MyWork\image8.bmp. Нажмите на кнопку Открыть.

  24. Выделите открытые объекты, расположенные в левой части экрана FineReader.

  25. Нажмите на кнопку Распознать.

  26. Выделите открытые объекты, расположенные в левой части экрана FineReader.

  27. Выполните команду Файл - Передать в - Microsoft Word. Сохраните документ в редакторе Microsoft Word с именем E\MyWork\3.doc.

  28. Выделите открытые объекты, расположенные в левой части экрана FineReader, и удалите их с помощью клавиши Del. Подтвердите удаление.


II. Самостоятельная работа
            Рекомендуемое время

30 минут

Сформируйте документ Word из изображения в соответствии с вариантом. Созданные рисунки и документы сохраните в рабочей директории.

По окончании работы удалите созданную Вами рабочую директорию.

Варианты
Исходные данные

1

Pic1.jpg, Pic2.jpg

2

Pic3.jpg, Pic4.jpg

3

Pic5.jpg, Pic6.jpg

4

Pic7.jpg, Pic8.jpg




следующая страница >>