Методы систематизации документов. Образовательный порта мкпт - поиск и систематизация информации

ЛЕКЦИЯ № 10.

ТЕМА: «ТЕХНОЛОГИЯ ХРАНЕНИЯ, ПОИСКА И СОРТИРОВКИ ИНФОРМАЦИИ»

Кто владеет информацией, тот владеет миром. В каком виде может храниться информация, чтобы с ней было удобно работать? Потребность систематизировать, обрабатывать и хранить информацию возникла у человека очень давно. Как это ни парадоксально, но может быть и появление письменности во многом обязано стремлению человека удовлетворить эту потребность.

Появление электронных компьютеров с хранимыми программами произвело настоящую революцию в области обработки информации. Дальнейшее развитие технологии обработки информации напрямую связано с успехами в области совершенствования программ и собственно компьютеров. В XX веке человечество стало свидетелœем информационного взрыва. Количество информации, которую получает человек, удваивается каждые десять лет. В случае если раньше систематизировались в основном только текстовые и числовые данные, то теперь стало необходимым обрабатывать практически всю информацию, которая доступна органам чувств человека. Последние достижения компьютерных технологий, включая развитие средств коммуникаций, позволяют решить эту задачу.

При этом появилась новая проблема. Оказывается сегодня не так уж сложно организовать хранение и накопление информации в электронном виде. Даже можно организовать доступ к электронному архиву, находящемуся в любой точке земного шара, используя достижения Internet-технологий. Реальной проблемой становится организация огромных архивов данных так, чтобы люди могли легко и быстро находить нужную им информацию.

Информационная система (ИС) - ϶ᴛᴏ программно-аппаратный комплекс, функции которого состоят в надежном хранении информации, предоставлении пользователю удобного интерфейса и, что особенно важно, выполнении специфических операций по преобразованию и поиску крайне важной информации.

Информационная система позволяет облегчить труд человека, повысить качество и достоверность обработки информации. Она может храниться как в «бумажном» варианте, так и в памяти компьютера. Основу информационной системы составляют хранящиеся в ней данные. Хорошая информационная система должна предоставлять достоверную информацию в определœенное время конкретному лицу с ограниченными затратами.

Объектом принято называть элемент информационной системы, информация о котором сохраняется в ней. Объект может быть реальным (человек, населœенный пункт, какой-либо предмет) и абстрактным (событие, счет покупателя). Каждый объект обладает набором свойств, которые запоминаются в информационной системе. Свойства, характеризующие объект, называются атрибутами объекта. Каждый атрибут имеет свое имя – идентификатор. Атрибут, записанный на каком-либо носителœе информации, называют элементом данных, полем данных или просто полем . При обработке данных часто встречаются однотипные объекты с одинаковыми свойствами. Совокупность объектов, обладающих одинаковым набором свойств, принято называть классом объектов .

Основой многих информационных систем (прежде всœего, информационно-справочных систем) являются базы данных.

База данных (БД) – организованная совокупность данных, предназначенная для длительного хранения во внешней памяти ЭВМ, постоянного обновления и использования.

В большинстве случаев базу данных можно рассматривать как информационную модель некоторой реальной системы, к примеру книжного фонда библиотеки, кадрового состава предприятия, учебного процесса в вузе и т.д. Такую систему называют предметной областью базы данных и информационной системы, в которую она входит. Один из признаков, по которому можно классифицировать базы данных, – характер хранимой информации. ФактографическиеБД содержат данные, представляемые в краткой форме и строго фиксированных форматах. Такие БД являются аналогами бумажных картотек, к примеру, библиотечного каталога или каталога видеотеки. Другой тип баз данных -документальные БД. Здесь аналогом являются архивы документов, к примеру, архив судебных дел, архив исторических документов и пр. В дальнейшем будем рассматривать лишь фактографические БД.

Классификация по способу хранения данных делит БД на централизованные и распределœенные. Вся информация в централизованной БД хранится на одном компьютере. Это может быть автономный ПК или сервер сети, к которому имеют доступ пользователи-клиенты.Распределœенные БД используются в локальных и глобальных компьютерных сетях. В последнем случае разные части базы данных хранятся на разных компьютерах.

Набор принципов, которые определяют организацию логической структуры хранения данных в базе, получив название модели данных. Модели баз данных определяются тремя компонентами:

Ø возможной организацией данных;

Ø ограничениями целостности;

Ø множеством допустимых операций.

В теории управления базами данных выделяют модели трех базовых типов: иерархическую, сетевую и реляционную (табличную). Терминологической основой для иерархической и сетевой моделœей являются понятия: атрибут, агрегат и запись. Под атрибутом (элементом данных) понимают наименьшую поименованную структурную единицу данных. Поименованное множество атрибутов может образовывать агрегатданных . В некоторых случаях отдельно взятый агрегат может состоят из множества экземпляров однотипных данных или, как говорят, быть элементом множества. Записью называют составной агрегат, который не входит в состав других агрегатов.

В иерархической модели всœе записи, агрегаты и атрибуты базы данных создают иерархически организованный набор, ᴛ.ᴇ. такую структуру, в которой всœе элементы связаны отношениями подчинœенности и при этом любой элемент может подчиняться только одному некоторому другому элементу. Такую форму зависимости удобно изображать с помощью древоподобного графа (связанной схемы, которая состоит из точек и стрелок и не имеет циклов).

Концепция сетевой модели данных связана с именем Ч. Бахмана. Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-наследник должен иметь одного предка; в сетевой структуре данных наследник может иметь любое число предков. Сетевая база данных состоит из набора записей и набора связей между этими записями, точнее, из набора экземпляров записей заданных типов (из допустимого набора типов) и набора экземпляров из заданного набора типов связей.

Среди достоинств систем управления данными, основанных на иерархической или сетевой моделях, может быть их компактность и, как правило, высокое быстродействие, а среди недостатков - неуниверсальность, высокая степень зависимости от конкретных данных.

Концепция реляционной модели впервые была сформулирована в работах американского ученого Е.Ф.Кодда. Отсюда происходит ее второе название – модель Кодда . В реляционной модели объекты и взаимосвязи между ними представляются с помощью таблиц. Для ее формального определœения используется фундаментальное понятие отношение .

Метод систематизации связан с разделением изучаемых явлений (исходя из целей исследования) и избранными критериями на совокупности, характеризуемые определенной общностью и отличительными признаками.

Система — это множество элементов, находящихся в отношениях и связях друг с другом и образующих определенную целостность, единство.

Систему чаще всего рассматривают в качестве инструмента, способа изучения явлений и процессов и в этом случае она смыкается с понятием модели. Ее рассматривают и как комплекс процессов и явлений, а также связей между ними, существующий объективно. Задача этого комплекса состоит в том, чтобы выделить данную систему из окружающей среды, установить ее входы и выходы, подвергнуть анализу ее структуры, выявить механизм функционирования. Нередко метод систематизации рассматривают как определенный прием, связанный с классификацией, типологией, концентрацией и др.

Важной чертой эффективной работы является быстрый доступ к необходимым ресурсам. Если работа требует информационного оснащения, то необходимо предусмотреть легкий, быстрый поиск информации, а также систематизацию новой информации.

Первичным и важнейшим этапом многих бизнес-процессов, происходящих в любой организации, является систематизация информации . Благодаря тщательно проведённой систематизации информации удаётся достичь высоких результатов в процессе оптимизации делопроизводства, а также в экономии средств компании и рабочего времени сотрудников. Без предварительной систематизации информации невозможно представить такие важнейшие бизнес-процессы, как документооборот, делопроизводство, создание материального и электронного архива, создание различных баз данных .

Систематизация информации включает:

Методы поиска и накопления информации;

Классификацию и индексирование информации;

Способы доступа к информации;

Способы представления информации;

Обработку запросов на поиск информации.

Информация может быть организована одним из двух основных способов:

Структурированная информация;

Информация в виде свободного текста;

Под структурированием понимается последовательная систематизация информации. Для этого используются стандартные форматы. Формат - это пустая форма, в которую заносится информация. Информация может быть записана на бумаге или в текстовом редакторе, или в виде входных данных может быть размещена в программе базы данных.

Стандартный формат составлен из разделов информации, называемых полями . Результатом заполненного формата является запись .

База данных - это собрание записей, организованных таким способом, чтобы облегчить поиск определенной записи или ряда взаимосвязанных записей, или определенной информации, содержащейся в этих записях. Еще одна характеристика хорошей базы данных - возможность выдавать ранее зафиксированные данные в различном виде: в отношении содержания (от минимального набора до исчерпывающей информации) и в отношении формы, в которой будут представлены выходные данные.


Под систематизацией информации подразумевается своего рода классификация всех документов организации по различным группам. Каждая компания выбирает для себя наиболее удобный метод систематизации информации, тот или иной тип классификации (или совокупность таких типов). Чаще всего вся документация фирмы распределяется в соответствии с номинальной, предметной, тематической, хронологической, авторской и архивной классификацией. Номинальная систематизация - распределение документов по их типу (счета, договоры, приказы и т.п.); предметная - по принадлежности документа к какому-либо конкретному делу; тематическая - по общей тематике; хронологическая систематизация информации - распределение документов по дате их создания; авторская - по имени автора документа; архивная - по срокам хранения документации.

Систематизация информации предполагает обработку информации с целью приведения ее к определенному виду и интерпретацию информации, позволяющую индивиду определенным образом отреагировать на полученную информацию. Обработка информации располагает ее в определенном порядке, придает ей некие завершенные формы, что наполняет информацию определенным смыслом и значением. Обработка информации создает образы, формы, которые человек может распознать и которые понимаются им определенным образом. При этом происходит процесс сведения комплекса информационных сигналов до упрощенных синтезированных образов и категорий.

Выделяется три общих правила обработки информации, позволяющих свести ее до образов:

Установление соотношения фигуры и фона;

Завершение образов;

Установление сходства и приблизительности.

При установлении соотношения фигуры и фона в общей "картине" информации выделяется то, что является "фигурой", т. е. смыслом картины, ее образом. Соответственно то, что не является фигурой, превращается в фон. Часто фигура выделяется однозначно. Однако бывают ситуации, когда фон может быть воспринят как фигура, а фигура рассматриваться фоном. В этом случае обработанная информация может превратиться в совсем другой образ и обрести совсем другой смысл.

Завершение образов позволяет создать цельный образ по отдельным частям, даже если для этого нет достаточной информации. Часто этот процесс обработки информации может приводить к созданию неверных образов и неверной интерпретации поведения других, а также порождать неверную интерпретацию индивидом воздействий, поступающих в его адрес со стороны организационного окружения.

Установление сходства и приблизительности приводит к тому, что, во-первых, по отдельным элементам и характерным чертам удается выделить из общего объема информации отдельные образы и формы, имеющие некие обобщающие черты. Во-вторых, этот принцип обработки информации проявляется в том, что различные образы и соответственно явления группируются в некие обобщенные группы путем сглаживания либо же игнорирования индивидуальных особенностей каждого явления.

Систематизация информации человеком проводится двумя способами. Первый способ - это логическая обработка информации. Для данного способа характерно систематическое и последовательное на основе логических операций преобразование информации. Это так называемый научный способ обработки информации. Но человек не только логически обрабатывает информацию, доводя ее до состояния, позволяющего осуществлять действия в ответ на полученные воздействия из среды. Человек также обрабатывает информацию, используя чувства, предпочтения, эмоции, убеждения. В этом случае информация обрабатывается по принципам "люблю - не люблю", "нравится - не нравится", "хорошо - плохо", "лучше - хуже", "приемлемо - неприемлемо" и т.п.

Восприятие - очень сложный, многогранный и быстротекущий процесс. Неверно думать, что фазы отбора, обработки и оценки жестко разграничены и следуют одна за другой в четко определенной форме и по однозначной схеме. Поиск решений может быть основан на информации различных типов. Для удобства пользования важно предусмотреть различные варианты подачи информации, или, формы представления информации.

Рассмотрим несколько типичных видов систематизации информации.

Номинальная систематизация представляет собой распределение информации по типу документа - договоры, счета, акты, приказы и т.п.

Предметная систематизация - распределение информации по содержанию документов: например, в одну папку отправляются документы, связанные со строительством объекта №., а в другую - со строительством объекта №2.

Хронологическая систематизация информации группирует документы в соответствии с определенными временными рамками - например, в «данной» папке хранится вся бухгалтерская документация за 2008 год. Довольно востребованным видом систематизации является классификация документов по автору или коллективу авторов. Обязательной к применению в архивах является экспертная систематизация информации, распределяющая документы по срокам их хранения. После проведения процесса систематизации информации, составляется номенклатура дел - перечень наименований документов, своеобразный справочник. Затем все документы индексируются.

Систематизация информации применяется как к материальным (бумажным) документам, так и к электронным. Составление классификации бумажных документов, последующее создание номенклатуры дел и индексирование - трудоёмкие процессы, требующие специальных навыков, выполнение которых стоит предоставить профессионалам. В компьютерных программах - «Электронных архивах» - процесс систематизации информации происходит автоматически, по заданным параметрам, но также требует предельной внимательности и аккуратности.

Систематизация документов осуществляется для того, чтобы предоставить пользователям возможность более легкого поиска нужных документов. В документационных центрах на этой стадии выполняется два основных действия - каталогизация и физическое хранение документов.

Каталогизация, в свою очередь, также состоит из нескольких шагов :

Библиографическое описание;

Описание содержания документа;

Назначение документу указателя местоположения.

Тема: Информация вокруг нас

Урок: Систематизация и поиск информации. Получение новой информации

На предыдущем уроке мы обсудили способы представления информации: текст, таблица, наглядные способы представления (диаграммы, схемы и т. д.). Сегодня мы поговорим о том, как необходимо работать с информацией. В частности, коснёмся вопросов поиска и систематизации информации, а также получения новой информации.

Каждый день мы получаем большой объем информации. Это и телевизионные новости, и прогноз погоды, и оценки в школе… Если бы человек не умел обрабатывать полученную информацию, то к концу дня наша голова была бы забита огромным количеством бесполезной информации, и любые мыслительные процессы были бы крайне затруднительны.

Чтобы работа с информацией была продуктивной, необходимо научиться ее обрабатывать. К обработке информации относится ее систематизация, поиск и кодирование (Рис. 1).

На данном уроке мы познакомимся с систематизацией и поиском информации.

Для того чтобы лучше понять смысл систематизации информации, разберем такой пример. Представьте себе большую кучу беспорядочно сложенных книг, журналов, фотографий (Рис. 2).

В таком большом количестве информации очень тяжело разобраться, поэтому необходимо разделить эти вещи по каким-то признакам на группы. Например, фотографии - отдельно, книги - отдельно, журналы - отдельно (Рис. 3-5).

Это деление по признаку «форма представления информации».

После этого каждую отдельную группу также можно разбить на более мелкие части. Например, книги - по автору, фотографии - по датам и т. п.

Такое деление и называется систематизацией (информации, данных, предметов и т. д.).

Систематизация информации - приведение информации в порядок. Окружающие нас объекты можно систематизировать различными способами. Например, их можно разделить на техногенные (созданные человеком) и природные объекты. Природные объекты можно разделить на неживые и живые и так далее (Рис. 6).

К систематизации относятся сортировка и разбиение на группы. Рассмотрим, какие существуют виды сортировок:

· по алфавиту (в порядке следования букв в алфавите);

· по номерам (в порядке возрастания или убывания чисел);

· в хронологической последовательности (по дате и по времени) (Рис. 7).

С сортировкой по алфавиту все знакомы. Это, например, список учащихся в классном журнале. В порядке убывания роста строятся школьники на уроке физкультуры. В хронологической последовательности изучаются события на уроках истории.

Разбиение на группы - это разделение информации на части по какому-то признаку, например, по форме, по цвету, по назначению .

Попробуйте ответить, как могут быть систематизированы следующие объекты:

1. Книги в библиотеке (по году издания, по автору, по темам ).

2. Фотографии в альбоме (по датам, по событиям, по людям ).

3. Список телефонов (по фамилиям, по группам ).

4. Товары в магазине (по назначению, по размеру, по цвету ).

5. Расписание поездов (по направлению, по времени прибытия ).

6. Список учащихся (по алфавиту, по среднему баллу ).

7. Объекты окружающего мира (по форме, материалу, по одушевленности, по роду, по назначению ).

Сортировка информации

Мы часто пользуемся сортировкой информации, часто даже сами того не подозревая. Например, многие хранят музыку на компьютере, располагая её в папках по музыкальному стилю (Рок, Поп-музыка, Рэп, Классика и т. п.) (Рис. 8).

А кто-то предпочитает такие классификации, как: Весёлая/Лирическая; Отечественная/Зарубежная (Рис. 9, 10).

Рис. 9, 10. Примеры сортировки музыки ()

Самые терпеливые даже распределяют аудиозаписи по исполнителям.

Некоторые люди носят деньги в кошельке в порядке возрастания (убывания) номинала купюр. То есть, сначала 10, потом 50 и т. д. до 5000 рублей.

Для выполнения всех указанных действий необходимо выполнить сортировку. Перечисленные выше классификации достаточно просты и не требуют особо сложных действий для сортировки. Понятно, что, к примеру, композиции Григория Лепса разместятся в папке с названием «Отечественная музыка», а песня «Gangnam Style» - в папке «Зарубежная музыка». Однако иногда сортировка может быть затруднена, если предложенная классификация слишком узкая. Например, песня Димы Билана «Never let you go» может быть отнесена как к отечественной музыке, так как исполняется нашим певцом, так и к зарубежной, так как исполняется на английском языке.

Пожалуй, ни одна задача не породила такого количества решений, как задача сортировки информации. Существует множество программных методов сортировки (метод пузырька, метода Шелла, Хоара и т. п.) (Рис. 11).

Все эти методы отличаются сложностью реализации, скоростью сортировки и т. п. Может возникнуть вопрос: а так ли важна скорость сортировки? Безусловно, в приведенных выше примерах сортировка производится достаточно быстро. Но представьте, что нам нужно отсортировать в порядке возрастания большой массив чисел. Если делать это «в лоб» - каждое следующее число сравнивать с предыдущими и размещать в нужном месте - то такая сортировка может занимать очень много времени. Поэтому очень важно выбрать наиболее оптимальный путь сортировки элементов, чтобы сам процесс занял наименьшее время.

Рассмотрим пример сортировки информации.

Задача. Расположите указанные события в хронологическом порядке:

1. Начало Великой Отечественной войны

2. Битва под Полтавой

3. Бородинское сражение

4. Дуэль Пушкина и Дантеса

5. Начало работы портала сайт

6. Чемпионат мира по футболу в ЮАР

7. Победа Зенита в Кубке УЕФА

Прежде, чем располагать в хронологическом порядке, необходимо понять, что же такое хронологический порядок.

Это порядок, при котором события располагаются в том же порядке, в котором они происходили с течением времени.

То есть, для сортировки нам понадобятся даты (по возможности, наиболее точные) указанных событий. Некоторые из них являются общеизвестными, а для поиска других необходимо воспользоваться Интернетом или библиотекой.

5. Портал сайт начал свою работу в сентябре 2009 года

6. Чемпионат мира по футболу в ЮАР прошёл в июне 2010 года

Теперь нам уже не составит труда расположить эти даты в хронологическом порядке:

1. Битва под Полтавой

2. Бородинское сражение

3. Дуэль Пушкина и Дантеса

4. Великая Отечественна война

5. Зенит выиграл Кубок УЕФА

6. Портал сайт начал свою работу

7. Чемпионат мира по футболу в ЮАР

Сортировка и разбиение информации производится также для того, чтобы облегчить поиск информации. Поиск - это еще один способ обработки информации. Вы осуществляете поиск информации, когда ищете нужное слово в словаре или читаете книгу с целью что-то узнать. Также к поиску информации относится обращение в справочную службу для того, чтобы узнать номер нужного вам телефона. Если вы заглянули с той же целью в свою записную книжку - это тоже поиск информации.

Существуют следующие методы поиска (Рис. 12):

· наблюдение;

· общение;

· чтение литературы;

· просмотр телепередач;

· работа в библиотеках.

Существуют целые организации и службы, созданные с целью поиска информации. Например, космические спутники постоянно снимают данные о различных явлениях, происходящих на поверхности Земли, и посылают их в специальные учреждения. Там полученные данные обрабатывают и получают информацию о лесных пожарах, наводнениях и других стихийных бедствиях, чтобы вовремя оказать необходимую помощь пострадавшим.

Обычно поиск информации производится в каком-то хранилище информации - телефонном справочнике, словаре, энциклопедии, сети Интернет (Рис. 13-15).

Из всего множества представленной там информации вам необходимо выбрать нужную, удовлетворяющую некоторым требованиям, - телефон одноклассника, перевод слова «открытие» на английский язык, годы жизни полководца Суворова, стоимость нужной вам модели роликовых коньков.

Если информация в хранилище систематизирована, то ее поиск осуществляется достаточно быстро.

Разбиение информации по признакам на группы

Очень часто нам приходится разбивать информацию на группы, руководствуясь определёнными признаками. Например, выбирая фрукты в супермаркете, мы делим их на свежие и гнилые, спелые и неспелые, большие и маленькие - и в зависимости от целей покупки, отбираем необходимые нам.

Это один из самых простых и бытовых примеров разбиения информации на группы. Вместе с тем, задачи такого рода возникают при решении совершенно разных примеров.

Пример 1.

Укажите наиболее «сильные» признаки, по которым объединены следующие объекты:

1. Лето, осень, зима, весна

2. Дождь, град, гроза, снегопад

3. Информатика, математика, русский язык, природоведение

4. Футбол, баскетбол, волейбол, гандбол, хоккей

5. Футбол, баскетбол, волейбол, гандбол, регби

6. Саша, Женя, Паша, Глеб, Игорь

7. Саша, Женя, Паша

С 1 группой всё более-менее очевидно: перечислены времена года .

Аналогично и со 2 группой - это явления природы .

Третий ряд также не вызывает сложностей: школьные предметы .

А вот 4 и 5 группы кажутся практически одинаковыми.

Объекты обоих этих рядов можно объединить по признаку: виды спорта . Однако для 5 группы есть более «сильный» признак: виды спорта с мячом .

Группы 6 и 7 тоже похожи, и объекты в них объединены по признаку: имена . Однако в 7 группе можно выделить более общий признак: имена, которые являются одновременно мужскими и женскими.

При этом существует ещё огромное количество признаков, по которым можно объединять указанные объекты. Например, все эти слова являются словами русского языка, что тоже является признаком, по которому можно объединить все эти объекты.

Пример 2.

Выберите лишнее число в последовательности:

1. Птица, самолет, пчела, машина, бабочка

2. Смотреть, глядеть, таращиться, моргать, наблюдать

3. Дождь, снег, град, молния, изморозь

4. Хлопок, шерсть, нейлон, лен, шелк

5. Бросать, пинать, швырять, метать, раскидывать

6. Бук, ясень, ель, ива, клен

7. Вишневый, алый, красный, малиновый, шафрановый

8. Мерин, волчица, лань, кобыла, овца

Ответы: 1. машина (не может «летать»), 2. моргать (остальные слова - синонимы слова «смотреть»), 3. молния (не связана с водой), 4. нейлон (искусственный материал), 5. пинать (остальные слова синонимичны слову «бросать»), 6. ель (вечнозелёное дерево), 7. шафрановый (не является оттенком красного), 8. мерин (мужской род).

Во многих случаях в результате обработки имеющейся (входной) информации мы получаем новую (выходную) информацию.

Рассмотрим пример: красный сигнал светофора. Какую информацию мы получили? Мы получили зрительную информацию, мы ее обработали и приняли решение - нужно остановиться. Красный свет - входная информация, а решение остановиться - выходная (Рис. 16).

Аналогичное преобразование информации происходит при совершении покупок, при планировании отдыха и т. п.

Преобразование информации может осуществляться по заданным правилам. Например, рассмотрим задачу:

В треугольнике АВС АВ=18 см, ВС на 3 см меньше АВ, АС в 3 раза меньше АВ. Чему равен периметр треугольника АВС (Рис. 17)?

Периметр треугольника - сумма длин всех его сторон: Р = АВ + ВС + АС. Найдем стороны: ВС = 18 - 3 = 15 (см), АС = 18:3=6 (см) и вычислим периметр: Р = 18+15+6=39 (см).

Таким образом, в результате преобразования исходных данных по известным нам правилам (формуле подсчета периметра) мы получили новую информацию о том, чему равен периметр треугольника.

Преобразование информации по определённым правилам. Алгоритмы

Преобразование информации кажется нам делом очень простым. Однако, на самом деле это далеко не так.

Особенно это касается составления алгоритма для правильного преобразования информации.

Простейшим примером такого алгоритма является инструкция пользователя к любому предмету (Рис. 18). Если она составлена некачественно, то пользователь рискует либо поломать предмет из-за неправильной эксплуатации, либо не научиться с ним работать.

Многие скажут, что составить инструкцию для готового прибора очень легко. Однако будут неправы. Почему? Всё очень просто: большинству людей гораздо проще сделать что-то самим, чем объяснить остальным, как это делается.

Действительно, сегодня практически любой школьник легко умеет пользоваться мобильным телефоном: вставить или поменять сим-карту, пополнить счёт, позвонить, отправить смс. И это кажется простым и интуитивно понятным. Однако попробуйте объяснить, как пользоваться мобильным телефоном человеку, который никогда им не пользовался. Это вызовет массу вопросов, о которых вы даже не подозреваете.

Давайте рассмотрим пример, который позволит нам понять, с какими трудностями сталкиваются люди при составлении алгоритмов для преобразования информации.

Задание. Составить алгоритм приготовления кофе для робота (Рис. 19).

Думаю, многие из Вас мысленно составили следующую модель алгоритма:

1. Взять чашку

2. Положить в неё кофе

3. Насыпать сахар

4. Залить кипятком

5. Помешать ложкой

6. Разбавить кипячёной водой

И этот алгоритм будет практически нереализуем. Почему? Очень просто: робот не обладает «здравым смыслом» в виде опыта, который накапливает человек. Поэтому даже фраза взять чашку будет для него сложной проблемой: где взять, какого размера должна быть чашка. Предположим, робот взял чашку, но это значит, что он держит её в руках, ведь в алгоритме не было сказано поставить чашку на стол.

Аналогичная ситуация с сахаром и кипятком. В общем, вырисовывается целый ряд проблем.

Именно с такими проблемами и сталкиваются «специалисты» при составлении инструкций для «неспециалистов».

Попытаемся составить более полный алгоритм (хотя и его можно совершенствовать практически до бесконечности):

1. Взять в серванте прозрачную чашку с надписью «Моя»!

2. Поставить чашку на кухонный стол дном вниз.

3. Достать из шкафа, который расположен слева от серванта, контейнеры с надписью «Кофе» и «Сахар» и поставить их на стол рядом с чашкой.

4. Взять в серванте чайную ложку.

5. Насыпать в чашку одну полную чайную ложку вещества из контейнера с надписью «Кофе», а затем одну чайную ложку вещества из контейнера с надписью «Сахар».

6. Взять только что закипевший чайник и налить из него кипятка в чашку так, чтобы она была заполнена примерно на 2/3.

7. Чайной ложкой равномерно и не спеша помешать кофе в чашке в течение минуты.

8. Вынуть чайную ложку из чашки и положить в раковину.

9. Взять с кухонного стола графин с кипячённой водой и налить из него воду в чашку так, чтобы она была заполнена приблизительно на 90%.

Безусловно, этот алгоритм не является совершенным и предполагает знание роботом многих вещей, однако даже он показывает, насколько трудно описать те вещи, которые каждый из нас умеет делать с раннего детства. Возможно, именно поэтому создание полноценного искусственного интеллекта имеет весьма отдалённые перспективы. Это связано, в первую очередь, с тем, что нужно научить компьютер «думать» и «анализировать», как человек, потому что полностью «вложить» в него все человеческие знания практически невозможно. А ещё сложнее научиться ими распоряжаться.

Решение задач, то есть преобразование входной информации в выходную, может проходить путём логических рассуждений.

Вначале мы анализируем имеющуюся информацию, выделяем значимые объекты и устанавливаем между ними связи. Рассуждая, мы взвешиваем различные варианты и делаем некоторый выбор. При этом мы задействуем не только знания, полученные в школе, но и свой жизненный опыт.

В качестве примера рассмотрим следующую задачу.

Задача. На столе поставлены в ряд бутылка минеральной воды, кружка, чашка, стакан и кувшин, причём точно в таком порядке, в каком они перечислены (Рис. 20).

В них находятся различные напитки: кофе, чай, молоко, квас и минеральная вода, но неизвестно, какой напиток в каком сосуде (кроме, разумеется, минеральной воды). Если стакан поставить между чаем и молоком (в данный момент он не стоит между ними), то по соседству с молоком будет квас, а кофе будет точно в середине. Определите, в какую посуду что налито.

Решение

Для удобства рассуждений пронумеруем места всех сосудов (рис. 21).

Чтобы стакан мог оказаться между сосудами с чаем и молоком, он должен переместиться на место 3 (а чашка, соответственно, - на место 4), так как на месте 2 он будет между минеральной водой и ещё чем-нибудь.

Таким образом, он встанет точно в середине. Из этого можно сделать вывод, что в стакане находится кофе. Молоко из условия задачи, во-первых, рядом со стаканом, во-вторых, рядом с сосудом с квасом (Рис. 22).

Значит, в кружке находится чай, в чашке - молоко, в кувшине - квас. Задача решена.

Результаты рассуждений при решении задач бывает удобно фиксировать с помощью таблиц , о чём мы уже говорили на прошлом уроке.

Во многих информационных задачах требуется установить правило преобразования входных данных в выходные, разработать план действий, обеспечивающий нужный результат. Рассмотрим примеры.

Задача 1. Петя и Коля играют в следующую игру: Петя задумывает правило преобразования текстовой информации. Коля может сообщать Пете любые тексты и узнавать результаты преобразования. Вопросы Коли и ответы Пети в этой игре: а - б; мама - нбнб; весна - гётоб.

Отгадайте, какое правило задумал Петя.

Решение

Анализ первой пары «а - б» позволяет предположить, что Петя каждую букву в исходном тексте заменяет на следующую по алфавиту (Рис. 23).

Проверим наше предположение на второй и третьей парах. Теперь можно сформулировать правило преобразования информации: каждая буква в исходном тексте заменяется на следующую по алфавиту.

Таким образом, мы установили возможное правило преобразования входной информации в выходную.

На самом деле, можно предложить ещё большое количество правил, которые удовлетворяют приведённым примерам. Однако чаще всего мы пользуемся при решении подобных задач здравым смыслом и жизненным опытом.

Существует даже игра «Еду - не еду», правила которой построены на преобразовании информации. Её правила просты: один из участников задумывает условие. А остальные участники называют слова. Загадывающий отвечает «еду - не еду» в зависимости от того, удовлетворяет ли названное слово задуманному условию. Анализируя ответы, остальные участники должны угадать, какое же условие было задумано.

Вариантов условий для этой игры может быть масса. Например, вторая буква слова должна быть гласной; слово должно быть именем собственным. А могут быть условия, и не связанные с самими словами. К примеру, условием может являться то, что называющий слово человек - девушка или то, что называющий слово сидит рядом с тем, кто загадывал условия.

На этом уроке мы познакомились с методами работы с информацией: сортировкой, преобразованием, систематизацией, поиском. Кроме того, мы узнали, как получать новую информацию. На следующем уроке мы поговорим о кодировании информации и единицах измерения информации.

Список литературы

  1. Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса. - М.: БИНОМ. Лаборатория знаний, 2012.
  2. Босова Л.Л. Информатика: Рабочая тетрадь для 5 класса. - М.: БИНОМ. Лаборатория знаний, 2010.
  3. Босова Л.Л., Босова А.Ю. Уроки информатики в 5-6 классах: Методическое пособие. - М.: БИНОМ. Лаборатория знаний, 2010.
  1. Интернет-портал Inftis.narod.ru ().
  2. Интернет-портал Nsportal.ru ().

Домашнее задание

Приступая к работе с информацией, необходимо определить (поставить) цель этой работы. Цель определяет направления поиска, источники информации и методы ее получения, формы ее представления и способы распространения.

Цель информационной работы всегда состоит в приобретении и (или) распространении сведений, необходимых для осуществления кон кретных действий, изменения поведения людей, принятия решений.

То, для каких действий или решений необходима информация, опре деляет, какие информационные материалы понадобятся, какого характера информация должна быть получена, каким способом и из каких источников. Определение на ранних этапах проекта его основных параметров сэкономит ресурсы, сделает усилия более эффективными.

  1. Сбор информации

Этот процесс может включать как собственно сбор уже имеющейся, так и создание новой, дополнительной информации.

Для того, чтобы сориентироваться в информации без дополнительных временных затрат, полезно наметить общее направление сбора в соответствии с целью работы. Цель помогает определить основные параметры нужной информации: "широту" требуемой информации, степень детализации и глубину проработки.

Существует множество путей получения информации, среди которых:

  • работа с литературным материалом;
  • запросы в организации-держатели информации (государственные и общественные образовательные организации);
  • привлечение к работе консультантов или экспертов;
  • поиск информации в автоматизированных информационных системах;
  • поиск в ресурсах компьютерных сетей;
  • собственные наблюдения.

Информационный поиск может быть

  • адресный (по формальным признакам);
  • семантический (по смыслу, содержанию);
  • документальный; фактографический и др.

Исходя из представления о желаемой информации, следует опреде лить, какими методами и из каких источников может быть получена такая информация. К источникам педагогической информации можно отнести огромное количество книг, статей, специализированных автоматизирован ных информационных систем, электронных баз данных и т.п., данные образовательных организаций различных типов, информацию различных категорий педагогических работников.

Планируя информационный поиск, важно иметь в виду следующий принцип: тип источника должен быть адекватен характеру требуемой информации. Для некоторых практических применений существенным оказывается "статус" источника информации.

Свойства источника информации:

  • Достоверность - подразумевает, что информация, содержащаяся в источнике, должна соответствовать действительности, быть истинной, правильной.
  • Полнота - означает, что источник информации должен отражать все существенные стороны проблемы, значимые факты. При этом требования к полноте источника определяются целью его подготовки, и определение "существенные" означает "существенные с точки зрения поставлен ной цели".
  • Ссылки и обоснования. Информация либо берется из другого источника, либо создается. Информация может создаваться, с одной стороны, в результате собственных наблюдений или измерений, с другой стороны - путем вычислений или выводов на основе некоторой исходной информации. При этом новая информация, как правило, создается с использованием определенных методик. Сведения о происхождении приводимой информации важны для правильного ее понимания и оценки, эффективной работы с материалом. Наличие таких сведений в источнике информации позволяет оценить его достоверность и, в некоторой мере, степень его полноты.
  • Отсутствие неоднозначности, неопределенности.
  • Современность источника информации - предполагает оперативность и своевременность получаемых из данного источника не устаревшей информации.
  • Избыточность - если используется только один метод, один источник для получения информации, сведения могут оказаться односторонними, неполными или попросту недостоверными. Информацию следует собирать и анализировать с некоторым запасом, с превышением того объема, который непосредственно нужен для описания проблемы. Такой подход предоставит необходимую свободу при дальнейшей работе с информацией, позволит быть готовым к освещению незапланированных частных вопросов, адекватно отреагировать на внезапно возникающие предложения оппонентов или партнеров. Мера такого превышения определяется конкретной ситуацией.
  • Разумная достаточность - сбор информации необходимо ограни чивать "в ширину" - с точки зрения круга источников или методов, и "в глубину" - с точки зрения степени детализации, глубины проработки во проса. Успешность информационной работы существенным образом зависит от нахождения правильного баланса между принципами избыточности и разумной достаточности.

Средства автоматизации процессов информационного поиска

Автоматизированный поиск информации является многоступенча тым процессом, связанным с нахождением определенных ресурсов компьютерной сети, абонентской системы, требуемой Базы Данных (БД) либо Базы Знаний (БЗ), нужного информационного файла и т.д., содержащих необходимые сведения.

Для поиска информации в базах данных создаются информационно-поисковые системы (ИПС). Они осуществляют поиск по заявкам пользователей. Нередко этот поиск происходит по индексам и ключевым словам.

По характеру выдаваемой информации ИПС делятся на два типа.

Документальная система по заданию пользователя выдает необхо димые ему документы (книги, статьи, законы, отчеты и т.д.). В задании могут указываться сведения об искомых документах: автор, наименование, время издания, издательство и другие реквизиты.

Более сложной является фактографическая ИПС. Ее задача - поиск в документах интересующих пользователя сведений (фактов). Поиск информации осуществляется на естественном языке. Для этих целей осуще ствляется индексирование документов.

  1. Обработка и систематизация

Подходы к обработке информации специфичны для конкретных ее типов и видов. Применяемые методы обработки могут предъявлять определенные требования к предыдущему этапу - сбору информации. Например, для применения статистических методов может оказаться необходимым определенное количество исходных данных. Обработка может также выявить ошибки, допущенные при сборе информации.

Техническая обработка

Некоторые типы информации требуют специальных процедур ее обработки (наиболее характерный пример - статистическая обработка количественных данных). Данные, которые возникают в результате обработки, являются исходными для последующей интерпретации.

Научная обработка

Научная обработка информации включает:

  • аналитико-синтетическую обработку сообщений (см. "Некоторые подходы к проектированию информационно-педагогических модулей");
  • структурирование информации;
  • свертывание (оценка социальной значимости информационного материала с одновременным снижением объема, при этом потери информативности должны быть минимальны);
  • альтернативное, справочное или рекомендательное аннотирова ние (краткое сжатое изложение того, чему посвящена данная работа, каков основной достигнутый результат, используемые подходы и методы, применение результатов);
  • реферирование (краткая передача содержания документа с включением приведенных в документе данных фактографического и фактологического характера по структуре: аналитическое описание, текст (чему посвящен материал, основные результаты в синтетическом виде, наиболее интересные и существенные данные, выводы, аналитическая характеристика автора));
  • составление библиографических, реферативных, аналитических обзоров (макро-свертывание множества информационных объектов).

Систематизация информации

Систематизация информации - организация информации в виде, удобном для работы, хранения и последующего обращения к ней. Это может быть компьютерная база данных, систематически организованная подборка первоисточников или просто таблица, содержащая результаты исследования. В результате этого этапа информация должна быть организована таким образом, чтобы обратиться к ней можно было через некоторое, возможно, весьма продолжительное время. Там, где это возможно, систематизация должна начинаться параллельно со сбором информации.

Эффективная систематизация информации особенно важна в случае создания информационных ресурсов открытого доступа, которые будут использоваться широкой аудиторией в разнообразных целях (см. "Новые способы обработки педагогической информации").

  1. Интерпретация информации

Интерпретация представляет собой заключительную стадию собственно информационного исследования. Задача интерпретации - установить смысл, значение собранной - информации фактов, цифр, документов. Без этого информация не может служить основой для принятия решений, практических действий. Любой отдельный факт - лишь фрагмент общей картины, а осмысленные решения, как правило, могут приниматься на основании картины в целом. Именно на этапе интерпретации ранее собранные фрагменты должны сложиться воедино. Для этого необходимо правильно соотнести собранные сведения и, возможно, понять, какой еще информации не хватает.

Содержанием интерпретации может быть, в частности, сравнение, классификация, обобщение (установление закономерностей на основе собранных фактов, выявление причинно-следственных связей между явлениями). Эта стадия информационной работы наиболее трудно поддается формализации. Именно здесь требуется творческая работа, привлечение знаний и опыта, накопленных в ходе предшествующей работы (см. "Новые способы обработки педагогической информации").

В большинстве случаев в ходе интерпретации требуется сопостав лять разнородную информацию, например, научную, социальную информацию, относящуюся к исследуемой проблеме, нормативные документы.

Процесс интерпретации, являясь центральным, узловым моментом информационной работы, нередко заставляет возвращаться к этапам сбора и обработки информации, чтобы добавить недостающую информацию.

  1. Представление и распространение информации

Представление информации - подготовка на ее основе конкретных материалов для определенной аудитории и распространения информации.

Одним из важнейших принципов представления и распространения информации является то, что разным категориям специалистов одну и ту же информацию следует сообщать по-разному. Кроме того, для разных категорий могут быть значимы или интересны разные аспекты одной и той же проблемы. Поэтому в большинстве случаев оправдана подготовка нескольких информационных материалов, рассчитанных на различные типы аудитории. Это и составляет содержание этапа представления информации.

Каналы распространения информации

Необходимо определить, каким методом донести до аудитории информацию, какие каналы распространения использовать. Точный выбор этих каналов должен позволить донести информацию до адресата как можно более эффективно, с наименьшими затратами ресурсов. Выбор каналов распространения информации, так же как и форм ее представления, определяется, в первую очередь, тем, с какими целевыми группами необходимо работать.

Характеристики, которые необходимо принимать во внимание при выборе различных каналов распространения информации:

  • размер аудитории;
  • качественный состав аудитории (профессиональный, социальный, по степени интереса к проблеме и т.д.);
  • срок доставки информации;
  • ресурсы, необходимые для распространения информации по данному каналу.

Эти характеристики полезно учитывать, определяя приоритетные каналы распространения информации для целевой аудитории. В свою очередь, сам канал распространения информации предъявляет дополнительные требования и к содержанию, и к оформлению материала.

Средства телекоммуникации выступают достойной альтернативой традиционным средствам распространения информации. В этом процессе активно привлекаются такие возможности и сервисы телекоммуникаций, как электронная почта, электронные телеконференции, информационные серверы и т.д.

  1. Обратная связь

Особенно богатый материал для оценки и комплектования информационных фондов способен дать этап распространения информации - именно на этом этапе материалы встречаются с той аудиторией, для которой они предназначены. Хорошо организованный процесс распространения информации является процессом двусторонней коммуникации с аудиторией, которая позволяет узнать, как аудитория воспринимает материалы, являются ли они убедительными, есть ли в них ответы на вопросы, интересующие ее. Возможно, после этого этапа понадобится корректировка материалы или возврат к предыдущим этапам информационной работы.

Поиск научной информации может вестись различными методами, которые можно условно разбить на две группы : методы получения готового информационного продукта и методы моделирования (рис. 6.4).

Естественно, для исследователя наибольший интерес представляют свежие данные авторитетных источников. Но прежде чем начинать их



Рис. 6.4. Основные методы поиска научной информации


поиск, следует уяснить «что нужно искать». Для этого вначале должен быть разработан план научного исследования (его замысел), позволяющий приступить к целенаправленному адресному поиску.

Начиная информационный поиск, следует сразу решить вопрос отображения и хранения отобранных данных (на магнитных носителях, в картотеке, в рабочей тетради), в противном случае найденные сведения могут быть скоро забыты, утрачен точный смысл информации. Если сразу не зафиксировать полный адрес источника, то будет затруднен возврат к нему, если это потребуется.

Поиск готового информационного продукта рекомендуется начинать с ознакомления с информационными изданиями, которые в отличие от библиографических изданий оперируют не только сведениями о самом источнике, но и фактами, идеями, содержащимися в нем. При этом формируется область (границы) дальнейшего поиска.

Далее начинается детальное ознакомление с конкретными документами, выявленными на предыдущем этапе (монографиями, статьями, отчетами по НИОКР, диссертациями). Изучение литературных источников рекомендуется проводить по этапам (рис. 6.5):

Беглый просмотр публикации с целью получения общего представления о ее содержании;

Детальное изучение той части произведения, которая представляет для исследователя наибольший интерес;

Выписка из текста (копирование) наиболее заинтересовавших исследователя фактов (фрагментов текста);

Обработка полученной информации (ее критический анализ; редактирование; выбор цитат; «чистовая» запись материала в форме, удобной для исследования).

Рис. 6.5. Последовательность изучения литературных источников информации

Следует обратить внимание на следующую рекомендацию при поиске готового информационного продукта: изучая литературные источники, нужно просматривать библиографические списки диссертаций, монографий, обычно помещаемых в конце работы. Это важно, потому что авторы отчетов, монографий, диссертаций в ходе своего исследования уже проанализировали состояние науки и практики в данной области знания, в том числе, изучили имеющуюся литературу. По сути дела, они дают исследователю готовое «поле информации», на котором можно расставлять свои акценты.

При изучении литературных и иных источников следует собирать не любые, а только научные факты – элементы научного знания. Только на их основе можно выявить закономерности поведения систем и явлений, вывести законы, разработать теории.

Если точность научного факта вызывает сомнение, надо провести дополнительный анализ, перепроверку факта путем получения его подтверждения (либо отрицания) из других источников. При этом исследователь должен быть объективным: нельзя отбрасывать факты только потому, что они не отвечают нынешним представлениям автора, что их трудно объяснить или применить сегодня на практике. Многие новые научные факты могут быть необычными для первого восприятия, недостаточно доступно раскрытыми и объясненными читателю. История науки имеет много примеров, когда созданное новое знание или отдельные научные факты оказываются востребованными через десятилетия.

При поиске научной информации любой исследователь стремится получить достоверные сведения, а они в значительной мере зависят от достоверности источника и характера самой информации (быстро стареющие сведения могут существенно утратить достоверность, даже будучи полученными из надежного источника, но по прошествии длительного времени после его образования). Наиболее достоверными следует считать описания изобретений, официальные издания государственных органов и организаций. Высокой степенью достоверности обладают учебники, учебные пособия, монографии, в которых публикуются результаты научной работы коллективов наиболее авторитетных ученых; эти издания проходят коллективное рецензирование и экспертизу ученых советов, кафедр, научных подразделений.

Менее достоверными источниками в этой связи следует считать научные статьи, доклады на конференциях, симпозиумах. В них авторы могут выражать не только коллективное, но и свое личное субъективное мнение, которое, естественно, может быть ошибочным. Тем не менее, подобные источники нельзя игнорировать. Более того, оперативность и свежесть содержащихся в них сведений всегда привлекала и будет привлекать научных работников, но эти источники следует относить к той группе, информацию которой надо перепроверять. Если статья или доклад наряду с самым научным фактом содержит строгое обоснование, доказательство его содержания, то такая информация, факт и сам источник, безусловно, являются достоверными.

Особую ценность имеют научно-технические статьи, в которых излагаются результаты завершенных исследований и приводятся сведения об их реализации, внедрении в практику, полученном при этом экономическом или производственном эффекте. Такие публикации обладают не только достоверностью фактов, положений, но и представляют большой научный и практический интерес.

Статьи о результатах незаконченных исследований и информационные статьи имеют меньшую значимость, т.к. содержат лишь гипотезы, концепции, идеи, предложения постановочного характера, не имеющие строгого обоснования и подтверждения достоверности. Они могут быть приняты к сведению с последующим продолжением поиска новых данных в порядке развития работы авторов статьи, доклада.

Достоверность научной информации во многом связана не столько с характером ее источника, но и с профессиональным и научным авторитетом ее автора, авторского коллектива. Поэтому, организуя информационный поиск, исследователь должен, в первую очередь, изучать труды наиболее известных в отрасли и в науке вузов, научно-исследовательских учреждений, а также отдельных ученых – признанных авторитетов в науке и практике.

Все вышеизложенное касается поиска готового информационного продукта. В научной работе такого рода данные не всегда возможно получить. Например, нельзя сказать, как будет вести себя вновь создаваемая, не имеющая аналогов в прошлом, организационно-штатная структура, предназначенная для строительства дорог в особых условиях, как повлияет инфраструктура строительной организации (банки, карьеры, поставщики материалов, строительные организации – конкуренты и др.) на ее экономические показатели в условиях рынка строительной продукции в перспективе, на несколько лет вперед. Подобная информация может быть получена методом моделирования , который был рассмотрен в разделе 4.

Мы рассмотрели методы поиска информации. Но она поступает к исследователю в различной форме, не всегда удобной для использования в выполняемой им работе. Она должна быть обработана и приведена к соответствующему виду.

Методы обработки информации разнообразны . Получаемые исследователем сведения могут в дальнейшем использоваться прямо или косвенно (рис. 6.6).

Цитирование – наиболее распространенный метод обработки литературных источников, позволяющий использовать в научной работе заимствованные результаты исследований других авторов в их оригинальном виде без искажений и комментариев.

Цитаты обязательно берутся в кавычки, после которых делается ссылка на первоисточник и страницу (нередко авторы ограничиваются лишь ссылкой на первоисточник – автора, название работы, города и года издания или указанием номера первоисточника в перечне литературы).

Цитаты позволяют исследователю подтвердить свою точку зрения, идею, гипотезу, равно как отвергнуть то или иное утверждение, построить систему доказательств. На основе цитат можно развивать собственную мысль, анализируя их содержание, анализируя и синтезируя факты, идеи, взгляды других авторов.

Рис. 6.6. Методы обработки информации

Группировка – метод обработки информации, заключающийся в рассмотрении многочисленных сведений по группам, разделам, классам данных, построенным по определенным признакам (критериям). При этом признаки могут быть различными. Например, автор высказал идею, гипотезу и хочет подтвердить ее, зная, что у ряда авторов он получит поддержку, а некоторые будут возражать. Поэтому, анализируя труды специалистов данной отрасли знаний, автор может «делить полученную в них информацию на две группы: высказывания «за» (т.е. в поддержку своей идеи) и «против». В каждую группу он может заносить цитаты, факты и цифры со своим комментарием и т.п.

Классификация данных как метод обработки информации имеет общее с группировкой, так как основана на разбиении сведений на классы, группы. Однако классификация – это не простая группировка, а построение строгой иерархической системы разделения информации по принципу «от общего к частному» или наоборот (т.е. на принципах анализа и синтеза). Примером классификации информации являются информационные системы: универсальная десятичная классификация (УДК), библиотечно-библиографическая классификация (ББК).

Классификация научной информации может осуществляться по различным критериям и на разную глубину . В рассмотренном выше примере информация, сгруппированная по признаку «за» и «против», может быть классифицирована по схеме, представленной на рис. 6.7.

Три рассмотренные метода ориентированы на прямое использование данных. Однако это не всегда возможно (либо нецелесообразно). Допустим, для подтверждения какого-либо факта, суждения, имеется несколько источников, из которых исследователь выписал цитаты, сгруппировав их в своем банке данных.

Цитаты громоздки, имеют некоторые противоречия, и в тексте работы автор должен кратко отразить свое резюме. Для этого надо провести редактирование информации. Редактирование применяется в тех случаях, когда нужно в нескольких фразах сформулировать мысль, аккумулирующую данные нескольких источников, либо когда цитата первоисточника громоздка, и ее удобнее изложить в сжатом виде.

Агрегирование данных предполагает соединение двух и более разнотипных банков данных в интересах выполнения исследования в целом или его раздела.

Преобразование информации в новую форму характерно для обеспечения экспериментальных исследований.



Рис. 6.7. Вариант классификации информации для подготовки к защите научной идеи (гипотезы)


Преобразование данных наиболее характерно в автоматизированных информационных системах. Здесь к форме и содержанию данных предъявляются четкие требования унификации информации, которые воспринимаются техническими средствами.

После поиска информации и ее соответствующей обработки возникает проблема хранения данных . Здесь исследователь должен решить несколько вопросов: как долго должна храниться информация (нужна ли она только для промежуточного этапа исследования или к ней будут возвращаться многократно; она может использоваться в первоначальном виде или будет преобразована и сохраняться в новой форме); на каких носителях следует хранить данные; следует ли их хранить с открытым доступом, либо в силу конфиденциальности к ним должен быть санкционированный доступ.

Сроки хранения определяются содержанием информации (нормативные документы, сведения фундаментального характера хранятся дольше), скоростью ее старения (быстро стареющие данные, как правило, часто обновляются), видом научного исследования, в интересах которого информация собирается (в исторических, экономических и других науках, где перспектива формируется с учетом ретроспективы, т.е. данных прошлого времени, следует постоянно хранить старые сведения, т.к. они позволяют установить тенденции развития систем, общества от прошлого в будущее). В науке не существует строгих правил расчета сроков хранения данных. Здесь весьма сильное влияние оказывают субъективные факторы (опыт и стиль работы исследователя, уровень его информированности и др.).

Важным вопросом хранения данных является выбор носителей информации . Это могут быть специальные папки для хранения документов (папки–скоросшиватели, папки архивные), картотеки, магнитные и другие современные носители. В качестве носителей используются также рабочие тетради, подшивки газет и журналов и т.п.

В настоящее время, наряду с магнитными носителями информации (гибкими и жесткими дисками), широко используются оптические (CD-диски, DVD-диски) и электронные носители информации (flash-устройства) .

Возможность переноса на дискету, оптический диск и флэш-карту содержания книги, быстрого обновления содержащейся информации, редактирования, копирования и выполнения других процедур обусловила огромную популярность оптических и электронных носителей в среде научно-технических специалистов, аспирантов, студентов. Эта популярность особенно возросла с появлением системы ИНТЕРНЕТ .

В то же время выявились и недостатки цифровых носителей информации:

Хранение данных на жестких дисках компьютеров нередко приводит к утрате информации из-за выхода из строя ЭВМ, нарушения правил пользования ими. Это требует дублирования данных (например, записав их на жесткий диск компьютера, пользователь должен сделать копию на дискете, оптическом диске, flash-устройстве либо распечатать ее на принтере и поместить в папку документов);

К информации, хранящейся на цифровых носителях, в компьютерных информационных системах, возможен несанкционированный доступ, что затрудняет сохранение конфиденциальности информации с точки зрения авторского права, новизны, секретности и т.д.;

Установление защиты от несанкционированного доступа часто требует значительных затрат.

Сбор исходных источников информации – это, вероятно, одна из самых простых процедур. Для ее выполнения исследователю достаточно к определенному сроку сконцентрировать большую часть искомых источников вблизи своего рабочего места.

Систематизация – это не что иное, как упорядочение и группировка собранного материала по содержанию и с учетом последовательности его использования. В результате все собранные источники должны быть разложены по соответствующим главам.

Анализом систематизированных источников завершается рассматриваемая процедура. Такой анализ – это тщательная проверка полноты отбора источников и проверка соответствия их выходных данных и содержания.

Рассмотрим основные средства поиска, сбора, систематизации и анализа исходных источников информации.Наиболее часто при подготовке научных работ используются библиотечные каталоги, так как библиотеки по-прежнему представляют собой наиболее полный и доступный информационный фонд.

Дополнительные возможности для научно-исследовательской работы в настоящее предоставляют электронные библиотеки. Так, электронная библиотека Российской таможенной академии решает следующие задачи:

Поддержка образовательного процесса посредством предоставления учебных изданий в электронном виде;

Совершенствование библиотечного и информационно-библиографического обслуживания читателей, используя новейшие информационные компьютерные технологии;

Пополнение фонда электронных ресурсов библиотеки;

Освоение современных систем хранения и передачи данных;

Формирование собственного электронного ресурса;

Запрос в случае отсутствия в фондах библиотеки необходимых читателям изданий из других библиотек, используя службу электронной доставки документов;

Распространение фондов электронных ресурсов и предоставляемых электронной библиотекой услуг.

В процессе научно-исследовательской работы, особенно на ее начальных этапах, трудно отрицать очевидные удобства работы с библиотечным каталогом (как традиционным, так и электронным). Каталог представляет собой систематизированный перечень источников, состоящих на хранении в информационном фонде и учтенных в соответствии с установленными правилами. Он содержит в себе документально выверенную справочную информацию о важнейших выходных данных книжного, периодического или электронного издания, состоящего на хранении и учете в данной библиотеке (рис. 6.8).

Рис. 6.8. Средства поиска, сбора и систематизации исходных данных об источниках информации

Чаще всего в библиотеках используются алфавитные, алфавитно-предметные, предметные, хронологические, библиографические, архивные, генеральные систематические и специальные каталоги. Все они различаются, во-первых, принципами отбора источников и, во-вторых, принципами расположения описательной (справочной) информации о них.

Алфавитный каталог перечень библиотечных источников, систематизированных в алфавитном порядке. При этом за основу могут быть взяты как названия (наименования) источников, так и фамилии их авторов (редакторов, составителей и пр.).

Каталог, организованный по алфавитному принципу, дает достаточно общее, если не сказать формальное описание наличествующих в библиотечном фонде источников. К подобному каталогу прибегают обычно в том случае, когда располагают лишь самыми минимальными сведениями об источнике – его названии и авторе.

Тематический каталог перечень библиотечных источников, систематизированных в тематическом порядке. За основу в этом случае принимают тематическую направленность содержания источника.

Каталог, организованный по тематическому принципу, дает описание библиотечных источников по различным отраслям и разделам знаний. Указанным каталогом пользуются в тех случаях, когда возникает необходимость за короткое время произвести обзор и отбор источников, предположительно содержащих информацию по теме научной работы.

Предметный каталог перечень библиотечных источников, систематизированных в предметном (т.е. значительно более дифференцированном по сравнению с тематическим каталогом) порядке. При этом сведения о предметах, непосредственно не связанных между собой, систематизируются по алфавиту, что дает право рассматривать предметный каталог в качестве разновидности алфавитного. Этот каталог используется в тех случаях, когда возникает необходимость за короткое время произвести обзор и отбор источников, самым непосредственным образом относящихся к конкретному предмету (событию, явлению и т.п.).

Хронологический каталог перечень библиотечных источников, систематизированных в хронологическом порядке, отражающем время выхода в свет того или иного издания, чаще всего периодического. За основу в данном случае принимается дата (год) издания источника.

К подобному каталогу прибегают обычно в том случае, когда об источнике известна лишь предполагаемая или реальная дата его публикации или когда необходимо оперативно подобрать все заслуживающие внимания источники, относящиеся к определенному периоду времени.

Архивный каталог перечень архивных библиотечных источников, систематизированных чаще всего в алфавитном (реже – хронологическом) порядке. Для отыскания требуемого источника по архивному каталогу требуется располагать либо сведениями о его названии и авторе, либо о времени выхода издания в свет.

Библиографический каталог перечень библиотечных источников, содержащих в себе библиографические (описательные) сведения о наиболее важных (наиболее часто используемых в работе) книжных и периодических изданиях, состоящих на хранении и учете в данной библиотеке.

К такому каталогу прибегают в тех случаях, когда сведений общего характера об источнике (полученного из алфавитного каталога) недостаточно и требуется за короткое время получить о нем дополнительную, более обширную информацию.

Генеральный систематический каталог перечень библиотечных источников, систематизированных в соответствии с неким основополагающим принципом, отличным от алфавитного и иных, рассмотренных выше. Очень часто в качестве такого принципа используется принадлежность того или иного источника не к условной теме, а к вполне определенной области научного знания или системе учебных дисциплин (история, экономика и т.д.). В свою очередь, каждая область или система разделяется на рубрики, подрубрики и т.д. Генеральный систематический каталог предоставляет оптимальные возможности для поиска, сбора, анализа и систематизации требуемых источников.

Специальный каталог перечень библиотечных источников определенного типа. Примером специального каталога может послужить каталог статей, опубликованных в периодических изданиях, состоящих на хранении и учете в данной библиотеке, или каталог новых поступлений.

Научно-справочный аппарат книги . Важную роль в процессе поиска, сбора, анализа и систематизации основных и вспомогательных источников информации играет и научно-справочный аппарат книги. К научно-справочному аппарату книги (от лат. apparatus – «приспособление») принято относить различные дополнительные материалы в составе издания, информирующие читателей об особенностях его содержания, состава, структуры, функциональном предназначении источника.

Элементы научно-справочного аппарата книги подразделяются на информационные, пояснительные, поисковые и вспомогательные. Информационные элементы научно-справочного аппарата книги служат для того, чтобы помочь читателю составить предварительное мнение об источнике и его особенностях. К ним относятся:

Сведения о названии источника;

Сведения о функциональном назначении источника;

Сведения об издателях;

Краткая характеристика издания;

Выходные данные издания.

Информационные элементы научно-справочного аппарата книги обычно располагаются на титульном листе и его обороте, а в ряде случаев – и в конце источника. Перечисленные сведения помогают читателю составить предварительное мнение об источнике, и о том, насколько он соответствует его требованиям.

Пояснительные элементы научно-справочного аппарата книги определенным образом дополняют и разъясняют авторский (основной) текст источника. К ним относятся предисловие и послесловие. Располагаются они до и после основного текста источника. С их помощью читатель получает дополнительную характеристику содержания источника, в том числе о причинах и условиях написания.

Поисковые элементы научно-справочного аппарата упрощают отбор необходимой читателю информации. К ним относятся содержание (оглавление) и указатели (в том числе предметные, алфавитные, указатели имен, географических названий, псевдонимов, иллюстраций и т.п.). Используя поисковые элементы, читатель имеет возможность быстро разыскать детальную информацию, содержащуюся в источнике (например, относящуюся к определенному году, персоналии и т.п.).

В ряде случаев научно-справочный аппарат книги включает в себя вспомогательные элементы. Они дают возможность без задержки получить дополнительные, иногда достаточно специфические сведения об исходном источнике информации и его содержании. К таким элементам относятся и комментарии.