Чем данные отличаются от информации. Различие информации и данных

  • · Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;
  • · Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).
  • 1. Данные и информация тесно взаимосвязаны.
  • 2. Данные фиксированы, они реально существуют в каждую единицу времени. Информация возникает только при переработке этих данных.
  • 3. Данные после преобразования становятся информацией. Многократно проверенная информация - знания.
  • 4. Информация, в отличие от данных, субстанция измеряемая.

Моделирование процесса принятия управленческих решений позволяет сделать значительный шаг в сторону количественных оценок и количественного анализа результатов принимаемых решений. Создание и использование моделей процесса принятия решений позволяет даже качественно оцениваемые управленческие ситуации оценивать количественно с помощью специально вводимых вербальночисловых шкал.

Использование моделирования процесса принятия управленческих решений позволяет поднять его на качественно новый уровень, разработать и внедрить в практику принятия управленческих решений современные технологии. Именно профессиональное использование моделей процесса принятия решения позволяет руководителю организации контролировать свою интуицию и обеспечивать большую степень непротиворечивости, согласованности и надежности принимаемых управленческих решений. Но с другой стороны, использование моделей позволяет более полно реализовать интуицию, опыт и знания лица, принимающего решение. Необходимо понимать, что модель позволяет найти рациональное решение лишь для того упрощенного варианта ситуации принятия решения, которое используется в модели.

Выделяют три базовых типа моделей: физическая, аналоговая и математическая

Физическая (описательная или портретная) - изображает предмет или ситуацию, показывая как она выглядит. Например: копии автомобилей, самолетов, уменьшенное чертежи завода и т др.

Аналоговая - изображение предмета, или ситуации другими средствами Например: озеро на карте - голубым цветом организационная схема; графики соотношение различных показателей деятельности предприятия

Математическая (символьная) - использование символов для характеристики объекта в виде математических уравнений

На основе этих базовых моделей разрабатываются различные типы моделей и методов принятия управленческих решений. Рассмотрим самые распространенные из них

Теория игр - используется для оценки влияния принятого решения на конкурентов. В бизнесе игровые модели используются для прогнозирования реакции конкурентов на изменение цен, сбыта, новую продукцию Эта модель рустоваться достаточно редкий.

Теория очередей, или оптимального обслуживания - используется для определения оптимального количества каналов обслуживания потребителей относительно их потребностям. Принципиальной проблемой считается уравновешивания расходов на дополнительные каналы обслуживаниями и потерь от обслуживания на уровне ниже, чем оптимальная.

Модель управления запасами - используются для определения времени размещения заказов на ресурсы и их количества, а также массы готовой продукции на складах Цель модели - сведение к минимуму потерь от недостачи или чрезмерного с обеспечения запасами.

Модель линейного программирования - используют для определения оптимального способа распределения дефицитных ресурсов при наличии конкурирующих потребностей (планирование дифференциации услуг, распределение работников и т.д.)

Имитационное моделирование - имитация конкретного процесса или модели, ее экспериментальное использование для определения изменений реальной ситуации

Экономический анализ - оценка издержек, прибыли и рентабельности предприятия часто используют метод безубыточности, т.е. определение момента с которого предприятие становится безубыточным

Прежде чем продолжить рассмотрение проблематики управления знаниями важно определиться с ключевыми понятиями этой области: «данные», «информация», «знания».

В литературе, посвященной управлению знаниями, представлены различные подходы к их трактовке. Не претендуя на полномасштабный анализ, попробуем обозначить некоторые важные моменты.

Под данными понимаются неупорядоченные наблюдения, числа, слова, звуки, изображения. Это – набор дискретных, объективных факторов о событиях. При этом в организационном контексте данные трактуются как структурированные записи об актах деятельности. Организации обычно хранят данные в информационных системах, в которые они поступают из различных подразделений и служб.

Когда данные организованы, упорядочены, сгруппированы категоризированы, они становятся информацией . Она трактуется как совокупность данных, упорядоченная с определенной целью, придающей им смысл.

Сообщение - это текст, цифровые данные, изображения, звук, графика, таблицы и др

Сведения – практически синоним понятия “Сообщения”. Они чаще всего носят бытовой характер.

Знание же трактуется как информация, готовая к продуктивному применению, действенная, снабженная смыслом. Оно представляет собой совокупность оформленного опыта, ценностей, контекстуальной информации, экспертного понимания, составляющих основу для оценки и интеграции нового опыта и информации. Оно формируется и применяется в умах людей, а в организациях зачастую оказывается закрепленным не только в документах и в хранилищах, но также в организационных процедурах, процессах, способах выполнения работы и нормах.

В таблице на основе обзора литературных источников приводятся различные определения знания.

В большинстве рассмотренных определений подчеркивается, что знания – понятие более широкое, глубокое и богатое по сравнению с информацией. Они представляют собой подвижное соединение разных элементов – опыта, ценностей, информации и экспертного понимания - и постоянно меняются; они интуитивны; характерны для людей и являются неотъемлемой частью человеческой сущности с ее непредсказуемостью.

Данные - это тоже знания, однако знания совершенно особого рода. В первом приближении данные -это результат языковой фиксации единичного наблюдения, эксперимента, факта или ситуации . Примерами данных могут быть:

а) «такого-то числа, такого-то года, в момент t в определенной местности шел дождь» (метеорологическое данное)";

б) «цена деловой древесины в такой-то день такого-то года, по сведениям такой-то биржи, составляла столько-то долларов за тонну» (торговое данное);

в) «дефицит государственного бюджета в такой-то стране составлял в таком-то году столько-то миллиардов долларов» (финансовое данное);

г) «в такой-то момент времени автоматическая лаборатория, направляющаяся к Юпитеру, отклонилась от расчетной траектории на столько-то градусов, столько-то тысяч километров в таком-то направлении» (данные из сферы космической технологии).

С технологической точки зрения некоторые специалисты понятие «данные», как правило, определяют как информацию, которая хранится в базах данных и обрабатывается прикладными программами, или информация, представленная в виде последовательности символов и предназначенная для обработки в ЭВМ , т.е. данные включают только ту часть знаний, которые формализованы в такой степени, что над ними могут осуществляться процедуры формализованной обработки с помощью различных технических средств.

Данные - это информация, представленная в формализованном виде, пригодном для автоматической обработки при возможном участии человека . Данные - это информация, записанная (закодированная) на языке машины . Данные - это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства .

Между информацией и данными существует различие; Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. Следовательно, в данный момент времени они не оказывают воздействия на поведение, на принятие решений. Однако данные превращаются в информацию, если такое воздействие существует.

Например, основной массив данных для ЭВМ состоит из таких признаков, которые не воздействуют на поведение. Пока эти данные не организованы соответствующим образом и не отражаются в виде выходного результата, чтобы руководитель действовал в соответствии с ними, они не являются информацией. Они остаются данными до тех пор, пока сотрудник не обратился к ним в связи с осуществлением тех или иных действий или в связи с некоторым решением, которое он обязан принять.

Данные превращаются в информацию, когда осознается их значение. Можно также сказать, что в том случае, когда появляется возможность использовать данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию.

Циклы жизни данных

Подобно веществу и энергии, данные можно собирать, обрабатывать, хранить, изменять их формы. Однако у них есть некоторые особенности. Прежде всего, данные могут создаваться и исчезать. Так, например, данные о некотором вымершем животном могут исчезнуть, когда сжигается кусок угля с его отпечатками. Данные могут стираться, терять точность и т.д. Данные могут быть охарактеризованы циклом жизни (рис. 1.9), в котором основное значение имеют три аспекта - зарождение, обработка, хранение и поиск .

Воспроизведение и использование данных может осуществляться в различные моменты их цикла жизни и поэтому на схеме не показаны.

Рис. 1.9. Цикл «жизни» данных

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

1) данные как результат измерений и наблюдений:

2) данные на материальных носителях информации (таблицы, протоколы, справочники);

3) модели (структуры) данных в виде диаграмм, графиков, функций;

4) данные в компьютере на языке описания данных;

5) базы данных на машинных носителях.

Модели данных

Модель данных является ядром любой базы данных. Появление этого термина в начале 70-х годов двадцатого столетия связывается с работами американского кибернетика Э.Ф. Кодда, в которых отражался математический аспект модели данных, употребляемой в смысле структуры данных. В связи с потребностями развития технологии обработки данных в теории автоматизированных банков информации (АБИ) во второй половине 70-х годов появился инструментальный аспект модели данных, в содержание этого термина были включены ограничения, налагаемые на структуры данных и операции с ними.

В современной трактовке модель данных определяется как совокупность правил порождения структур данных в базах данных, операций над ними, а также ограничений целостности, определяющей допустимые связи и значения данных, последовательности их изменения .

Таким образом, модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными. Исходя из этого, можно сформулировать следующее рабочее определение: модель данных – это совокупность структур данных и операций их обработки.

В настоящее время различают" три основных типа моделей данных: иерархическая, сетевая и реляционная. Иерархическая модель данных организует данные в виде древовидной структуры и является реализацией логических связей: родовидовых отношений или отношений «целое - часть». Например, структура высшего учебного заведения - это многоуровневая иерархия (см. рис. 1.10).

Рис. 1.10. Пример иерархической структуры

Иерархическая (древовидная) БД состоит из упорядоченного набора деревьев; более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. В этой модели исходные элементы порождают другие элементы, причем эти элементы в свою очередь порождают следующие элементы. Каждый порожденный элемент имеет только один порождающий элемент. Организационные структуры, списки материалов, оглавление в книгах, планы проектов, расписание встреч и многие другие совокупности данных могут быть представлены в иерархическом виде.

Основными недостатком данной модели является: а) сложность отображения связи между объектами типа «многие ко многим»; б) необходимость использования той иерархии, которая была заложена в основу БД при проектировании. Потребность в постоянной реорганизации данных (а часто невозможность этой реорганизации) привели к созданию более общей модели – сетевой.

Сетевой подход к организации данных является расширением иерархического подхода. Данная модель отличается от иерархической тем, что каждый порожденный элемент может иметь более одного порождающего элемента. Пример сетевой модели данных приведен на рис 1.11.

Поскольку сетевая БД может представлять непосредственно все виды связей, присущих данным соответствующей организации, по этим данным можно перемещаться, исследовать и запрашивать их всевозможными способами, т.е. сетевая модель не связана всего лишь одной иерархией. Однако для того, чтобы составить запрос к сетевой БД, необходимо достаточно глубоко вникнуть в её структуру (иметь под рукой схему этой БД) и выработать свой механизм навигации по базе данных, что является существенным недостатком этой модели БД.

Рис. 1.11. Пример сетевой структуры

Одним из недостатков рассмотренных выше моделей данных является то, что в некоторых случаях при иерархическом и сетевом представлении рост базы данных может привести к нарушению логического представления данных. Такие ситуации возникают при появлении новых пользователей, новых приложений и видов запросов, при учете других логических связей между элементами данных. Эти недостатки позволяет избежать реляционная модель данных.

Реляционной считается такая база данных, в которой все данные представлены для пользователя в виде прямоугольных таблиц значений данных, и все операции над базой данных сводятся к манипуляциям с таблицами.

Таблица состоит из столбцов (полей) и строк (записей); имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка - конкретный объект. Так, таблица Спортивная секция содержит сведения обо всех детях, занимающихся в данной -спортивной секции, а ее строки представляют собой набор значений атрибутов каждого конкретного ребёнка. Каждый столбец таблицы - это совокупность значений конкретного атрибута объекта. Столбец Вес, например, представляет собой совокупность всех весовых категорий детей, занимающихся в секции. В столбце Пол могут содержаться только два различных значения: «муж.» и «жен.». Эти значения выбираются из множества всех возможных значений атрибута объекта, которое называется доменом. Так, значения в столбце Вес выбираются из множества всех возможных весов детей.

Каждый столбец имеет имя, которое обычно записывается в верхней части таблицы. Эти столбцы называются полями таблицы. При проектировании таблиц в рамках конкретной СУБД имеется возможность выбрать для каждого поля его тип, т.е. определить для него набор правил по его отображению, а также определить те операции, которые можно, выполнять над данными, хранящимися в этом поле. Наборы типов могут различаться у разных СУБД.

Имя поля должно быть уникальным в таблице, однако различные таблицы могут иметь поля с одинаковыми именами. Любая таблица должна иметь, по крайней мере, одно поле; поля расположены в таблице в соответствии с порядком следования их имен при ее создании. В отличие от полей, строки не имеют имен; порядок их следования в таблице не определен, а количество логически не ограничено. Строки называются записями таблицы.

Так как строки в таблице не упорядочены, невозможно выбрать строку по ее позиции - среди них не существует "первой", "второй", "последней". Любая таблица имеет один или несколько столбцов, значения в которых однозначно идентифицируют каждую ее строку. Такой столбец (или комбинация столбцов) называется первичным ключом. В таблице Спортивная секция первичный ключ - это столбец Ф.И.О. (рис. 1.12).

Такой выбор первичного ключа имеет существенный недостаток: невозможно записать в секцию двух детей с одним и тем же значением поля Ф.И.О., что на практике встречается не так уж редко. Именно поэтому, часто вводят искусственное поле для нумерации записей в таблице. Таким полем, например, может быть номер в журнале для каждого ребёнка, который сможет обеспечить уникальность каждой записи в таблице. Если таб.лица удовлетворяет этому требованию, она называется отношением (relation).

Рис. 1.12. Реляционная модель данных

Реляционные модели данных обычно могут поддерживать четыре типа связей между таблицами:

1) Один к Одному (пример: в одной таблице хранятся сведения о школьниках, в другой сведения о прохождении школьниками прививок).

2) Один ко Многим (пример: в одной таблице хранятся сведения об учителях, в другой сведения о школьниках, у которых эти учителя являются классными руководителями).

3) Много к Одному (в качестве примера можно предложить предыдущий случай, рассматривая его с другой стороны, а именно со стороны таблицы, в которой хранятся сведения о школьниках).

4) Много ко Многим (пример: в одной таблице хранятся заказы на поставку товаров, а в другой - фирмы, исполняющие эти заказы, причем для выполнения одного заказа могут объединяться несколько фирм/

Реляционное представление данных имеет целый ряд преимуществ. Оно понятно пользователю, не являющемуся специалистом в области программирования, позволяет легко добавлять новые описания объектов и их характеристики, обладает большой гибкостью при обработке запросов.

Вопросы и задания

1. Дайте определение понятию «данные».

2. Что называется циклом жизни данных?

3. Какие модели данных вы знаете?

4. Укажите преимущества и недостатки каждой модели данных.


ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация - это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания - это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания - это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания - это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач. Неформальные знания - это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному. Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений - это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации. Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.

Взаимосвязь данных, информации и знаний в процессе принятия решений

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.