Например, номер телефона, записанный в таком виде: 380673543211, гораздо хуже запоминается, чем если Вы его структурируете, и запишете так: +380(67)35−43−211. Таким образом, всю информацию, начиная с номеров телефона, и заканчивая большими томами и словарями иностранных языков, необходимо структурировать.

Главная цель структурирования информации — упростить понимание основных элементов, из которых она состоит, а значит, деление на группы должно подчиняться какому-то логическому обоснованию. В процессе упрощения нам становится проще устанавливать между группами, и запоминать всю информацию целиком.

Эффект края

Замечено, что мы лучше запоминаем информацию, которая находится в начале и в конце структурной группы. Данный эффект получил название эффекта края. И он используется при структурировании — важную информацию обычно размещают или в конце, или в начале структурной группы.

Эффект Ресторфф

Этот эффект называют еще эффектом изоляции. Он основан на свойстве человеческой памяти лучше запоминать выделяющиеся объекты среди ряда однородных объектов.

В структурировании информации этот эффект тоже используется — структурные группы делают неоднородными, непохожими одна на другую. В этом случае мы быстрее сможем запомнить то, что в них содержится.

Давайте теперь рассмотрим различные методы структурирования информации, которые часто используются, чтобы сделать процесс запоминания более быстрым и удобным.

Метод римской комнаты

Данный метод называют еще цепочкой Цицерона. Запоминаемые объекты расставляются в знакомом месте, как правило, в комнате, в строго определенном порядке. После этого достаточно вспомнить комнату, чтобы воспроизвести требуемую информацию. Этим методом пользовался в свое время Цицерон, когда готовил свои выступления. Кроме комнаты можно использовать и другие объекты, которые Вам хорошо известны.

Метод ментальных карт Бьюзена

Метод ментальных карт называют еще методом карт памяти, или методом майндмэппинга. Структура информации при его использовании отображается при помощи блок-схем, или майндкарт. Для запоминания информации майндкарту рисуют следующим образом: в центре помещаете название или обозначение, символизирующее содержание всего материала, который нужно запомнить. От этого центра рисуете в разные стороны линии, и размещаете на них цепочки связей, отображая структуру материала.

Структурирование информации является также ничем иным, как размещением ее структурных элементов в определенном порядке. Сам порядок может быть определен по разному. Например, информацию можно расположить в хронологическом порядке, по алфавиту, по возрастнию или убыванию сложности или какого-то другого параметра, по причинно-следственным связям, и так далее.

Когда Вы беретесь за новое дело, или осваиваете новую профессию, составление четкой последовательности действий, очень Вам поможет.

Более подробные сведения Вы можете получить в разделах "Все курсы" и "Полезности", в которые можно перейти через верхнее меню сайта. В этих разделах статьи сгруппированы по тематикам в блоки, содержащие максимально развернутую (насколько это было возможно) информацию по различным темам.

Также Вы можете подписаться на блог, и узнавать о всех новых статьях.
Это не займет много времени. Просто нажмите на ссылку ниже:

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация - это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

    получение качественно нового знания о системе/процессе;

    установление факта и локализация неполноты и/или противоречивости совокупности знаний;

    систематизация, упорядочение некоторой совокупности знаний;

    акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

    сокращение избыточности представления информации;

    согласование представления информации с некоторой системой обработки и интерпретации;

    повышение наглядности отображения информации;

    смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель - это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.

Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

    информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

    информация о функциях системы/процесса;

    информация о структуре системы/процесса;

    информация о динамике системы/процесса;

    информация о состоянии системы/процесса;

    информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

    отношение информации к объекту:

    информация, относящаяся к объекту;

    информация, относящаяся к классу объектов;

    информация, относящаяся к среде;

    отношение информации к некоторому моменту времени:

    информация, относящаяся к прошлому;

    информация, относящаяся к настоящему;

    информация, относящаяся к будущему;

    отношение информации к классу структурной организации:

    информация неструктурированная;

    информация структурированная;

    информация упорядоченная;

    информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации .

Можно ли сказать, что структуризация информации/данных - это нечто новое или незнакомое нам? - Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний - мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, - это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян - русский мат - по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами - запальчиво возразит «патриот»... что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» - то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили - пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация - это иерархически организованная система информационных элементов, обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов . Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

    искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

    натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко - натуральная классификация, красное/зеленое яблоко - искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов :

    при выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

    совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

    понятия, полученные в результате деления должны взаимно исключать друг друга;

    деление должно быть последовательным.

Классификации делятся на следующие виды:

    простые (одноуровневые), например - дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

    сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например - периодическая таблица химических элементов Д.И. Менделеева;

    иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» 71 момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний . Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе - и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной - что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности :

    деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

    деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта . Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе ):

    Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

    Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

    Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

    Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

    Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня) . В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным .

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

    осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

    интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего - экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило 72 , эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта ).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства» . Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности - тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения 73 . В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича 74 , написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных - это тоже модели , описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации - от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе - проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

    выделения «дискретных» состояний (для текстовых описаний - это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

    упорядочивания их во времени (построение сценариев типа «раньше - позже»);

    причинно-следственного связывания (построение сценариев типа «причина - следствие»);

    пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии - воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов. В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.

МЕТОДЫ ПОЭТАПНОЙ СТРУКТУРИЗАЦИИ ЗАДАЧ И ГРУППА МОРФОЛОГИЧЕСКИХ МЕТОДОВ

Особый класс задач структурирования информации представляют собой задачи структурирования целей и задач в условиях, характеризующихся различным уровнем неопределенности. Для их решения существует ряд методов, к числу которых относятся методы поэтапной структуризации задач и группа морфологических методов . Оба класса методов адаптированы к применению в условиях высокой неопределенности. Но те способы, какими решается задача устранения неопределенности, различаются коренным образом: первая группа методов ориентирована на управление процессом постепенного снижения неопределенности, а вторая - на решение задачи синтеза модели за одну итерацию (но в результате может быть получен целый массив альтернативных моделей). Характерно, что при использовании морфологического метода уровень неопределенности может сохраниться прежним, а исходная неопределенность будет перенесена на другой уровень формального описания (хотя, благодаря переходу к формальному представлению, решение задачи понижения неопределенности в некоторых случаях удается поручить средствам автоматизации).

Однако на этом различия не кончаются. Уровень формализации первичной модели, с которой начинается работа каждого их классов методов, также является индивидуальным для разных групп методов. Для методов поэтапной структуризации этот уровень может быть произвольным, а для морфологических методов необходимо, чтобы детальная декомпозиция предметной области уже была произведена и были сгенерированы матричные модели специального строения. И, наконец, последнее различие: метод поэтапной формализации - это метод поэтапного приближения к формальной модели или этапу логически обоснованного выбора решения, а морфологический метод - это метод синтеза альтернатив, подлежащих анализу и оценке. То есть первая группа методов связана с процедурами логического вывода решения, а вторая - с комбинаторным анализом, процедурами перебора решений, в общем случае, полученных без логического вывода.

Методы поэтапной структуризации задач нацелены на проведение процедуры постепенного повышения уровня абстракции и структурной организации описаний (моделей) . Этот класс методов широко распространен при решении задач различного типа (от синтеза формальной модели до синтеза прогноза). Существует два толкования термина «поэтапная структуризация задачи» . В первом случае под задачей понимается задача синтеза модели, и внимание концентрируется на обеспечении и планировании процесса синтеза модели и схемы проведения исследования. В другом случае под задачей понимается некоторая цель управленческой деятельности (в этом случае речь идет именно о процессе структурирования совокупности задач, подлежащих решению в интересах достижения цели, то есть о цели, как объекте формализации).

Поскольку проблему структурирования информации мы достаточно детально рассмотрели, постольку основное внимание сконцентрируем именно на проблеме синтеза и структуризации некоторой совокупности целей и задач.

Особо актуальны эти методы при проведении комплексных междисциплинарных исследований и проведении работ по синтезу планов и прогнозов. К числу этих методов могут быть причислены методы планирования экспериментов и иные методы, имеющие другую отраслевую специфику (например, методы планирования пропагандистских кампаний и т. п.). Еще раз подчеркнем: это не какие-то теоретические абстракции, а методы ведения самых разнообразных, и, прежде всего, прикладных исследований, методы, актуальные в самых разных отраслях деятельности человека.

Процесс поэтапной структуризации задач можно сравнить с кропотливым процессом выращивания фруктового дерева - только в нашем случае дерево вырастает необычное - дерево целей и задач. Это дерево растет кроной вниз - корень (глобальная цель) размещается вверху, а ветви, отображающие различные связи с подчиненными задачами, функциями и т. д., растут вниз.

Действительно, процесс этот весьма сложен и состоит из многих этапов, из которых первым и наиважнейшим является выбор корректной формулировки глобальной цели . Впрочем, и все дальнейшие процедуры, связанные с построением дерева целей не менее ответственны, но глобальная цель задает направление всей дальнейшей деятельности, а значит, ее выбор и ясность формулировки определяют успех не только процедуры синтеза дерева целей и задач, но и всей последующей деятельности.

Перечислим наиболее существенные требования, предъявляемые к получаемой в результате работы древовидной иерархической модели. К числу этих требований относятся:

    полнота и достаточность для описания основных критериев принятия решения;

    компактность (минимальный уровень декомпозиции при заданной полноте);

    конкретная цель, функция, задача или объект, расположенные в узлах модели, должна появляться в дереве только один раз;

    лицо, принимающее решение, должно быть в состоянии представлять и анализировать отдельные ветви дерева независимо.

Причины, по которым выдвинуты такие требования, очевидны: наличие дублирования модельных элементов препятствует однозначной интерпретации и способно привести к некорректному установлению количества потребных ресурсов и иным нежелательным последствиям. По своей идеологии модели типа деревьев целей и задач наследуют свойства классификаций, стратифицированных моделей и моделей иерархических систем.

Существует несколько подходов к построению дерева целей и задач или, как его часто называют в отечественной литературе, прогнозного графа . Одна часть подходов рассчитана на краткосрочную перспективу , то есть, разработчики исходят из предположения, что за период реализации замысла окружающая обстановка не претерпит существенных изменений, либо эти изменения не затронут основных тенденций развития обстановки. Другая часть адаптирована к решению задач стратегического планирования , для которого интервал времени реализации замыслов существенно превышает интервал сохранения стабильной обстановки, а сохранение тенденций изменения обстановки не может быть гарантировано.

Кроме того, многое зависит от «направления» конструирования дерева (оно может строиться сверху вниз, снизу вверх, существует также и метод встречного проектирования) . В первом случае от глобальной цели вниз начинает последовательно развертываться древовидная структура, в которой с переходом от уровня к уровню поэтапно снижается неопределенность функционального, операционного и иных видов, в результате чего на самом нижнем уровне могут быть сформулированы конкретные требования к составу и количеству ресурсов, инструментальных средств и методик. Во втором случае речь идет о том, что состав ресурсов, инструментальных средств и методик не подлежит коррекции, а дерево выстраивается снизу вверх с соблюдением введенных в качестве критериев приемлемости решений базовых ценностей. Для второго подхода характерно, что цель существует как некий идеал, а структура подзадач, задач и функций, а также методы их решения примерно установлены и могут претерпевать изменения в некоторых, достаточно жестко заданных, рамках. Строгие количественные критерии на начальном этапе, как правило, не заданы: числа появляются как результат постепенного подъема по иерархии, а наибольшая неопределенность существует именно на верхнем уровне (как оценка степени близости к поставленной цели). Такой подход был характерен для осуществления планирования в СССР - он однозначно «экологичнее» рыночного и исключает кризисы перепроизводства, но мало способствует совершенствованию системы (она просто настраивается). Метод встречного проектирования пригоден для решения задач, связанных с разрешением ситуаций, вызванных изменением внешней ситуации, когда реконструкции (реинжинирингу) подлежит средний слой иерархии (то, что в народе принято называть «сведением концов с концами»).

Остановимся на подходе к построению дерева целей и задач, рассчитанных на краткосрочную перспективу. В этом случае условия полагаются известными, в результате чего глобальная цель подлежит декомпозиции на совокупность функций, задач и подзадач без учета многообразия вариантов обстановки, в которой они будут решаться. Для оценивания того, решена ли та или иная задача (подзадача) определяется перечень свойств, которыми должны обладать те материальные объекты, посредством которых может быть получено решение задачи, а также вводятся мера качества решения задачи (например, стоимостная эффективность) и функция оценивания (вычисления меры качества). Далее определяются потребности в ресурсах, инструментальных средствах и методиках, обеспечивающих решение поставленных задач. В условиях действия системы ограничений и на случай непредвиденного перерасхода ресурсов в подобную модель вводятся весовые коэффициенты, отражающие систему приоритетов и соответствующие системе ценностей субъекта целеполагания.

В случае, когда синтезируется дерево целей и задач на период, превышающий период параметрической, структурной и функциональной стабильности системы, прибегают к приемам стратегического планирования . Отличием такого подхода является то, что этапу синтеза дерева целей и задач предшествует этап построения пространства альтернатив - то есть, пространства в котором некоторая группа избранных параметров образует «систему координат», определяющую топологию системы, функции и состояние ее элементов в некоторый момент времени. Достоинством такого подхода является то, что в такой системе координат могут быть выбраны экстремальные точки, в которые система может перейти в случае развития тех или иных тенденций - для таких точек с необходимой степенью детализации прописываются параметры системы, обеспечивающие разработчиков модели достаточной для синтеза дерева целей и задач информацией. Для каждой из точек (альтернативных миров) выстраивается адекватная конфигурация дерева (по схеме, аналогичной той, которая используется при синтезе дерева целей и задач, рассчитанных на краткосрочную перспективу). После этого предпринимается попытка сведения полученных деревьев к единой конфигурации, для каждого из узлов и операций оцениваются риски, как вероятность скатывания к негативным сценариям развития ситуации, а также назначаются веса элементов дерева, отражающие степень их важности для достижения поставленной глобальной цели.

Рисунок 2.6 - Фрагмент реального дерева целей и задач с весами, проставленными в результате экспертного опроса 75 .

На рис. 2.6 приведен фрагмент дерева целей и задач, на котором проставлены веса относительной важности достижения целей. Заметим, что сумма весов целей одного уровня иерархии равна 1 (в случаях же, когда веса выставляются в процентной мере, сумма будет равна 100 %). В нашем примере, где числа представлены в виде десятичных дробей, очевидна вероятностная природа оценок. Веса могут быть как вычислены аналитически, так и получены в ходе экспертного опроса.

Чаще всего на этапе расстановки весовых коэффициентов прибегают к методам экспертной оценки, в том числе - с применением метода Дельфи. Заметим, что изначально метод Дельфи применялся именно для определения приоритетов, то есть, для расстановки весовых коэффициентов. Причем такой подход в равной степени применим как в отношении краткосрочных задач, так и в отношении задач перспективного планирования.

При синтезе дерева целей и задач методом встречного проектирования процедура состоит в согласовании верхнего и нижнего уровней иерархии целей, для чего рассматриваются варианты согласования целей и задач, перераспределения ресурсов и инструментов между субъектами деятельности. Этот подход представляет собой, пожалуй, наиболее интересный вариант решения проблем в сфере, связанной с решением социальных проблем, организацией коллективной деятельности в интересах достижения корпоративной цели. Здесь целесообразно рассматривать различные подходы к социализации целей (их доведения до прочих субъектов деятельности), созданию коалиций, выделению корпоративного ресурса, созданию организационного ресурса и иные аспекты управленческой деятельности. Кроме того, эти методы могут использоваться и в сфере проектирования сложных технических комплексов, информационных систем и иных систем искусственного происхождения.

Основной задачей такой деятельности является гармонизация отношений, повышение эффективности процессов потребления ресурсов, оптимизация информационных процессов и материально-преобразовательной деятельности в целом. При использовании этих методов основными объектами исследования являются цели и мотивы деятельности отдельных субъектов, их групп и объединений, а также ресурсы, связанные с ними. Отраслью применения метода встречного проектирования являются управление социальными, организационно-техническими, экономическими и иными системами, включающими в себя элементы, наделенные способностью к целеполаганию.

Все перечисленные методы чрезвычайно интересны, однако их подробное рассмотрение в рамках этого раздела не представляется возможным. Тем не менее, к этой проблеме в рамках нашего повествования мы еще вернемся.

Морфологические методы представляют собой особый класс методов решения сложных проблем в условиях высокой неопределенности. Даже те вводные замечания, которые мы дали, характеризуя эту группу методов, говорят об их специфичности.

Сразу оговоримся, что морфологический анализ, который мы упоминали в подразделе, посвященном теоретическим основам системного анализа, не имеет почти ничего общего с тем, что нам предстоит рассматривать здесь. Когда мы говорили о морфологическом анализе, то речь шла о возможности выведения многих свойств системы из ее структуры и возможности обратной процедуры, понимая под структурой системы описание системы отношений между элементами, выполняющими сходные функции, системы управления ими - то есть, осуществляли агрегацию или декомпозицию с тем, чтобы вывести из полученной модели свойства системы. На уровне определения отделить морфологический анализ от морфологических методов сложно, поскольку в основе лежат методы исследования структуры и топологии, но различие в другом - в уровне неопределенности и способе ее проявления.

В случае морфологического анализа типовые вопросы к аналитикам звучат так:

    «Ребята, вот, смотрите какую штуку я вам приволок! Интересно, что там внутри? Но только, чур, не разбирать - у меня одна такая!»

    «Тут нашим удалось вот такую схему добыть... Мне сказали, что вы с похожими уже работали. Что бы это могло быть?»

В случае же с морфологическими методами вопросы иные:

    «На месте аварии этой штуки мы обнаружили вот такие обломки... Соберете что-нибудь, способное передвигаться под водой, по воде, над водой и по земле - озолочу!»

    «Председатель сказал, чтоб к завтрему была косилка. Я тут приволок, что в гараже валялось... Сможете?»

Как видим, морфологические методы - это совсем иное: с их применением решается задача синтеза системы с заданными свойствами, но обладающей неизвестной структурой и/или составом. В качестве элементов такой системы могут выступать объекты различной природы: от материальных объектов различной сложности до идеальных (модельных) объектов типа сценариев, целей и задач.

Сущность морфологических методов - в использовании комбинаторного анализа для синтеза сложных систем с заданными свойствами в условиях существования ограничений (объективных и/или субъективных) на сочетаемость элементов, входящих в некоторое базовое множество. В классической форме метод был предложен швейцарским астрономом Ф. Цвикки и состоял в реализации следующей совокупности этапов:

    Описание желаемых функциональных свойств системы;

    Составление исчерпывающего перечня основных функций системы;

    Составление перечня альтернативных способов реализации каждой функции;

    Генерирование множества возможных вариантов реализации системы, каждый из которых представляет собой цепочку, включающую по одному способу реализации каждой из перечисленных функций;

    Оценивание рисков и эффективности вариантов;

    Выбор предпочтительного варианта.

После того, как перечень основных функций составлен, для синтеза вариантов их реализации составляется морфологическая таблица, содержащая перечень альтернативных способов реализации каждой функции. Далее наступает очередь проблемы в целом, для которой также выстраивается морфологическая таблица.

В чем смысл морфологической таблицы? Смысл в том, что данная таблица в наглядной форме отображает все возможные варианты решения проблемы, для чего в каждой строке помещается вариант решения проблемы, хотя бы в одной из деталей реализации отличающийся от прочих, а в столбцах же содержится полное множество вариантов реализации каждой из функций. Это похоже на полный перечень комбинаций, набор которых возможен на дисковом кодовом замке, с тем лишь отличием, что количество щелчков-вариантов для каждого колесика может быть своим.

Общее число теоретически возможных вариантов в этом случае равно произведению числа способов реализации отдельных функций, что уже при сравнительно небольшом количестве функций и вариантов их реализации может приводить к «комбинаторному взрыву» (операция умножения коварна - вариантов может быть получено столько, что их анализ в рамках имеющихся временных ограничений не представится возможным). Во избежание этого в алгоритмах анализа предусматривается возможность введения ограничений на использование запрещенных (непродуктивных) комбинаций элементов.

В принципе, уровень детализации описаний определяется спецификой проблемы: в одних случаях функции подвергаются дальнейшему дроблению на элементарные операции, характеризующиеся набором вариантов их реализации, в других - довольствуются меньшей степенью детализации. То есть, метод может оперировать с описаниями различной степени «прорисовки» деталей, но при этом следует помнить о проблеме размерности.

Позже Ф. Цвикки существенно расширил арсенал методов морфологического анализа, дополнив его следующими методами:

    методом систематического покрытия поля;

    методом отрицания и конструирования;

    методом морфологического ящика;

    методом экстремальных ситуаций;

    методом сопоставления совершенного с дефектным;

    методом обобщения.

Каждый из методов имеет свою область применения, однако в их основе - все те же процедуры, обеспечивающие максимально полное привлечение знаний о системе для синтеза нового знания путем структурирования и упорядочения имеющихся. Весьма широко применяется метод отрицания и конструирования, позволяющий, в том числе, проверить полноту заполнения морфологической таблицы (ящика) на предмет наличия в ней как утверждения, так и его отрицания (в противном случае таблица не полна, хотя это и не всегда необходимо). Метод отрицания и конструирования исходит из предположения, что не все ограничения, используемые в некоторой предметной области, являются универсальными или обоснованными.

Морфологические методы получили широкое распространение в области изобретательской и рационализаторской деятельности и легли в основу ТРИЗ (теории рационализаторской и изобретательской деятельности) и АРИЗ (теории алгоритмизации рационализаторской и изобретательской деятельности). А подходы последних были распространены на многие отрасли, связанные с творческой деятельностью.

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация - это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

Получение качественно нового знания о системе/процессе;

Установление факта и локализация неполноты и/или противоречивости совокупности знаний;

Систематизация, упорядочение некоторой совокупности знаний;

Акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

Сокращение избыточности представления информации;

Согласование представления информации с некоторой системой обработки и интерпретации;

Повышение наглядности отображения информации;

Смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель - это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.



Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

Информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

Информация о функциях системы/процесса;

Информация о структуре системы/процесса;

Информация о динамике системы/процесса;

Информация о состоянии системы/процесса;

Информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

- отношение информации к объекту:

Информация, относящаяся к объекту;

Информация, относящаяся к классу объектов;

Информация, относящаяся к среде;

- отношение информации к некоторому моменту времени:

Информация, относящаяся к прошлому;

Информация, относящаяся к настоящему;

Информация, относящаяся к будущему;

- отношение информации к классу структурной организации:

Информация неструктурированная;

Информация структурированная;

Информация упорядоченная;

Информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации .

Можно ли сказать, что структуризация информации/данных - это нечто новое или незнакомое нам? - Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний - мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, - это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян - русский мат - по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами - запальчиво возразит «патриот»... что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» - то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили - пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация - это иерархически организованная система информационных элементов, обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов . Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

Искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

Натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко - натуральная классификация, красное/зеленое яблоко - искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов :

При выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

Совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

Понятия, полученные в результате деления должны взаимно исключать друг друга;

Деление должно быть последовательным.

Классификации делятся на следующие виды:

Простые (одноуровневые), например - дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

Сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например - периодическая таблица химических элементов Д.И. Менделеева;

Иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний . Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе - и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной - что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности :

Деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

Деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта . Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе ):

1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня) . В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным .

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

Осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

Интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего - экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило, эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта ).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства» . Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности - тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича, написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных - это тоже модели , описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации - от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе - проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

Выделения «дискретных» состояний (для текстовых описаний - это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

Упорядочивания их во времени (построение сценариев типа «раньше - позже»);

Причинно-следственного связывания (построение сценариев типа «причина - следствие»);

Пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии - воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов. В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.

Вопросы структурирования информации весьма востребованы в современном мире ввиду того, что пространство перенасыщено различной информацией. Именно поэтому возникает потребность в правильной интерпретации и структурировании большого количества данных. Без этого невозможно принимать важные управленческие и экономические решения, основываясь на каких-либо знаниях.

Общие сведения

Существует очень много методов структурирования информации. Это вызвано тем, что существует также огромное количество способов ее представления и организации. Об этом надо помнить, ведь информация бывает очень различной по свойствам. Большую роль при этом играет то, какие именно средства или каналы восприятия задействуются при вводе или выводе данных, какой уровень структурированности имеет информация изначально и относится ли она к числовому, графическому, текстовому или другому типу. Важнейшую роль играет окончательная цель, ради которой необходимо структурировать данные.

Цели

Анализ и структурирование информации всегда преследуют определенные цели, и на самом деле их довольно много. От правильной постановки цели во многом зависит конечный результат. Отметим главное классы целей:

  • Получение новых знаний по определенному процессу.
  • Проверка информации на неполноту или противоречивость.
  • Необходимость систематизации и упорядочивания знаний.
  • Акцентирование внимания на некоторых аспектах.
  • Сокращение информации для избавления от перенасыщения.
  • в более наглядном и понятном виде.
  • Использование обобщений и абстракций при описании.

В зависимости от того, какие цели мы преследуем, применяются технологии и методы структурирования. Но как мы знаем, классификация - это не конечный фактор, который определяет метод упорядочивания. Именно поэтому важно определить вид информации и способы ее представления.

Классификация информации

Рассмотрим классификацию по сущности и содержанию знаний:

  • О целях и ценностях для нужд планирования и прогнозирования.
  • О функциональных особенностях.
  • О структуре.
  • О динамических изменениях.
  • В целом о состоянии.
  • О задачах.

Данная классификация представлена в порядке убывания актуальности. Так, наиболее важной является информация о целях, ведь именно исходя из нее определяются конечные потребности пользователя. Остальные же классы сравнительно независимы друг от друга, они лишь позволяют уточнять и дополнять уже имеющиеся данные для отражения их полноты. Такое размещение вполне обоснованно, потому что дает возможность решать быстро и эффективно прикладные задачи, но практически не применяется при решении сложных задач, требующих компьютерного анализа.

Основы классификации и структурирования информации базируются и на других признаках:

1. Информация, имеющая отношение к чему-либо

  • К объекту.
  • К нескольким объектам.
  • К среде.

2. Привязка к временному аспекту

  • Прошлое.
  • Будущее.
  • Настоящее.

3. Класс структурной организации

  • Структурированный.
  • Неструктурированный.
  • Упорядоченный.
  • Формализованный.

Несмотря на кажущуюся сложность всех классификаций, хочется сказать о том, что структуризация информации - это простой процесс, который мы воплощаем в жизнь каждый день. Проблема понимания этого вопроса заключается лишь в том, что мы не задумываемся о том, насколько это многогранный и обширный вопрос, делаем все автоматически. Если же погрузиться в исследование этой темы с профессиональной точки зрения, то окажется, что структуризация информации решает множество задач, помогая нам построить собственную систему знаний и использовать ее для дальнейшего развития или решения задач как на бытовом уровне, так и на профессиональном.

Что же такое классификация?

Сбор и структурирование информации невозможно без понятия классификации, которое мы частично рассмотрели в предыдущих абзацах. Но все же стоит подробнее разобраться с этим понятием. Классификация - это некая система информационных элементов, которая обозначает реальные объекты или процессы и упорядочивает их по определенным схожим или различным признакам. Чаще всего это процедура проводится для того, чтобы исследование было более удобным.

Существует два вида классификаций. Первая, искусственная, осуществляется по неким внешним чертам, которые не отражают настоящую сущность объекта, и позволяет упорядочить лишь поверхностные данные. Второй вид - это натуральная или естественная классификация, которая проводится по существенным признакам, которые характеризуют сущность объектов и процессов. Именно натуральная классификация - это научный инструмент, который используют для изучения закономерностей объектов и процессов. При этом нельзя сказать, что искусственная классификация абсолютно бесполезна. Она позволяет решать ряд прикладных задач, но сама по себе довольно ограничена.

От того, насколько качественно была выполнена процедура классификации, во многом зависит дальнейший исход исследования. Это вытекает из того, что разграничение по признакам проводится на ранних этапах, а если на них допустить ошибку, то дальнейшие исследования пойдут некорректным путем.

Важные принципы

Приемы структурирования информации требуют соблюдения определенных принципов, позволяющих быть уверенными в достоверности результатов:

  • Необходимость каждую операцию разделить на классы и использовать только один основополагающий признак. Это позволяет отсеять лишнюю информацию и сосредоточиться на основных моментах.
  • Полученные группы должны быть логически связанными и выстроенными в определенном порядке по признаку важности, времени, интенсивности и так далее.

Правило Миллера

Закономерность носит название 7 ±2. Ее открыл американский ученый и психолог Джордж Миллер после проведения большого количества экспериментов. Правило Миллера заключается в том, что кратковременная человеческая память способна в среднем запомнить 7 букв алфавита, 5 простых слов, 9 чисел, состоящих из 2 цифр, и 8 десятичных чисел. В среднем это представляет группу в количестве 7 ±2 элементов. Это правило применимо во многих областях, активно используется для тренировки человеческого внимания. Но его также применяют для структурирования информации, опираясь на то, сколько сможет осилить человеческий мозг.

Принцип края

Этот эффект основывается на том, что человеческий мозг лучше запоминает информацию в начале или в конце. Исследованием этого принципа занимался ученый из Германии в XIX веке. Именно он считается его открывателем. Интересно, что в нашей стране об этом принципе узнали после фильма про приключения Штирлица, в котором главный герой использовал его для переключения внимания своего противника.

Эффект Рестрофф

По-другому этот эффект называется эффектом изоляции, и заключается он в том, что когда объект выделяется из ряда похожих, то запоминается гораздо лучше других. Другими словами, можно сказать что сильнее всего мы запоминаем то, что более всего выделяется. Подсознательно этот эффект используют абсолютно все люди, которые хотят, чтобы их заметили. Каждый человек замечал, что это работает, когда, помимо его воли, внимание привлекала яркая одежда, выделяющаяся из толпы, причудливой архитектуры дом, выглядывающий из серой улицы, или красочная обложка из-под груды одинаковых.

В структурировании информации эффект Рестрофф используется для того, чтобы различные групп информации были не похожи друг на друга. Это обеспечивает их более быстрое легкое понимание. Таким образом, если каждый элемент будет неоднозначным и интересным, то мы запомним его гораздо быстрее.

Методы структурирования информации

Процесс изучения человеческого мозга не проходит зря. Ученые вывели несколько методик и способов структурирования информации, которые позволяют сделать запоминание намного более удобным. Мы поговорим об основных и самых популярных способах.

Метод римской комнаты, или цепочка Цицерона, - это очень простой, но эффективный метод для усвоения материала. Он заключается в том, что запоминаемые объекты необходимо мысленно расставить в вашей комнате или той, которую вы очень хорошо знаете. Главное условие в том, что все предметы должны быть расставлены в строгом порядке. После этого для того, чтобы вспомнить необходимую информацию достаточно вспомнить комнату. Именно так и делал Цицерон, когда готовился к выступлению. Он гулял по своему дому, мысленно расставляя акценты, чтобы суметь вернуться к важному моменту по ходу своего выступления. Не стоит ограничиваться комнатой, можно попробовать размещать желаемую информацию на знакомой улице, рабочем столе или другом объекте, который вам хорошо известен.

Метод ментальных карт, или метод Бьюзена, - это простой способ графического изображения информации при помощи схем. Часто этот метод называют майндмэппинг, из-за того что необходимо строить ассоциативные карты. Такой способ запоминания стал довольно популярным в последнее время. Подобные карты рекомендуют составлять психологи и различные тренеры для того, чтобы правильно ставить цели и понимать свои настоящие желания. Но первоначальная цель ментальных карт заключалась именно в том, чтобы быстрее запоминать и структурировать информацию. Для того чтобы составить натальную карту, вам понадобится:

  • Материал, который вы захотите изучить.
  • Большой лист бумаги.
  • Цветные ручки и карандаши.

После этого нарисуйте в центре листа символ или рисунок, который ассоциируется с темой, которую вы хотите запомнить, или отображает ее суть. После этого по направлению к центру рисуйте различные цепочки связей, которые отражают ту или иную сторону изучаемого объекта. В результате для того, чтобы вспомнить нужную информацию, вам не придется просматривать списки или читать пол-учебника. Вы сможете сразу вспомнить главную идею, посмотрев на нее в центре листа, а потом, двигаясь по отходящим ветвям, вспомнить конкретно то, что вам нужно.

Методы поэтапной структуризации

Естественно, что структурирование цифровой информации представляет собой более сложный процесс. Особую сложность представляют задачи, которые характеризуются разным уровнем неопределенности. Для того чтобы решить их, следует прибегать к ряду методов, которые можно объединить в методы поэтапной структуризации и морфологические методы. Оба эти вида адаптированы для того, чтобы их можно было использовать в условиях высокой неопределенности.

Но существенным образом они отличаются в том, какой способ будет использоваться. Первая группа нацелена на то, чтобы постепенно снижать неопределенность задачи, в то время как вторая группа нацелена на решение посредством создания моделей за одну итерацию.

Стоит отметить, что при использовании морфологического метода неопределенность может совершенно не меняться, она просто будет перенесена на другой уровень описания. Оба метода начинаются с того, что исследуется уровень формализации. Но если для методов поэтапной структуризации уровень может быть любым, то для морфологических методов важна детальная декомпозиция и последующее генерирование матричных моделей. Другими словами, можно сказать, что морфологические методы чаще всего используются с мощной компьютерной техникой, потому что человеческий мозг не в состоянии обрабатывать такие массивы информации.

Методы поэтапной структуризации направлены на то, чтобы найти логические взаимосвязи, а морфологические методы не ставят перед собой задачу найти логический вывод, но они проводят тщательный комбинаторный анализ и сортируют информацию более тщательно и глубоко.

Однако эффективность работы заключается в том, чтобы использовать оба эти метода. Структурирование цифровой информации требует комплексного подхода. Именно по этой причине важно не только использовать самые доступные методы, но и прибегать к планированию, экспериментам и другим методам отраслевой специфики.

Технология структурирования информации во многом зависит от того, насколько детально должна быть проделана работа. Так, при структурировании в первую очередь учитывается специфика отрасли.

Анализ и структурирование информации очень выгодно рассматривать в разрезе семиотики. Это подход, который интерпретирует любое способы представления информации как одну из разновидностей текста. Использование знаковой системы позволяет максимально упростить и облегчить понимание информации. Так, при графическом представлении мы используем целый ряд методов, которые позволяют переходить от тональности к контрасту, от насыщенности к яркости и так далее. Все это позволяет упрощать распознавание данных и транслировать их для других знаковых систем. Но поскольку графические модели несколько ограничены, то извлечь из них информацию чаще всего проще с использованием модели интерпретации.

Структурирование информации в медиатеке ПК и серверов

Мы подробно рассмотрели вопросы структурирования, но не затронули вопрос в разрезе цифровой информации. В современном мире информационные компьютерные технологии внедряются во все сферы жизни. Поэтому игнорировать их просто невозможно. Последнее время большое развитие получили информационные медиатеки, которые используются в школах, высших учебных учреждениях, техникумах. Медиатеки ПК и серверов объединяют в себе методические учебные пособия, звукозаписи, фонды книг, видеофайлы, компьютерные презентации, а также техническое обеспечение, необходимое для выведения всей перечисленной информации. На сегодняшний день каждое образовательное учреждение создает свою медиатеку, регулярно пополняемую новой информацией, зафиксированной на различных носителях. Это позволяет развивать самостоятельную работу учащихся с телекоммуникациями и электронными каталогами. Функции, которые выполняет медиатека, следующие:

  • Структурирование информации с использованием информационных моделей для хранения дипломных работ учащихся рефератов, презентаций и так далее.
  • Полная автоматизация работы с библиотекой.
  • Обновление и хранение учебных общеобразовательных материалов в электронной форме.
  • Хранение справочно-информационных пособий.
  • Неограниченный доступ к сетевым ресурсам и электронным библиотекам.
  • Хранение и просмотр фото- и видеофайлов образовательного учреждения.
  • Поиск необходимой информации по запросу.
  • Оперативная работа с любыми источниками информации.

Важную роль играет структурирование хранения информации. Для этого учреждениям необходимо владеть мощными серверами, которые бы гарантировали невредимость и сохранность данных. Именно поэтому к вопросу необходимо подходить грамотно и профессионально, ведь в случае ошибки упущенные данные можно не вернуть.

Структурирование информации в медиатеке ПК требует наличия мощного компьютерного оборудования, включая мобильные устройства, ноутбуки, зарядные устройство и так далее. Только высококачественное оборудование позволит обеспечивать полноценную работу с материалами одновременно для всех пользователей. Также очень важно завести центральный сервер, на котором будут храниться данные. Чаще всего сервера устанавливаются в библиотеках. Установка беспроводной сети позволяет каждому преподавателю или учащемуся получать доступ ко всем материалам с ноутбука, не выходя из дома.

Структурирование информации в базах данных

База данных - это некая совокупность данных, которые совместно используются персоналом предприятия, региона, учащимися вуза и так далее. Задача баз данных состоит в том, чтобы можно было хранить большой объем информации и предоставлять их по первому запросу.

Правильно спроектированная база данных полностью исключает избыточность данных, благодаря чему риск хранения противоречивой информации сводится к минимуму. Исходя из этого, можно сказать, что создание баз данных в современном мире преследует две основные цели - это повышение надежности данных и понижении их избыточности.

Жизненный цикл программного продукта состоит из стадий проектирования, реализации и эксплуатации, но основной и ключевой является стадия проектирования. От того, насколько грамотно она продумана, насколько четко определены связи между всеми элементами, зависит информационная насыщенность и общая производительность.

Правильно спроектированная база данных должна:

  • Гарантировать целостность данных.
  • Исследовать, находить и удалять противоречивости.
  • Обеспечивать легкое восприятие.
  • Позволять пользователю структурировать информацию и вносить новые данные.
  • Удовлетворять требования производительности.

Перед проектированием базы данных проводят тщательный анализ требований пользователей к будущему программному продукту. При этом от программиста требуется знание основных правил и ограничивающих факторов для того, чтобы грамотно выстроить логические взаимосвязи между запросами. Очень важно правильно проработать поисковой атрибут для того, чтобы пользователи могли по несортированным ключевым словам находить желаемую информацию. Также надо помнить, что чем больший объем информации хранит в себе база данных, тем важнее для нее вопрос производительности, ведь именно при максимальных нагрузках становятся видны все недочеты.

Роль информации в современном мире

Способы структурирования информации, которые мы рассмотрели, направлены на то, чтобы максимально облегчить доступ к данным, хранение их в цифровом или материальном виде. Все они в своей сущности довольно простые, но для их понимания необходимо осознание того, что информация - это лишь абстрактное понятие.

Ее сложно измерить, потрогать или увидеть в той или иной конкретной форме. С точки зрения структурирования информации любой объект представляет собой лишь набор определенных данных и характеристик, которые мы можем представить и разбить на какие-то составные части.

При этом понимание ключевых отличий объектов базируется на том, что мы сравниваем его значения с нормой или с тем объектом, который мы используем для сравнения. Для того чтобы научиться быстро и эффективно структурировать информацию, важно понимать, что она представляет собой всего лишь набор определенных характеристик, свойств и параметров. Научившись правильно с ними обращаться и классифицировать, можно решить множество бытовых и профессиональных задач.

Также важно помнить, что информация всегда может быть записана, изображена или представлена другим способом. Говоря иными словами, если вы чего-то не понимаете, необходимо настолько разбить эту тему на подробные элементы и вникнуть в их суть, чтобы не осталось ничего, чего нельзя было бы объяснить простым языком.

В бытовом плане большинство довольно легко решает такие задачи, изобретая интеллектуальные карты и используя особенности своего мозга, открытые учеными. Но в профессиональном плане структурирование информации до сих пор остается довольно сложной задачей, поскольку ее количество ежедневно и ежеминутно растет.

По сути, вся эволюция человека - это процесс накопления знаний. Но при этом, чтобы эффективно работать, необходимо понять основные принципы структурирования информации, о которых мы тоже говорили ранее. Их не так много. Однако понимание — это ключ к обработке огромных массивов информации и их запоминанию.

Структурирование информации

Нежданов Игорь

Еще одним довольно простым способом анализа получаемой информации является ее структурирование. Структурирование есть ни что иное, как расположение в определенном порядке, или по определенной схеме. Такой порядок может быть определен по разному. Наиболее яркий пример это расположение информации в хронологическом порядке. Например информацию из разных источников о неком событии располагают в последовательно от более раннего к более позднему (или наоборот), т.е. в соответствии с временем которое описывается данным блоком информации.

Другой способ структурирования информации это расположение каждого блока информации в разных разделах в зависимости от того элемента, который описывает данный информационный блок. Далее предлагаю более подробно ознакомиться с разными способами структурирования информации. Отличаются они в основном тем, по какому принципу происходит структурирование.

Расположение в хронологическом порядке или построение последовательности событий.

Данный метод еще называют историческим. Все поступающие данные выстраиваются по времени описываемых событий. После чего определяется:
- что за чем следует,
- какой факт какое событие предопределяет,
- что чему сопутствует и т.п.
Иначе говоря восстанавливается хронология событий. Это один из наиболее простых способов и в то же время достаточно эффективных. Он используется в самых разных исследованиях.

Самый простой пример использования исторического метода (хронологии) это изучение кандидата при его приеме на работу. У вас есть ряд источников: резюме кандидата, его трудовая книжка, заполненная им анкета. Кроме того вы можете использовать Интернет для выявления его мест работы (по оставленным им-же объявлениям и заявкам) или базы данных. Собрав всю эту информацию вы составляете несколько последовательностей (хронологий):

1 - как кандидат хочет выглядеть (по его резюме и анкете);
2 - как было на самом деле (по его трудовой книжке);
3 - вспомогательный вариант (по всем остальным источникам).

Еще один вариант использования хронологии это построение цепочки событий. Например для восстановления полной картины некоего события - что за чем следовало, что причиной чего являлось…. При этом особенно ценно если аналогично рассматриваются и параллельные происшествия, или события рассматриваются с учетом известного происшествия, тогда многое становиться понятно в силу «совпадений» и разного рода корреляций.

Кроме того данный метод можно использовать для выявления обмана (подтасовки фактов) в изложении версий конфликта разными сторонами этого конфликта. Строятся параллельные последовательности событий по версиям всех источников информации. А далее происходит «сравнение показаний». Если о наличии некоего действия в определенное время говорят все участники, то скорее всего так и было….

Привязку событий к определенному происшествию используют для выявления поведенческих реакций объекта, правда это уже моделирование, но для регистрации и анализа используется все тот же исторический метод (хронология событий). В определенной среде это называется провоцированием. Например объекту дают некую «горящюю» информацию, информацию требующую немедленных действий (присылают по почте, передают как слух, сообщают официально и т.п.), а затем внимательно наблюдают:

Что и в какой последовательности он предпримет;
- к кому обратится в первую очередь;
- как в принципе отреагирует на сообщение и т.д.

Можно данное мероприятие обставить соответствующим образом. Например ограничить объект в перемещении или в связи, создать впечатление, что у него практически нет времени на обдумывание и т.п.. Все зависит от того, что вы хотите понять (выявить). Для упрощения восприятия ситуации, результат можно изобразить схематически. Если несколько последовательностей изобразить в одном масштабе и одним стилем, то при их совмещении можно выявлять закономерности, корреляцию и т.п..

Составление перечня источников.

Это структурирование данных об источниках информации по какому то вопросу. Составляя такой перечень нужно давать краткую характеристику каждому источнику в зависимости от целей составления списка и от общей задачи:

Название;
- автор;
- кто опубликовал;
- когда опубликовано;
- канал поступления;
- основная тематика;
- основная аудитория;
- компетентность (качество информации);
- тенденциозность в изложении;
- аффилированность (ангажированность);
- позиция по отношению к теме ваших исследований.

В результате такой систематизации вы получаете общую картину информационного поля, на котором работаете. И как следствие быстро и правильно ориентируетесь в случае появления чего то нового, необычного, неожиданного. Или сможете понять какой источник более важен для вас в свете изучаемой проблемы.

Анализ тенденций.

Еще одна разновидность исторического метода (хронологии) это анализ тенденций. Фактически это структурирование информации по одной из характеристик (показателю). Данный метод предусматривает фиксацию изменений во времени некоторого выбранного вами показателя. Таким показателем может быть нечто выражаемое числовым способом (объем продаж, численность населения, скорость перемещения и т.п.). В таком случае анализ достаточно прост - сопоставление этого показателя на разных временных участках дает основание для заключения о тенденции роста, спада или стагнации. Сложнее обстоит дело с не числовыми показателями такими как настроения поклонников спортклуба или отношение граждан к проблеме. В подобных случаях необходимо вначале «оцифровывать» выбранный показатель. Такую оцифровку можно осуществить посредством:

Экспертных оценок;
- попарного сравнения;
- выбора некоего элемента за единицу измерения.

А затем вновь наблюдение за изменениями во времени.

Построение диаграммы связей.

Это ни что иное как определение всего, что так или иначе связано с изучаемым объектом или событием и графическом отображением данной информации. Построение диаграммы связей есть ни что иное как структурирование информации по такой характеристике как связи объектов. Какие типы связей изучаются зависит от поставленной цели. Такие связи могут быть явными и неявными. К явным относятся прямо установленные - имеющие фактическое подтверждение (доказательства), то как учредитель - учрежденный, продавец - покупатель, родственники и т.п. К неявным относятся те связи, которые нельзя доказать фактами, но которые могут существовать. Например один юридический адрес у нескольких организаций может указывать на то, что они созданы одной юридической конторой, а на основе этого можно предположить и более значимую связь, которая безусловно требует дополнительной проверки. Неявные связи не являются фактами, но они указывают на то, в каком направлении нужно вести поиск. А это уже задание оперативникам.

В результате получится схема, на которой разными фигурами обозначены разные объекты (например люди - овалами; организации - прямоугольниками; связи линиями или стрелками, а толщина этих линий - сила связи). Схемы хороши тем, что одним взглядом охватываешь всю ситуацию. Это позволяет не только ускорить восприятие ситуации, но и выявить аномалии (то что выделяется на общем фоне). Например объект с наибольшим количеством связей или явный аутсайдер. Надо отметить, что конечный результат данного способа анализа информации является как структурированием так и визуализацией информации. Но о визуализации чуть ниже.

Выявление силы связей.

Данный прием хорошо иллюстрируется анализом телефонных контактов. Все контакты (связи) между объектами сортируются в зависимости от того между кем они возникают. Затем оцениваются по частоте возникновения либо по продолжительности разговоров. На основе данных о силе связей строятся гипотезы и вырабатываются рекомендации для дальнейшего поиска.

Возьмем все ту же детализацию телефонных переговоров. Если у вас есть такая детализация за определенный период вы можете определить:

С каким абонентом у исследуемого наиболее тесные контакты,
- с кем контакты в нерабочее время, с кем в рабочее,
- с кем стабильные контакты, а с кем эпизодические.
- если сопоставить с параллельной хронологией, то можно выявить зависимости направления и силы контактов с иными событиями.
Если такую статистику сравнить со статистикой одного из контактеров исследуемого лица, то можно выявить еще и их общие контакты, и их плотность.

Например:

Иванов за исследуемый период общался:

С Петровым 4 раза
- с Сидоровым 2 раза
- с Сергеевым 7 раз

Напрашивается вывод о том, что у Иванова с Сергеевым наиболее плотные контакты. Далее можно строить гипотезы и собирать дополнительную информацию.

Описание объекта

В данном случае информация разносится по блокам, которые характеризуют разные стороны исследуемого объекта. А сама технология является структурированием информации по такому признаку как освещение той или иной характеристики изучаемого объекта. Проще это разобрать на примере. Предположим, что необходимо систематизировать информацию о некой компании ХХХ. Для этого составляем что то вроде списка свойств, элементами которого являются нужные нам характеристики объекта:

Идентификационные данные;
- руководство;
- имущество;
- клиенты;
- проблемы.

Далее всю поступающую информацию разносим в эти разделы в зависимости от содержимого информации. После разнесения, а иногда и в процессе, производим «вычищение» информации. Это ни что иное как приведение к формальному виду, более удобного для восприятия.

Последовательное решение более простых проблем (декомпозиция).

Еще один вариант структурирования информации это декомпозиция или последовательное решение более простых проблем. В данном варианте вы структурируете свою проблему и путь решения этой проблемы. Начиная работу по анализу, с самого первого шага, необходимо четко представлять цель, к которой идете. Эта цель формулируется в виде вопроса, ответ на который и есть то что вы хотите получить. Заведите себе правило - с началом любого проекта в первую очередь формулируйте цель, которую хотите достигнуть. Фиксируете эту цель в плане проекта следующим пунктом после названия.
Например «как поведет себя господин А в такой-то ситуации?» или «какого уровня может достичь в своем развитии предприятие Б?» или более приземленное «какие силы могут противодействовать при покупке бизнеса Л и как их нейтрализовать?». И чем четче сформулирован вопрос, тем точнее и дешевле будет ответ.

Иногда бывает непросто сформулировать цель. Но это необходимо делать по тому, что невозможно достигнуть цели не зная ее.

Сначало рассматривается конечная цель проекта - при необходимости переформулируется таким образом, чтобы было точно понятно что является вашей целью. После того как сформулирована основная цель нужно определить ее подцели, без которых нельзя ответить на основной вопрос. Другими словами отвечаете на вопрос «что вам нужно что бы достичь основной цели (или ответить на основной вопрос)». Определив подцели спускайтесь на следующий уровень по тому же принципу и так пока не дойдете до элементарных вопросов, ответы на которые можно получить простыми действиями. Таким образом формируются группы вопросов со своим главным вопросом, а из групп главных вопросов формируется основной вопрос, ответ на который нам и нужен.
Возьмем уже озвученный вопрос — «какого уровня может достичь в своем развитии предприятие Ч?». Для ответа на него нужно выяснить следующее:

Каково текущее состояние предприятия?
- каковы возможности и преимущества предприятия?
- каковы угрозы и слабости предприятия?
- каковы намерения сил влияющих на предприятие?

Каково текущее состояние предприятия
(описание состояния объекта в настоящий момент)

Руководство (ТОП менеджмент)
- Владельцы (учредители, акционеры)
- Создаваемый продукт (продукция или услуга)
- Краткая история объекта
- Имущество (земля, здания и сооружения, станки и оборудование, не реализованная продукция, незаконченное производство, сырье и материалы, ценные бумаги и обязательства и т.д. и т.п.)
- Партнеры (поставщики, клиенты и т.п.)
- Показатели (финансовые, производственные и т.п.)

Каковы возможности и преимущества
(описание всех ресурсов предприятия и его преимуществ)

Возможности:
- Административные возможности (лобби, связь со властью, зависимость власти от предприятия, возможность влиять на решения властных структур и т.п.)
- Экономические возможности (возможности по наращиванию объемов производства, по переориентации производства, по повышению качества, по снижению цены, по привлечению инвестиций и получению кредитов и т.п.)
- Криминальные возможности (возможность использовать криминал, зависимость от криминала, заинтересованность криминала в предприятии, планы криминала по отношению к предприятию и т.п.)
- Научно-технические возможности (взаимодействие с НИИ, модернизация технологий, вложения в науку, иное участие в научной деятельности)
- Рыночные возможности (сильная конкурентная позиция, рост спроса, рыночная власть производителя, отсутствие товаров-заменителей)

Преимущества:
- Продукция (высокое качество, низкая себестоимость)
- Ценообразование (четко выработанная цена)
- Продвижение (сильная реклама, лобби в среде основных потребителей)
- Сервис/персонал (высокий профессионализм персонала, развитие сотрудников, социальные программы, сервисная поддержка, торговые марки и позиционирование)
- Инжиниринг и разработка новых продуктов (модернизация оборудования, совершенствование технологий, повышение качества)
- Сбыт и маркетинг (непрерывный мониторинг рынка, стимулирование сбыта)
- Менеджмент (низкие расходы на управление, мобильная структура, единая координация, быстрое прохождение управляющих сигналов)

Каковы угрозы и слабости
(описание слабых сторон бизнеса и существующих угроз)

Угрозы:
- Административные (лобби конкурентов, недовольство власти, зависимость предприятия от власти, конфликты с властью)
- Экономические (перегруженность оборудования, невозможность переориентации производства, невозможность повышения качества и снижения цены, трудности привлечения инвестиций и получения кредитов)
- Криминальные (давление криминала, зависимость от криминала, заинтересованность криминала в предприятии, планы криминала по отношению к предприятию, конфликты с криминалом)
- Научно-технические (отсутствие взаимодействия с НИИ, нет модернизации технологий)
- Рыночные (интенсивность конкуренции, угроза появления новых конкурентов, потребности покупателей на рынке, рыночная власть покупателей, дистрибьюторов, поставщиков, давление со стороны товаров-заменителей)

Слабости:
- Продукция (низкое качество, высокая себестоимость, моральное устаревание, невостребованность)
- Ценообразование (необоснованная цена)
- Продвижение (слабая реклама, отсутствие лобби)
- Сервис/персонал (низкий профессионализм, притеснение сотрудников, отсутствие социальных программ, нет программы сервисной поддержки)
- Торговые марки и позиционирование
- Инжиниринг и разработка новых продуктов
- Сбыт и маркетинг (рынок не изучается, сбыт не стимулируется)
- Менеджмент (высокие расходы на управление, неповоротливость структуры, отсутствие единой координации, долгое прохождение управляющих сигналов)

Каковы намерения сил влияющих на предприятие

Какие силы влияют или могут влиять на предприятие
- Ресурсы этих сил
- Деловая репутация этих сил (история взаимоотношений с партнерами, клиентами, конкурентами)
- Кредитная история этих сил (история возврата своих долгов и работы с должниками)
- Поведение в критических ситуациях этих сил (какие шаги предпринимались в кризисных ситуациях, к кому обращались за помощью, кто как проявлялся)
- Планы этих сил (краткосрочные, долгосрочные, стратегические, в том числе частные планы владельцев и руководства)

Вопросы стали более определенными. Теперь по каждому пункту нужно сказать где информацию можно взять и как. Если источники определены, а затраты приемлемы - можно приступать к сбору данных и описательной стадии работы. При необходимости разложение на составляющие идет дальше. После того, как вы дошли до элементарных вопросов, можно оценить какие ресурсы нужны для получения ответов на них (время, люди, финансы и т.п.). На основе этих данных можно составить и бюджет проекта.

Синтез данных по пирамиде с низу вверх — обратная составлению дерева целей. Теперь, начиная с элементарных (конечных) вопросов, последовательно нужно ответить на все вопросы дерева. После получения всех ответов на подвопросы одной группы можно приступать к формулированию ответа на главный вопрос этой группы. На этой стадии начинается творчество. Хорошо если есть группа людей, которых можно использовать в качестве экспертов. В таком случае можно, основываясь на экспертных оценках, свести к минимуму вероятность ошибки. Но увы - чаще всего приходится работать одному. А раз так - приступаем к присвоению весовых коэффициентов каждому ответу на подвопрос в рамках его группы. Иначе говоря определяем в цифрах (баллах) силу влияния данного ответа на главный вопрос его подгруппы. И в зависимости от результатов выявляем наиболее вероятный ответ. И так пока не дойдем до исходного вопроса.

Реферирование информации.

Реферирование это еще один вариант структурирования информации. В этом случае вы упрощаете восприятие информации посредством ее сжатия и структурирования. Реферирование особенно полезно в случае большого объема информации из разных источников (СМИ, БД, опер установки и т.п.) и при необходимости дальнейшего цитирования. Но реферирование всегда ориентировано на объект интереса, т.е. тот кто реферирует — определенным образом сам искажает информацию.

Реферирование заключается в выборке из всего массива информации ключевых моментов и их фиксировании. Умение быстро составить качественный реферат достаточно непростое свойство. В настоящее время появились программы берущие на себя данную функцию. Из простых можно привести в качестве примера TextAnalitics.

Вот простая методика реферирования текста.

Исследуемый текст читается три раза. При первом прочтении выделяются слова, несущие основную смысловую нагрузку - ключевые слова - они выделяются (маркером, подчеркиваются, обводятся - как вам удобнее). Это могут быть имена, названия, даты, профессиональные выражения и т.п..
При втором прочтении внимание концентрируется на ключевых словах, при этом выделяются короткие, не содержащие ничего лишнего словообразования (словосочетания), отражающие основные мысли исследуемого текста и характеризующие ключевые слова - также выделяются.

На третьем прочтении внимание обращается только на выделенные словообразования и на их основе строятся простые, краткие предложения, описывающие смысл сообщения. После чего делается вывод об основном смысле изучаемого текста.

Есть иной способ резюмирования - текст делится на законченные блоки (например абзац) и содержание этих блоков пересказывается в одном предложении.

Более сложный вариант реферирования заключается в выборке из текста значимых утверждений и их изложение. Но этот метод ориентирован на потребителя информации, а точнее на его интересы. Ведь выбираются не все утверждения, а лишь значимые для потребителя. Иначе реферат получиться больше исходного текста.

Предварительная типология проблемы.

Это ни что иное как предварительное изучение проблемы и определение ее основных характеристик, что позволяет выявить особенности и понять к какому типу данная проблема относится. Такой подход дает возможность всесторонне оценить сложные проблемы, выработать разные варианты их решения, в т.ч. используя альтернативные сценарии и накопленный опыт.

Планирование поиска решения.

Данная методология представляет собой ни что иное как выявление аналогий в иных областях для решения поставленной проблемы. Например в смежных или в принципиально не связанных. Например, при планировании создания крупного объединения можно взять за аналогию этапы развития живого организма. Или поиск решения технических задач в живой природе.

Контент-анализ

Еще один способ структурирования текстовой информации это контент-анализ. В самом простом виде контент-анализ это подсчет частоты упоминания какого то фрагмента текста (от слова до страниц и глав). И дальнейшая интерпретация этих частот. А это ни что иное как структурирование.

Самый простой способ применения контент-анализа для нужд конкурентной разведки это выявление частоты употребления не общеупотребительных слов. Суть в том, чтобы удалить из области анализа общеупотребительные слова и оставить только специфические. И по ним можно сделать выводы о предпочтениях, профессии, правдивости … да еще много о чем.

В сети достаточно подобных сервисов от шуточных до вполне профессиональных. Например вот этот