Формирование корпоративной памяти
на основе фасетной классификации

Гаврилова Т.А., Кудрявцев Д.В. СПбГПУ

Введение.

По оценкам исследований от 15 до 35% времени сотрудников компании уходит на поиск информации [Feldman, 2004]. Примерно половину этого времени сотрудник ищет нужные данные сам, а оставшуюся половину тратит на расспросы коллег , например « Где найти презентацию проекта, сделанную два месяца назад?» или « Где лежит последняя версия регламента процесса отгрузки продукции?».

Проблемы поиска релевантной корпоративной информации идентичны в большинстве компаний:

  • Множество документов создаются заново вместо изменения существующих;
  • Часть документов безвозвратно теряется;
  • О наличии каких-то документов не знает никто ;
  • Достоверность и актуальность найденных документов вызывает сомнения.

Одним из возможных решений таких проблем может выступать создание в компании системы управления знаний на основе корпоративной памяти [Abecker, 1998; Гаврилова, 2003].

Корпоративная память (КП) (organizational memory) в узком смысле (далее в статье):

  • электронное хранилище гетерогенной информации из различных источников предприятия, которое поддерживает механизмы поиска и распределения доступа к информации;
  • грамотно управляемый централизованный электронный архив документов компании.

В широком смысле КП понимается как расширение данного определения информацией о сотрудниках и экспертах – носителях знаний и компетенций . Близкие, но не идентичные термины: информационное хранилище, электронный архив, база знаний.

Превращение информационного хранилища в корпоративную память происходит за счет внедрения информационно-поискового механизма, часто КП строится как корпоративный портал знаний. Общепризнанный современный подход к поиску информации – это сочетание таксономии с предметным поиском, например по ключевым словам [Сукиасян, 2004 ; Delphi Group, 2004] (см., например, Yandex, Yahoo).

Термин «таксономия» (taxonomy) имеет несколько трактовок.

1. Традиционное определение: «Таксономия ( от греч. taxis – расположение, строй, порядок – и nomos – закон) – теория классификации и систематизации сложноорганизованных областей действительности, имеющих обычно иерархическое строение (органический мир, объекты географии…)».

2. Новое определение из современной англоязычной литературы по информационным системам: «Таксономия – структура , отражающая способ классификации документов по группам для облегчения поиска, обучения и размещения (Gartner, Delphi Group…)».

Близкие, но не идентичные термины: классификационная система/схема/таблица, рубрикатор (в таких науках, как традиционная информатика или Information/Library Science), информационная архитектура (web-проектирование), каталог, дерево папок в компьютере. Более общий термин – онтология [Gruber, 1994; Гаврилова, Хорошевский, 2001].

В статье предлагается методика создания таксономий, основанная на использовании специального подхода, называемого фасетной классификацией. Прежде чем переходить к процессу создания таксономии, рассмотрим основные этапы более общего процесса – создание корпоративной памяти.

1. Основные этапы разработки корпоративной памяти

В процессе разработки таксономии можно выделить 4 основных этапа:

  • Определение области и масштаба (scope) корпоративной памяти
  • Создание таксономии
  • Наполнение корпоративной памяти или «заселение» таксономии
  • Тестирование корпоративной памяти

1.1. Определение области и масштаба (scope) корпоративной памяти

Компания имеет больший шанс достигнуть успеха, если она решает задачу, которая обозрима и имеет четкие границы, тогда как многообещающие широкомасштабные проекты, которые решат все проблемы, часто оказываются незавершенными.

Для определения масштаба и области таксономии полезно определить:

  • Цели создания базы знаний
  • Требования к таксономии
  • Будущих пользователей корпоративной памяти (кому она нужна)
  • Контент или описание массива документов

Различия в области и масштабе таксономии объясняют, почему компании, имеющие похожие виды деятельности, имеют абсолютно разные базы знаний и таксономии. Для примера можно рассмотреть базы знаний крупных консалтинговых компаний Ernst & Young и KPMG [Roberts-Witt, 1999].

1.2. Создание таксономии

В результате выполнения этого этапа появляется таксономия (см. след. раздел).

1.3. Наполнение корпоративной памяти или «заселение» таксономии

После разработки первой версии таксономии следует наполнить ее документами, выбранными для размещения в корпоративной памяти. В процессе «заселения» таксономии могут выявиться многие недостатки: в таксономии нет подходящего элемента для привязки документа, непонятно к какому элементу относить тот или иной документ – нужно устранять двусмысленность.

1.4. Тестирование корпоративной памяти

Запуск корпоративной памяти в эксплуатацию может происходить не одномоментно, а с помощью нескольких пилотных этапов и с ограниченным числом пользователей. Такое тестирование позволит увеличить usability таксономии и качество доступа к информации.

Рассмотрим подробнее этап 2.

2. Процесс создания таксономии

В настоящее время существует два подхода к созданию таксономии: ручной и автоматический. Необходимо отметить, что, несмотря на указываемые поставщиками ПО возможности автоматического создания таксономий, создание эффективной таксономии требует интеграции автоматических методов с ручными, что подтверждается исследованиями компаний Delphi Group [Delphi Group, 2004] и Gartner [Logan, Knox, 2003]. Причем автоматическая классификация документов – это лишь вспомогательный инструмент в работе аналитика-создателя таксономии, результаты работы которого можно использовать как первое приближение в процессе создания таксономии. Далее предлагается процесс / алгоритм ручной разработки таксономии, см. рис. 1.

Рис. 1 Процесс создания таксономии и его контекст

В предлагаемой методологии создания таксономии в качестве инструмента разработки выступает фасетная классификация [Sukiasyan, 1998, Сукиасян, 2004 ; Ранганатан, 1970]. Название «фасетная» происходит от слова «фасет» (facet) – аспект рассмотрения предмета (темы).

В качестве фасетов выступают категориальные классы предметной области ( в данном случае деятельность предприятия) .

Примером фасетной классификации могут служить метаданные ( данные для описания данных) , а карточка в каталоге библиотеки – элемент такой классификации .

Примеры фасетной классификации в Интернет:

Хрюшки в живописи ХХ века
http://www.big.spb.ru/about/art_chapter/pigs/

Путеводитель по Японским замкам http://www.jcastle.info/cgi-bin/Top2

Материалы исследований консалтинговой компании Accenture http://www.accenture.com/xd/xd.asp?it=enweb&xd=ideas\ideas_home.xml

Картинки из Архитектурной библиотеки визуальных ресурсов университета Калифорнии http://orange.sims.berkeley.edu/cgi-bin/flamenco/aa/Flamenco

Шаг 1: Анализ классификаций, используемых в компании

Начать создание таксономии полезно с анализа классификаций, которые можно найти в организации. Во-первых, можно обратиться к ведущим специалистам и попросить их показать способ структурирования информации на своих персональных компьютерах [ Смирнов, 2004]. Во-вторых, можно обратиться к имеющимся в наличии общекорпоративным классификациям: структура сайта, структура интранет-портала (который, как ни странно, может создаваться раньше базы знаний), дерево папок на корпоративном сервере, картотеки в отделе научно-технической информации (НТИ) компании.

Необходимость этого шага объясняется, с одной стороны, экономией усилий (использование уже созданных наработок), а с другой стороны, необходимостью «не выплеснуть ребенка», олицетворяющего накопленные за долгие годы жизни корпоративную культуру и способ мышления сотрудников компании, которые могут являться одним из конкурентных преимуществ компании. (Хотя иногда корпоративная культура и способ мышления могут напротив препятствовать развитию компании, и в таком случае создание новой таксономии позволяет проводить изменения неконкурентоспособной культуры и способа мышления, определяя новый взгляд на старые вещи.

Шаг 2: Определение фасетов для описания документов

Вспомним определение фасета − классификационный признак, используемый при создании таксономии. На данном шаге необходимо определить признаки, по которым будут классифицироваться материалы в базе знаний. Возможные признаки классификации:

  • По продуктам (услугам) компании
  • По этапам жизненного цикла продукции
  • По функционалу компании (областям деятельности, бизнес-процессам)
  • По этапам проектов (для проектных компаний)
  • По оргструктуре (область создания и использования материалов)
  • По рыночным сегментам
  • По компаниям-клиентам
  • По типу документа

В таблице 1 приведены возможные источники для выбора фасетов:

Таблица 1. Источники для выбора фасетов
Источники для выбора фасетов Литература
Компоненты архитектуры предприятия [Калянов, 2004], [Галактионов, 2002]
При использовании в компании систем бизнес-моделирования (ARIS, ОРГ-МАСТЕР®…) для описания деятельности (в первую очередь процессов) можно выделить достаточно стандартный список типов объектов в создаваемых моделях организации [Кудрявцев, Григорьев и др., 2005]
Способы структурирования «деревьев» целей и функций в системном анализе [Волкова, Денисов, 1997]
Онтологии предприятий [Uschold, 1997]

Кроме «нисходящего» подхода, формирование фасетов может происходить и «снизу-вверх» путем анализа документов и анализа потребностей будущих пользователей.

Необходимо учитывать, что не нужно пытаться сразу выявить все фасеты – достаточно вначале определиться с 2-3 (а иногда хотя бы с 1). Выбранные фасеты позволят перейти к следующему шагу создания таксономии, в процессе выполнения которого могут непроизвольно «всплывать» новые фасеты (например, при возникновении таких описаний документов, которые важны, но не соответствую т ни одному из выбранных фасетов).

Шаг 3: Описание фасетов

После того как определены «стартовые» фасеты нужно переходить к их структуризации – созданию таксономии внутри каждого фасета. Однако прежде чем заниматься самостоятельным созданием таксономии внутри каждого фасета, целесообразно воспользоваться имеющимся в мире опытом − посмотреть на уже созданные внешние (по отношению к компании) таксономии.

Таблица 2. Использование внешних таксономий
Фасет Источник таксономии Описание и фрагмент таксономии
Процессы компании The American Productivity
& Quality Center (APQC)
www.apqc.org
Process Classification Framework - Универсальная таксономия /классификация бизнес процессов, которая в настоящее время используется компаниями PriceWaterhouseCoopers, Ensco, Solvay
Pharmaceuticals, Ford Motor Company, and SchlumbergerSema.
На верхнем уровне процессы объединены в следующие группы:
1.   Изучение рынков и потребителей;
2.   Разработка видения и стратегии;
3.   Разработка продуктов и услуг;
4.   Маркетинг и продажи;
5.   Производство и поставка продуктов и услуг (производственные компании);
6-13. …
Жизненный цикл продукции Стандарты качества ISO
Plan Do Check Act
Планируй Пробуй Проверяй Действуй
Типовые этапы проектов (для проектных компаний) Международный стандарт управления проектами
Project Management Body of Knowledge (PMBoK)

Примеры декомпозиции работ по проекту (Work Breakdown Structure):
Типовые фазы проекта:

Таблица 3. Использование существующих внутренних таксономий
Фасет Источник информации
Продукты и услуги Прайс-лист
Организационная структура Организационно-распорядительная документация
Функционал компании
Сегменты рынка Рыночная стратегия

При использовании представленных на таблице 3 внутренних таксономий требуется тесная интеграция процессов создания таксономии с организационным управлением в части состава работ, методик и конечных результатов. Если в качестве фасета выбрана организационная структура компании, то процесс разработки таксономии будет совпадать с процессом разработки организационной модели.

Для выполнения таких работ могут использоваться соответствующие методики из области организационного управления (см., например, технологию процессного описания компании), а также применяться специальные программные продукты, поддерживающие организационное управление, − системы бизнес- моделирования. Компоненты моделей, созданных в системах бизнес-моделирования, могут стать исходным вариантом таксономий.

Особенности использования готовых таксономий:

  • Каждая компания должна адаптировать типовые таксономии под свои потребности, корректируя, расширяя, детализируя.
  • Дается возможность «быстрого старта».
  • Потенциальная экономия ресурсов.

При создании иерархической таксономии можно использовать несколько подходов:

  • Процесс нисходящей разработки («сверху-вниз»)
  • Процесс восходящей разработки («снизу-вверх»)

Процесс комбинированной разработки – это сочетание нисходящего и восходящего подходов: сначала определяются более заметные понятия, а затем они соответствующим образом обобщаются и детализируются.

В рамках данной статьи не будем подробно рассматривать методику создания и требования к таксономии внутри фасета. Подобные знания могут быть получены из методик по разработке онтологий [ Гаврилова, 2005 ; Ной, МакГиннесс, 2001].

Шаг 4: Интеграция фасетов

В результате выполнения предшествующих шагов по созданию таксономии мы получили ряд фасетов, которые имеют свою внутреннюю таксономию. В некоторых случаях создание таксономии может завершиться уже на этом этапе – в результате пользователи будут пользоваться фасетной классификацией. Ниже приведен пример использования фасетной классификации в консалтинговой компании. Для получения какой-либо информации пользователь будет в разных фасетах указывать различные элементы, например, для получения Информации Х необходимо в Фасете 1 выбрать «Проекты», а в Фасете 2 выбрать тип документа «Планы работ» (Рис.2).

Рис. 2. Поиск информации в фасетной классификации

Такое описание размещения информации в фасетной классификации – {Проекты:Планы работ} – называется фасетной формулой (по синтаксису фасетной формулы видно, почему используется термин Классификация с двоеточием). Подход к поиску информации в данном случае соответствует использованию фильтров в Excel. Использование созданной фасетной классификации позволяет точно и быстро находить любую необходимую информацию, однако реализация такой таксономии имеет свои недостатки:

  • Необходима высокая осведомленность пользователей о предметной области: для того чтоб ы сформировать фасетную формулу, необходимо заранее знать наполненные («непустые») ячейки, которые на рис. 2 выделены серым. Для этого нужно заранее четко представлять результат поиска, чего часто нет при поиске по таксономии.
  • Для реализации фасетной классификации требуется специальное программное обеспечение, которое обеспечит как (1) механизм поиска, так и (2) механизм настройки прав доступа.

Возможным способом устранения таких недостатков может быть создание иерархической таксономии путем интеграции разработанных фасетов.

Иллюстрациями интеграции фасетов могут быть рис.3 и 4.

Рис.3. Таксономия библиотеки Microsoft: http://msdn.microsoft.com/library/

В представленной на рис.3 таксономии явно видны фасеты: 1. Продукты и 2. Тип контента, которые интегрированы в рамках одной таксономии.

Рис.4. Таксономия корпоративной памяти консалтинговой компании

В представленной на рис. 4 таксономии интегрированы следующие фасеты: 1. Продукты и услуги (консалтинговой компании) 2. Типы документов 3. Области менеджмента .

При интеграции фасетов, у которых внутри иерархические таксономии, необходимо определять как последовательность фасетов, так и уровень внутренней таксономии фасета для интеграции. В представленном примере для фасета Области менеджмента это уровень II, см рис. 5:

Рис. 5. Уровни внутренней таксономии (структуры) фасета

Ниже приведены альтернативные варианты интеграции фасетов (в скобках указан уровень элементов внутри таксономии фасета):

Ф1 → Ф3(II) → Ф3 (III) → Ф2
Ф1 → Ф3(III) → Ф2

Заключение

Основным преимуществом предлагаемой методики является ее системность. Использование фасетов (категориальных классов объектов) обеспечивает учет всех значимых аспектов деятельности предприятия. Кроме того, вывод задачи разработки таксономии на уровень анализа категориальных классов объектов предприятия и их внутренней структуры позволяет интегрировать эту задачу с другими задачами предприятия: выявление и совершенствование корпоративной архитектуры предприятия, создание электронной модели предприятия. Интеграция этих задач в свою очередь позволит органично вписать управление знаниями в общую систему управления предприятием.

Литература

  1. Азгальдов Э., Черный А. Дескрипторный словарь по информатике.— М. : ВИНИТИ, 1991.
  2. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа // СПб, Издательство СПбГТУ 1997.
  3. Гаврилова Т. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем // Ж. «Новости искусственного интеллекта», 2003, №2.
  4. Гаврилова Т.А. Онтологический инжиниринг (Tutorial). XI-th International Conference “Knowledge. Dialog. Solution.”, Varna, Bulgaria, 2005.
  5. Галактионов, Виктор Системная архитектура и ее место в архитектуре предприятия "Директор ИС", N5, 2002 год http://www.osp.ru/cio/2002/05/006_1.htm  
  6. Гаврилова Т., Хорошевский В. Базы знаний интеллектуальных систем. Учебник.- СПб, Изд-во «Питер» , 2001.
  7. Калянов Г. Архитектура предприятия и инструменты ее моделирования // Автоматизация в промышленности, 2004, №7. http://kalyanov.by.ru/publications/57.pdf
  8. Кудрявцев Д., Григорьев Л., Кислова В., Заблоцкий А. «Орг - мастер» как инструмент совершенствования бизнес-процессов. // Сб. трудов Международной научно-практической конференции “Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями” (РБП-СУЗ-2005)
  9. Ной Н. , МакГиннесс Д .. Разработка онтологий 101: руководство по созданию вашей первой онтологии Стэнфордский Университет, Калифорния, 2001 http://ifets.ieee.org/russian/depository/ontology101_rus.doc
  10. Ранганатан Ш. Классификация двоеточием: основная классификация / – М., 1970.
  11. Смирнов О.Что такое база знаний и зачем она нужна, 2004 http://www.big.spb.ru/publications/other/km/base_km_need.shtml  
  12. Сукиасян Э. Логика развития информационно-поисковых языков // Hаучные и технические библиотеки – 2004. – № 4.
  13. Abecker A., Bernardi A., Hinkelmann K., Kuhn O., Sintek M. Toward a Technology for Organizational Memories IEEE Intelligent Systems. – 1998. - №3, 40-48.
  14. Delphi Group Information Intelligence: Content Classification and the Enterprise Taxonomy Practice Research Report, 2004.
  15. Feldman, Susan. The high cost of not finding information. KM World. Camden, ME: Knowledge Asset Media 13, 3, 2004, pp.8
  16. Gruber T. A translation approach to portable ontology specifications. Knowledge Acquisition, 1993, Vol. 5, 199- 220.
  17. Hill B. Leveraging Taxonomy Architectures in Web Portal Design and Searching Info Tech Talk Winter, 2005, Volume 10, No. 1
  18. Logan D., Knox, R. How to Create Taxonomies that save time and money. Research Note. Stamford, Conn.: Gartner Research, Sept. 2, 2003.
  19. Roberts-Witt Sarah L. Practical Taxonomies Knowledge Management Magazine
  20. Sukiasyan E. Classification Systems in their Historical Development: Problems of Typology and Terminology Proceedings 5th Int. ISKO-Conference «Structures and Relations in Knowledge Organization», Lille, 25—29 August 1998 ( Классификационные системы в их историческом развитии: проблемы терминологии и типологии / Э.Р. Сукиасян // Науч. и техн. б-ки. – 1998. – № 11. – С. 5–16.)
  21. Uschold M., King M., Moralee S. and Zorgios Y. The Enterprise Ontology AIAI, The University of Edinburgh, 1997.

Адрес этой страницы в Интернете: 
http://big.spb.ru/publications/bigspb/km/om.shtml
      
Copyright © БИГ-Петербург 1999-2001.  http://www.big.spb.ru  E-Mail: mail@big.spb.ru