ISO 15926 – онтология для семантического представления инженерных данных - Стандарт интеграции данных жизненного цикла ISO 15926 - Проекты

Одной из сложнейших задач в ИТ-отрасли является сегодня организация взаимодействия информационных систем, использующихся при создании и эксплуатации крупных промышленных объектов (нефтяных платформ, электростанций, химических производств, фармацевтических предприятия и т.п.). В их жизненном цикле занято множество организаций: проектировщики, строители, поставщики оборудования, службы эксплуатации и т. д., каждая их которых обычно использует свой набор компьютерных систем и свои форматы данных.

По данным NIST (Национальный институт стандартизации и технологий США), решение проблем взаимодействия разнородных компьютерных систем поможет индустрии крупных капитальных проектов только в США экономить до 16 млрд. долл. в год. Возможность доступа и анализа для полных данных жизненного цикла сложного инженерного объекта стала сегодня обязательным условием эффективного управления его проектированием и эксплуатацией. Эту задачу называют по-разному: создание единого информационного пространства жизненного цикла, создание цифровой модели и т. п.

Большинство разработчиков инженерных информационных систем (CAD/CAM/CAE/PLM) используют классические объектные модели данных и более или менее стандартные реляционные базы данных, однако многолетние попытки их объединения на единой платформе пока что не удались. Отчасти причину такого провала можно обнаружить в основах классической реляционной теории моделирования данных – в жестких границах между сущностями, атрибутами и связями. При объединении множества реляционных баз данных от разных производителей, да ещё и принадлежащих разным хозяевам, выясняется, что все они принимали разные решения при моделировании основных понятий предметной области. Зачастую одно и то же инженерное понятие в одной базе данных будет соответствовать имени таблицы, в другой базе – содержанию ячейки таблицы, а в третьей – имени столбца таблицы.

Кроме того, инженерные данные содержат крайне разнородную информацию об одних и тех же объектах, в отличие от «управленческих» или финансовых данных. Данные о разных узлах и подсистемах промышленного объекта (трубопроводах, электрооборудовании, строительных конструкциях и т.п.) имеют принципиально различную структуру, а в непрерывном производстве (нефтехимия, электростанции и т.д.) существуют сотни подсистем и тысячи групп оборудования. Данные о насосе в инженерных информационных системах включают сведения из систем ERP и EAM, систем PLM, САПР, а также информацию о его проектных технологических режимах, 3D-компоновке, истории замеров с его датчиков, интерактивные руководства по монтажу и обслуживанию и многое другое. Насос имеет функциональный код в проектной документации в системах САПР и приобретает в EAM серийный номер, будучи установленным на объекте. Инженерная информация формируется в каталоге производителя, в САПР для теплотехнических и электрических специальностей, в системах проектного управления, управления строительством (4D-проектирования), и т.п.

Если каждую из инженерных сущностей описывать реляционной таблицей, то число таблиц разной структуры составит несколько тысяч. При этом возникают проблемы быстродействия при формулировании общего запроса к нескольким базам данных, в которых, как отмечено выше, могли быть приняты принципиально разные решения по поводу объектов и атрибутов предметной области, или по поводу отражения изменения объектов во времени.

Решение проблем интеграции инженерных данных оказалось гораздо удобнее организовывать в рамках семантического подхода к моделированию данных. В рамках этого подхода информация предоставляется в виде совокупности связанных отношениями субъектов и объектов (графа), а не в виде привычных таблиц. Расширяется сфера использования для инженерных данных наиболее распространённого такого представления – стандарта RDF (Resource Description Framework).

Это даёт возможность эффективно "складывать" в одну структуру данные из разных источников. Графовая структура наиболее удобна для представления разнородной инженерной информации, требующей постоянного развития и усложнения модели данных на протяжении всего жизненного цикла. Информация в семантической форме легко пополняется и расширяется при появлении новых источников, без необходимости фундаментальной переработки системы хранения, как в случае баз данных. Семантические стандарты поддерживают гибкие и расширяемые информационные модели, т.е. позволяют объединять по мере необходимости и инженерную, и нормативную, и географическую, и финансовую информацию, без остановок на переработку информационной модели при каждом расширении. Формы и объёмы обрабатываемых данных могут уточняться по мере развития требований к информации и роста понимания потребностей участников жизненного цикла.

Дополнительные преимущества при работе с семантическими данными даёт применение онтологических стандартов, позволяющих не просто получать информацию из разных источников в одном гибком и расширяемом формате, но и одинаково её интерпретировать. При онтологическом моделировании данных в семантическом представлении используются понятия и отношения из заранее согласованного (определённого каким-то стандартом) списка понятий и отношений, описывающего некоторую предметную область инженерной сферы (механику, электрику, теплогидравлику, строительство, и т.п.). Например, один раз вводятся понятия "насос", "давление" или "подключение", и далее универсальные ссылки на такие понятия стандартного словаря-тезауруса используются всеми сторонами для описания объектов, извлекаемых из разнообразных баз данных.

Онтологическая модель данных является составной частью самих данных – понятия стандартного словаря-тезауруса (так называемые "справочные данные") используются для описания смысла и способов использования данных при обработке их как компьютерами, так и людьми. При необходимости уточнить смысл полученных данных можно из заранее известных источников (библиотек справочных данных) и с использованием тех же стандартизированных технологий и инструментов, которые используются для обмена данными

Основанные на онтологическом моделировании интеграционные семантические модели для инженерных объектов разрабатываются как на отраслевом, так и на международном уровне. Современные решения по моделированию данных легли в основу нейтральной по отношению к отдельным инженерным системам модели данных стандарта ISO 15926 "Industrial automation systems and integration. Integration of life-cycle data for process plants including oil and gas production facilities" (ГОСТ-Р ИСО 15926 "Промышленные автоматизированные системы и интеграция. Интеграция данных жизненного цикла для перерабатывающих предприятий, включая нефтяные и газовые производственные предприятия").

Этот стандарт определяет инженерную онтологию – основные типы объектов и отношений, используемых при представлении инженерной информации, упорядочивает терминологию, используемую для её организации, а также определяет принципы расширения стандартной терминологии через механизм федерированных библиотек справочных данных. Сегодня многие крупные компании уже переходят на этот стандарт: компании-члены Norwegian Oil Industry Association, члены консорциума FIATECH, крупнейшие поставщики инжинирингового программного обеспечения, а также такие российские корпорации, как ГК «Росатом» и ОАО «Роснефть», изучают возможности его использования.

Реализация стандарта ISO 15926 в части представления, хранения и доступа к данным основана на использовании семантических стандартов консорциума W3С: RDF, OWL и SPARQL.

Использование семантических и онтологических стандартов помогает наладить обмен и сопоставление данных, выявление коллизий и согласование противоречий. Дисциплина работы с данными при такой стандартизации, является гораздо менее обременительной, чем при иных технологических решениях, предусматривающих унификацию программных средств и интерфейсов работы. При предоставлении семантических данных возможен выбор между согласованной «общей» терминологией (отраслевой онтологией) и привычными отдельным участникам наборами понятий и опирающимися на них формами отчётности. При этом в части терминологии, предписанной федеральными или муниципальными нормативами, контроль используемых терминов может быть гораздо более жёстким, чем в части, не охваченной стандартизацией: контроль можно будет организовывать не только «глазами», но и с использованием компьютеров.

В части коммуникации между компьютерами семантические и онтологические данные пригодны для обработки инструментами разной степени сложности, от широко распространённых электронных таблиц до специализированных геоинформационных систем, систем автоматизации проектирования или систем инвестиционного планирования. Семантические данные с онтологической разметкой могут готовиться разными программными средствами. Открытые форматы данных избавляют от необходимости пользоваться программным обеспечением только от одного поставщика.