Алгоритмическое и программное обеспечение системы управления производством газодобывающей компании
На правах рукописи
Богдан Степан Александрович Алгоритмическое и программное обеспечение системы управления производством газодобывающей компании 05.13.11 — Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей А в т о р е ф е р а т диссертации на соискание ученой степени кандидата технических наук
Томск — 2011
Работа выполнена на кафедре вычислительной техники ФГБОУ ВПО «Национальный исследовательский Томский политехнический университет»
Научный консультант: доктор технических наук, профессор, Заслуженный деятель науки РФ Марков Николай Григорьевич
Официальные оппоненты: доктор технических наук, доцент Кручинин Владимир Викторович кандидат технических наук Сарайкин Андрей Витальевич
Ведущая организация: Новосибирский государственный технический университет
Защита состоится "16" января 2012 г. в 16 часов на заседании Совета по защите докторских и кандидатских диссертаций Д 212.269.06 при ФГБОУ ВПО «На циональный исследовательский Томский политехнический университет» по ад ресу: 634034, г. Томск, ул. Советская, 84/3, Институт кибернетики, ауд. 214.
С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Националь ный исследовательский Томский политехнический университет» по адресу: 34034 г. Томск, ул. Белинского, 55.
Автореферат разослан «15» декабря 2011 г.
Ученый секретарь Совета по защите докторских и кандидатских диссертаций Д 212.269. кандидат технических наук, доцент М.А. Сонькин
Общая характеристика работы
Актуальность работы. Крупные компании с непрерывным типом произ водства, к которым относятся предприятия газовой, нефтяной, металлургиче ской и ряда других отраслей промышленности, требуют особого внимания к качеству принимаемых их менеджерами и техническими специалистами управ ленческих решений. В конечном итоге качество принятых управленческих ре шений влияет на финансовые результаты работы компании в целом.
Как показывает опыт, повысить качество управленческих решений можно путем использования современных средств автоматизации и информатизации компании. При этом управление производством и компанией в целом может быть выведено на принципиально новый уровень качества.
Особенности современных газодобывающих компаний (ГДК) накладыва ют множество дополнительных ограничений и требований к автоматизирован ным системам управления производством из-за значительной пространствен ной распределенности объектов управления, большого числа уровней управле ния компании, опасностью производства, разнородностью применяемых авто матизированных систем управления технологическими процессами (АСУ ТП) и т.д.
Среди ученых, изучающих проблемы автоматизации непрерывных произ водств, в том числе автоматизации производств газодобывающих компаний, следует выделить работы В.Г. Герке, Б.С. Посягина, И.С. Решетникова, L. Van Dyk, T. J. Williams, M. McClellan, M. Littlefield, J. Harrington, J. Kanter и других.
Анализ результатов работ этих исследователей, а также анализ сущест вующего алгоритмического и программного обеспечения систем управления производством в газовой отрасли показал, что такие системы не обладают тре буемой функциональностью и, соответственно, неполно автоматизируют дея тельность специалистов основных производственных служб компаний. Более того, разработчики систем управления непрерывным производством, в том чис ле, специализированных систем и программных комплексов для газодобываю щих компаний лишь иногда включают в эти системы и комплексы программ функции интеллектуального анализа данных (ИАД), основанные на использо вании технологии оперативного анализа OLAP (On-line analysis processing) и технологий data mining (добыча знаний). В то же время наличие программных средств для ИАД в составе систем управления производством ГДК позволит вывести управление производством на качественно иной, современный уро вень.
Все вышесказанное указывает на актуальность разработки новых подхо дов, алгоритмов и программных средств автоматизации непрерывных произ водств ГДК, базирующихся на OLAP-технологиях и методах ИАД. Под такими методами понимаются методы математической статистики, прежде всего, раз ведочного анализа данных, и методы нейросетевого анализа и т.п.
Целью диссертационной работы является разработка алгоритмического и программного обеспечения системы управления производством (СУП) совре менной газодобывающей компании, причем для повышения качества управле ния компанией в этой СУП должны быть реализованы методы интеллектуаль ного анализа данных.
Для достижения поставленной цели необходимо последовательное реше ние следующих задач:
1. Разработать принципы создания и архитектуру СУП, причем для повы шения качества управления производством в основу этой системы следует по ложить методы ИАД.
2. Разработать алгоритмическое обеспечение СУП, в том числе с использо ванием современных методов ИАД.
3. Разработать программное обеспечение (ПО) СУП согласно сформулиро ванным требованиям, предложенной архитектуре и разработанным алгоритмам.
4. Провести апробацию и внедрение алгоритмического и программного обеспечения СУП в современной газодобывающей компании.
Методы исследований. В работе использованы методы классификации, нейросетевого анализа данных, деревьев решений, теории алгоритмов, методы объектно-ориентированного проектирования ПО и математической статистики.
Научную новизну полученных в работе результатов определяют:
1. Архитектура СУП газодобывающей компании, отличающаяся от архи тектуры традиционных систем управления производством таких компаний ве дущей ролью хранилища производственных данных, тематических витрин дан ных и подсистемы ИАД.
2. Алгоритм формирования диспетчерских сводок, отличающийся от тради ционных алгоритмов наличием таблицы индексов сводок и позволяющий по этому с большей скоростью, чем традиционные алгоритмы формировать сводки в практически важных случаях.
3. Подход к разбраковке результатов гидродинамических исследований скважин (ГДИС), основанный на методах бинарной классификации и позво ляющий исключить эксперта из процесса разбраковки.
4. Оригинальный способ оперативного прогноза среднечасового уровня до бычи углеводородного сырья (УВС), дающий практически приемлемую точ ность прогнозирования на основе ретроспективного анализа совокупности тех нологических параметров.
5. Подход к долгосрочному прогнозированию уровня валовой добычи газа по временному ряду из ежемесячных уровней добычи газа по месторождению, использующий метод Бокса-Дженкинса и обеспечивающий точность прогноза выше, чем у широко применяемых в газовой отрасли программных решений.
Практическая ценность и реализация результатов работы. Практиче ски значимыми являются разработанные алгоритмы и программные средства СУП, которая функционирует по клиент-серверной технологии и использует в качестве основы СУБД Microsoft SQL Server 2008 R2. Объем исходного кода разработанного ПО системы составляет более 15 000 строк на языках C#, Delphi, MDX, DMX, T-SQL. СУП была интегрирована с корпоративной геоин формационной системой управления производством (КГСУ) «Магистраль– Восток» и внедрена в её составе в ОАО «Томскгазпром». Внедрение подтвер ждено соответствующим актом.
Основные положения, выносимые на защиту:
1. Разработанные структуры хранилища производственных данных и тема тических витрин данных позволяют эффективно решать различные задачи ИАД при управлении производством газодобывающей компании.
2. Разработанный алгоритм формирования диспетчерских сводок позволяет формировать сводки с большим числом параметров быстрее в 1.5-2 раза, чем традиционные алгоритмы.
3. Разработанный подход к разбраковке результатов гидродинамических ис следований скважин позволяет производить разбраковку результатов этих ис следований без участия эксперта.
4. Оригинальный способ оперативного прогноза среднечасового уровня до бычи УВС дает практически приемлемую точность прогнозирования.
5. Подход к долгосрочному прогнозированию валовой добычи газа по ме сторождению обеспечивает точность прогноза выше, чем у широко применяе мых в газовой отрасли программных решений.
6. Разработанная архитектура, созданное алгоритмическое и программное обеспечение СУП позволяют повысить качество управления производством в газодобывающих компаниях.
Апробация работы. Основные результаты докладывались и обсуждались на Ist International Conference on Model & Data Engineering (MEDI'2011) (г. Оби душ, Португалия, 2011 г.);
5th Central and Eastern European Software Engineering Conference (CEE-SECR) (г. Москва, 2009 г.);
VI Всероссийской научно практической конференции «Технологии Microsoft в теории и практике про граммирования» (г. Томск, 2009 г.);
VII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Молодежь и совре менные информационные технологии» (г. Томск, 2009 г.);
III Международной научно-технической конференции "Компьютерные технологии поддержки при нятия решений в диспетчерском управлении газотранспортными и газодобы вающими системами" (DISCOM-2007) (г. Москва, 2007 г.);
XII Международной научно-практической конференции студентов и молодых ученых «Современ ные техника и технологии» (г. Томск, 2006 г.).
По результатам работы имеется 12 публикаций, в том числе 5 статей в журналах из списка ВАК.
Личный вклад:
1. Постановка задач исследования и разработка принципов построения СУП газодобывающей компании выполнены совместно с Марковым Н.Г и Кудино вым А.В.
2. Архитектура СУП газодобывающей компании, структуры хранилища производственных данных и тематических витрин данных в составе СУП раз работаны автором совместно с Кудиновым А.В.
3. Автором разработаны алгоритмы расчета технологического режима рабо ты газовых скважин, его программная реализация осуществлена совместно с Мирошниченко Е.А.
4. Алгоритм формирования диспетчерской сводки разработан и программно реализован лично автором.
5. Способ оперативного прогноза среднечасового уровня добычи УВС и его программная реализация разработаны лично автором.
6. Подход к разбраковке результатов гидродинамических исследований скважин разработан и реализован лично автором.
7. Подход к долгосрочному прогнозированию уровня валовой добычи газа по месторождению разработан и реализован лично автором.
8. При разработке ПО формирования диспетчерских сводок автор реализо вал его серверную часть. Клиентская часть ПО была реализована Ковиным Р.В.
9. Отдельные программные модули для диспетчерского управления реали зованы автором совместно с программистами лаборатории Геоинформацион ных систем Института кибернетики Томского политехнического университета.
Объем и структура работы. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников из 149 наименований и одного приложения. Объем основного текста диссертации составляет 135 стра ниц машинописного текста, иллюстрированного 47 рисунками и 9 таблицами.
Содержание работы Во введении обосновывается актуальность работы в данном научном на правлении, формулируются цель и задачи исследования.
Первая глава посвящена проблемам автоматизации производственной деятельности газодобывающей компании.
Рассмотрены организационные и функциональные особенности газодобы вающего производства как производства непрерывного типа. В соответствии с подходом Хаммера-Чампи к классификации бизнес-процессов газодобывающей компании они были представлены как основные, вспомогательные и управ ляющие процессы и описаны с помощью IDEF0 методологии моделирования бизнес-процессов.
Рассмотрены уровни автоматизации газодобывающего производства в рамках иерархической модели CIM. На каждом из её уровней выделены основ ные задачи автоматизации ГДК. Особое внимание было уделено уровню MES (Manufacturing Execution System – система управления производством). Сфор мулированы основные требования к MES, продиктованные особенностями не прерывного производства ГДК.
Анализ результатов работ ряда исследователей, а также анализ сущест вующего алгоритмического и программного обеспечения систем управления производством в газовой отрасли показал, что такие системы не обладают тре буемой функциональностью и, соответственно, неполно автоматизируют дея тельность специалистов основных производственных служб компаний. Более того, разработчики систем управления непрерывным производством в том чис ле, специализированных систем и программных комплексов для газодобываю щих компаний лишь иногда включают в эти системы и комплексы программ функции ИАД, основанные на использовании технологии оперативного анализа OLAP (On-line analysis processing) и технологий data mining (добыча знаний). В то же время наличие функций и позволит вывести управление производством на качественно иной, современный уровень.
Сделан вывод об актуальности разработки алгоритмического и программ ного обеспечения системы управления производством ГДК, включающей также средства реализации методов ИАД. Сформулированы цели и задачи диссерта ционного исследования.
Вторая глава посвящена принципам построения СУП и рассмотрению особенностей предложенной архитектуры системы управления.
Для формирования принципов построения СУП, а также общесистемных и функциональных требований, процесс управления производством описывается в виде взаимосвязанных алгоритмов диспетчерского управления и управления фондом скважин. Управление осуществляется в соответствии с этими алгорит мами и производится диспетчерской, геолого-промысловой и технологической службами компании, как на промыслах, так и в аппарате управления компани ей.
Основными принципами построения СУП являются:
1. Модульный принцип организации системы, который подразумевает воз можность расширения функциональности системы за счет добавления новых модулей. Современная СУП ГДК должна иметь набор модулей необходимых для конфигурирования автоматизированных рабочих мест (АРМ) различных специалистов основных производственных служб.
2. Принцип централизации производственных данных подразумевает орга низацию хранения и обработки производственных данных в виде единой базы данных (БД) и хранилища производственных данных (ХПД) компании.
3. Принцип расширяемости перечня решаемых задач ИАД подразумевает такую организацию СУП, при которой вновь реализуемые в системе методы, алгоритмы и модели ИАД не вызывали бы необходимости изменения её архи тектуры.
4. Принцип сужения информационных потоков предполагает, что при пе реходе от нижнего уровня управления компании к каждому последующему по ток производственных данных сужается.
Все требования к СУП разделены на общесистемные и функциональные требования. Среди сформулированных общесистемных требований приведем основные:
1. В состав СУП должно входить ХПД и тематические витрины данных для работы с производственными данными специалистов диспетчерской, техноло гической и геолого-промысловой служб компании;
2. СУП должна иметь средства включения в её состав программных моду лей, реализующих новые методы и модели ИАД.
Среди функциональных требований выделяются функции ИАД оператив ного и долгосрочного прогноза производственных показателей ГДК, функции автоматической разбраковки (оценки) результатов ГДИС и т.д.
На основе вышеописанных принципов и сформулированных требований была разработана архитектура СУП (рис. 1.).
СУП газодобывающей компании Подсистема ИАД Модуль Внешние Подсистема интерпретации Подсистема библиотеки Модели ИАД моделей ИАД для ИАД АРМ Диспетчера Модули ИАД DMX DMX Модули ИАД Витрина Модули MDX MDX диспетчерских Внутренние данных ETL библиотеки ИАД Внешние информационные АРМ Промыслового системы геолога Модули ИАД MDX Модули ИАД Хранилище Другие ETL производственных внешние Модули Витрина геолого MDX данных источники промысловых ХПД данных данных АРМ Технолога ETL Модули ИАД Данные от Модули ИАД различных MDX Модули АСУ ТП OPC Витрина MDX технологических БДРВ данных База производственных данных ETL Данные ручного ввода Клиентская часть СУП Серверная часть СУП Рис. 1. Укрупненная схема архитектуры СУП Видим, что СУП имеет клиент-серверную архитектуру. Данные ручного ввода и технологические данные из баз данных реального времени (БДРВ) раз личных АСУ ТП промыслов по протоколу OPC поступают в единую базу про изводственных данных, откуда с помощью механизма ETL-процессов (Extract Transform Load) часть из них поступает в хранилище производственных данных (ХПД). С помощью этого же механизма данные поступают в ХПД из внешних информационных систем (ИС) и других внешних источников. Также с помо щью механизма ETL происходит наполнение тематических витрин данных, входящих в АРМ Диспетчера, АРМ Промыслового геолога и АРМ Технолога.
Работа с витринами происходит на языке доступа к многомерным данным MDX (Multidimensional Expressions – многомерные выражения). Выполнение анали тических функций обеспечивают модули ИАД, встроенные в каждую из витрин и осуществляющие взаимодействие с подсистемой ИАД на языке DMX (Data Mining Extensions – выражения добычи знаний). При использовании внешних библиотек, реализующих ряд процедур ИАД, используется модуль интерпрета ции моделей ИАД, который позволяет преобразовать и интерпретировать моде ли ИАД из внешних библиотек в виде выражений на языке DMX.
Фрагмент многомерной модели хранилища производственных данных представлен на рис. 2. Структура ХПД во многом повторяет структуру реляци онной базы производственных данных СУП, преобразованную в соответствии с правилами формирования многомерных баз данных (Multidimensional Data Ba ses). При этом сущности реляционной БД представляются в виде таблиц "фак тов" или связанных с ними таблиц "измерений" многомерной БД.
Измерение Измерение Факт Измерение Факт Факт Атрибуты пласта Характеристики Сведения о Сведения о (геологические запасы, Сведения о Атрибутивные данные по технологических перфорациях скважин перфорациях скважин перфорациях запасы, извлекаемые скважин прочим классам параметров (типы, Измерение Факт давление насыщения и объектов источники, интервалы т.д.) Характеристики Сведения о сбора, единицы плановых показателей перфорациях скважин измерения и т.д.) (объект планирования, область производства, единицы измерения и т.д.) Измерение Факт Отношения классов Сведения о Факт перфорациях скважин объектов Факт Значения Сведения о производственных Архив значений Сведения о перфорациях скважин показателей (плановые и технологических перфорациях скважин фактические) параметров Измерение Факт Сведения о Классы объектов перфорациях скважин Измерение Факт Характеристикиотипов Сведения планов (периодичность, перфорациях скважин автор, описание типа и т.д.) Факт Измерение Факт Спуск насосно Сведения о компрессорной трубы Факт Сведения о перфорациях скважин Время (дата спуска, глубина перфорациях скважин Сведения о спуска, внутренний Результаты ГДИС (тип перфорациях скважин диаметр, тип трубы и исследования, дата т.д.) исследования, буферное давление, пластовая температура и т.д.) Измерение Измерение Факт Атрибуты скважины Сведения о Сведения о (дата ввода в Куст скважин перфорациях скважин перфорациях скважин эксплуатацию, тип скважины, глубина забоя, дата начала бурения, профиль скважины и т.д.) Измерение Факт Измерение Факт Измерение Факт Сведения о Сведения о Прочие справочные Сведения о Вид скважины Текущая категория перфорациях скважин перфорациях скважин перфорациях скважин измерения Рис. 2. Фрагмент структуры хранилища производственных данных Такая структура хранилища позволяет специалистам формировать различ ные нерегламентированные (ad-hoc) запросы к ХПД, однако для повседневной работы предметных специалистов основных производственных служб ГДК ис пользуются тематические витрины данных.
В третьей главе рассматривается разработанное алгоритмическое обеспе чение СУП.
Предложен алгоритм формирования диспетчерских сводок, позволяющий вводить данные и корректировать результаты ручного ввода и использующий для ускорения работы дополнительную таблицу с индексами диспетчерских сводок.
Результаты исследования эффективности предложенного алгоритма в сравнении с результатами производительности традиционного алгоритма фор мирования диспетчерских сводок представлены на рис. 3. Здесь n – число про изводственных показателей (характеристик) в сводке, m – число строк сводки.
Результаты получены для практически интересных случаев: m = 24 (значе ния технологических параметров вводятся за каждый час суток) и m = 48 (зна чения параметров вводятся за каждый час за двое суток). Видим, что в практи чески значимых случаях, ко гда число параметров n 10, предложенный алгоритм ра ботает быстрее по сравне нию с традиционным алго ритмом. Причем при боль шом числе параметров он дает выигрыш в 1.5-2 раза.
Это очень важно для дис петчеров и технологов про мысла, которые желают, чтобы во всех случаях свод Рис. 3. Зависимость времени выполнения алго- ка формировалась не более ритмов от числа параметров в сводке 3-4 секунд.
В повседневной работе диспетчера и технолога основной проблемой при оперативном планировании является отсутствие аналитической функции для планирования среднечасового уровня добычи (дебета) УВС (газа). Это ключе вой параметр, который планируется для промысла, и именно этот параметр не управляется диспетчером напрямую (а лишь посредством изменения операто рами параметров и режимов работы скважин и технологического оборудова ния). Оперативный прогноз нужен, чтобы ответить на вопрос диспетчера (тех нолога): какой будет среднечасовая добыча УВС, если будут установлены те или иные параметры работы оборудования или часть его будет отключена? Рас смотрена задача оперативного прогноза параметров диспетчерской сводки в постановке «что если?» (задаются значения технологических параметров и изу чается, каким при этом будет значение среднечасовой добычи УВС). Как пока зал анализ, подходящими методами ИАД для решения этой задачи являются метод линейной регрессии и метод нейросети с многослойным персептроном.
Исходный набор исторических данных для экспериментов по оценке эф фективности этих методов составил 5230 кортежей – групп значений реально измеренных (с интервалом в два часа) значений технологических параметров (в том числе значений дебета Qфакт) двух кустов газовых скважин и установки комплексной подготовки газа одного из газоконденсатных месторождений За падной Сибири за последние полтора года.
Результаты исследования эффективности этих методов ИАД на описанном наборе исторических данных приведены в таблице. По мнению многих иссле дователей, наилучшим показателем качества прогноза среди приведенных в ней статистических показателей является коэффициент корреляции между исход ным (измеренным) значением среднечасового уровня добычи УВС Qфакт и спрогнозированным уровнем Qпрогноз. Чем выше коэффициент корреляции, тем лучше прогноз.
В случае использования метода нейросети значение коэффициента корре ляции выше, чем у метода линейной регрессии. При этом время обучения мо дели на используемом наборе исторических данных составило 0.59 с для рег рессионной модели и 7.9 с для модели нейросети. Поскольку не требуется час того перестраивания модели и нет особых требований по скорости обучения нейросети, более эффективным является метод нейросети. Для другого газо конденсатного месторождения Западной Сибири коэффициент корреляции ра вен 0.66 для метода линейной регрессии и 0.94 для метода нейросети.
Таблица. Статистические показатели результатов прогнозирования.
Показатель Метод линей- Метод нейросети ной регрессии Среднеквадратическое отклонение 7587.8 5463. (СКО), м3/час Коэффициент корреляции между 0.8155 0. Qфакт и Qпрогноз 100%*СКО/Среднее значение Qфакт 7.05% 5.07% Время построения модели, с 0.59 7. Учитывая результаты этих исследований, на основе метода нейросети предложен способ оперативного прогноза среднечасового уровня добычи УВС, дающий практически приемлемую точность (для газовой отрасли коэффициент корреляции должен быть не ниже 0.9) оперативного прогноза на основе ретро спективного анализа совокупности технологических параметров из диспетчер ских сводок промыслов.
Ежемесячно специалисты геолого-промысловой службы решают задачу расчета технологического режима работы скважин. В общей постановке эта за дача заключается в определении таких значений технологических параметров эксплуатации каждой из газовой скважин, при которых будут достигнуты за данные объемы добычи УВС на последующий месяц.
Для ее решения разработан комплексный алгоритм расчета технологиче ского режима работы скважины (ТРРС), включающий алгоритм расчета пла стового давления скважины, алгоритм расчета забойного давления скважины, алгоритм расчета дебита УВС (газ и газовый конденсат) скважины и алгоритм расчета дебита воды скважины. Исходными данными для расчета режима яв ляются суммарные фактические дебиты УВС, полученные на основе месячных эксплуатационных рапортов (МЭРов) по промыслу, ряд технологических пара метров (наружный и внутренний диаметры насосно-компрессорных труб сква жины, буферное и затрубное давления в скважине, критическая температура и критическое давление газоконденсатного пласта, планируемые на конец рас четного месяца пластовое и забойное давления и т.п.), а также данные периоди чески проводимых ГДИС. В результате расчета технологического режима для каждой скважины получают набор выходных данных: планируемые буферное и затрубное давления, планируемая депрессия, скорость потока УВС, планируе мый дебит УВС, дебит воды, дебит нефти и т.д.
Комплексный алгоритм расчета ТРРС включает не только вышеперечис ленный перечень алгоритмов, но и этап экспертной оценки результатов ГДИС промысловыми геологами с целью разбраковки этих результатов на пригодные в качестве исходных данных для дальнейшего расчета технологического режи ма или непригодные. В ходе разработки месторождения эксперт-геолог накап ливает неструктурированную информацию (экспертное знание) о каждой сква жине, о тенденциях отбора УВС из нее и т.д. Именно он, имея экспертное зна ние, принимает решение о том, следует ли использовать результаты гидроди намических исследований по этой скважине для расчета ее технологического режима. Учитывая огромный объем данных периодически проводимых ГДИС, эксперту непросто в кратчайший срок вынести обоснованное решение об их пригодности, поэтому требуется автоматическая разбраковка (оценка) данных ГДИС. Кроме того, это единственный этап комплексного алгоритма, препятст вующий проведению полностью автоматического расчета ТРРС.
Показано, что задача разбраковки результатов ГДИС сводится к задаче би нарной классификации. Для реализации такого подхода необходимо выбрать наиболее точный метод (алгоритм) решения задачи бинарной классификации. С этой целью для исследования были рассмотрены наиболее известные и хорошо себя зарекомендовавшие методы и алгоритмы классификации: байесовский ме тод, группа методов деревьев решений, метод ближайшего соседа, нейросете вой метод (с использованием многослойного персептрона) и т.д., всего 23 мето да и алгоритма. В качестве исходных данных для эксперимента по выявлению наиболее точного метода (алгоритма) использовались 3453 кортежа (каждый кортеж – группа значений 14 технологических параметров, измеряемых при каждом ГДИС) – реальные результаты ГДИС по фонду газовых скважин одного из газоконденсатных месторождений Западной Сибири. Пригодными для рас чета технологического режима из них, по мнению экспертов-геологов, оказа лись 2317 кортежей, а непригодными – 1136. При оценке качества классифика ции использовалась точность, вычисляемая по формуле:
Точность =, где TP и TN - правильно классифицированные экземпляры (True positive, True negative), а FN и FP (False negative, False positive) – неправильно классифициро ванные экземпляры.
Исходный набор данных ГДИС (3453 кортежа) разбивался на 10 частей случайным образом. Использовался метод кросс-валидации, причем десятая часть исходного набора назначалась в качестве проверочного набора, а другие частей – обучающие наборы. Результаты исследований приведены на рис. 4.
Алгоритмы RandomTree, J48 и SimpleCart дают точность классификации свыше 85%. Наилучшим является алгоритм SimpleCart, дающий 87% точности. Для повышения точности классификации множество исследуемых алгоритмов можно, согласно работам Й. Фройнда и Р. Шапиро, подвергнуть бустингу (Boosting), который заключается в итеративном повторении исследуемого алго ритма с учетом результатов правильности классификации ГДИС этим алгорит мом на предыдущих итерациях. Результаты сравнения точности классификации данных ГДИС различными алгоритмами без бустинга и после бустинга показа ли, что большинство из них дают прирост точности в 1-2% относительно ре зультатов, приведенных на рис. 4. Результаты итеративного применения бус тинга для более точных алгоритмов представлены на рис. 5. Использование бустинга повысило точность классификации на 6% для алгоритма J48, реали зующего метод деревьев решений.
Рис. 4. Оценка точности алгоритмов Рис. 5. Результаты бустинга алго классификации ритмов J48, SimpleCart и RandomTree В результате максимальная точность классификации алгоритмом J48 была достигнута после 11 итераций и равна 92%. Именно этот алгоритм, обеспечи вающий практически значимую для газовой отрасли точность, рекомендовано использовать при разбраковке результатов ГДИС.
Таким образом, комплексный алгоритм расчета ТРРС получил развитие за счет добавления этапа автоматической разбраковки результатов ГДИС.
Ежегодно специалисты технологической службы совместно со специали стами геолого-промысловой службы компании планируют на последующий год ряд агрегированных показателей производства компании: уровень валовой до бычи газа, уровень добычи конденсата, объемы сдачи газового конденсата, объ емы потерь УВС и т.д. Среди них базовым и поэтому наиболее важным для прогноза других показателей является уровень валовой добычи газа. В этой связи задача качественного прогноза уровня валовой добычи газа является все гда актуальной для любой ГДК. Анализ показал, что большое число сущест вующих аналитических моделей и методов (методик) часто дают ошибочные результаты прогноза, поскольку не учитывают множества нестандартных си туаций при добыче УВС (плановых остановок скважин, внеплановых ремонтов установок комплексной подготовки газа и конденсата и т.д.).
Нами предложен подход к долгосрочному (не менее чем 1 год) прогнози рованию уровня валовой добычи газа по месторождению (промыслу) с помо щью метода (методики) Бокса-Дженкинса по временному ряду – историческим данным о ежемесячном уровне валовой добычи газа на месторождении. Этот временной ряд соответствует периоду времени с момента ввода месторождения в промышленную эксплуатацию. Метод Бокса-Дженкинса учитывает тот факт, что данные по ежесуточной валовой добыче газа и, соответственно, по ежеме сячной добыче являются элементами временного ряда, которые последователь но зависят друг от друга. Метод основывается на модели авторегрессионного интегрированного скользящего среднего ARIMA, позволяющей предсказывать будущие точки временного ряда.
Возможности метода Бокса-Дженкинса исследовались на исторических данных – ежемесячных уровнях валовой добычи газа за несколько лет для од ного из газоконденсатных месторождений Западной Сибири с момента его вво да в промышленную эксплуатацию. Для оценки качества прогноза использова лась средняя ошибка MAPE (mean absolute percentage error):
, где Qiпрогноз – прогнозное значение уровня валовой добычи газа в i-м месяце, Qiфакт – фактическое значение уровня валовой добычи газа в i-м месяце, n – чис ло месяцев.
а б Рис. 6. Результаты прогноза уровня валовой добычи газа а – случай полного временного ряда, б – случай скорректированного ряда Результаты исследований приведены на рис. 6а, MAPE = 12.8%. Показано, что данные о валовой добыче газа, полученные на этапе вывода фонда скважин на проектное число скважин (с 01.05.1999 г. по 01.02.2002 г.), вносят значи тельные искажения в модель ARIMA и поэтому прогнозный временной ряд по сле 01.02.2011 г. ведет себя неправдоподобно. Учитывая это, предложено уб рать начальную часть временного ряда (период с 01.05.1999 г. по 01.02.2002 г.), в течение которого осуществлялся ввод новых газовых скважин до выхода промысла на проектный уровень валовой добычи газа. Результаты прогноза на год (с 01.10.2011 г. по 01.10.2012 г.), когда исследования проводились на об новленной модели ARIMA, представлены на рис. 6б. MAPE значительно уменьшилась и составила 8.08%. Отметим, что прогноз на год уровня валовой добычи этого же месторождения, сделанный специалистами ГДК на тот же пе риод по одной из распространенных в газовой отрасли методик (основана на построении гидродинамической модели месторождения), дал ошибку MAPE = 21.84%. Это означает, что предложенный подход позволяет осуществить про гноз добычи газа на последующий год с более высокой точностью.
В четвертой главе описывается программное обеспечение СУП и резуль таты апробации системы и ее внедрения в ГДК ОАО «Томскгазпром».
Проведен выбор среды разработки и языков программирования. Использо вались современные среды разработки CodeGear Delphi Studio 2007 (язык Delphi) и Microsoft Visual Studio 2010 (язык C#). В качестве СУБД была выбра на система Microsoft SQL Server 2008 R2. Помимо коммерческой системы Mi crosoft Analysis Services для ИАД использована свободно распространяемая библиотека Weka.
В ходе апробации и внедрения СУП в ОАО «Томскгазпром» была решена задача интеграции СУП с внедренной в этой ГДК корпоративной геоинформа ционной системой управления (КГСУ) «Магистраль-Восток», созданной в Ин ституте кибернетики Томского политехнического университета.
СУП Газодобывающей компании Подсистема ИАД Библиотека Нейросетевая модель Модуль Weka оперативного интерпретации Класс J прогноза уровня моделей ИАД Класс добычи газа Интерпретатор SimpleCart КГСУ «Магистраль- DMX нейросетевых Модель Класс Восток» моделей классификации RandomTree результатов ГДИС Класс АРМ Диспетчера Модуль Multilayer Модуль техпараметров оперативного Интерпретатор Модуль формирования Модель прогноза Perceptron прогноза диспетчерской сводки деревьев решений Модуль отчетов и форм валовой добычи добычи газа Модуль ручного ввода газа MDX Модуль журнала событий данных Витрина Класс N Модуль мнемосхем DMX диспетчерских MDX данных Модуль N Microsoft Analysis Внутренние АРМ Промыслового геолога Services библиотеки Модуль Модуль паспортизации ИАД Модуль расчета ТРРС классификации MDX Внешние Модуль техпараметров ГДИС MDX Модуль формирования источники Модуль планирования МЭР данных Витрина геолого ГДИС промысловых Хранилище Модуль отчетов и форм данных производственных Модуль M данных АРМ Технолога ХПД Модуль Модуль управления долгосрочного Модуль техпараметров балансами прогноза Модуль планирования Microsoft MDX Модуль формирования добычи газа MDX ППР SSIS годового плана ETL Витрина Модуль мнемосхем технологических Внешние данных Модуль L информационные База системы производственных ETL данных КГСУ «Магистраль БДРВ Серверное ПО СУП: Бизнес логика на основе восток» OPC АСУ ТП Автоматизированные хранимых процедур, функций и триггеров рабочие места Рис. 7. Обобщенная схема интеграции СУП и КГСУ «Магистраль-Восток».
При этом в состав АРМов СУП вошли некоторые модули КГСУ (интегра ция по функциям). В качестве базы производственных данных СУП использо вана БД КГСУ «Магистраль-Восток» (интеграция по данным). Обобщенная схема интеграции этих систем представлена на рис. 7. Модули КГСУ «Магист раль-Восток» и систем третьих производителей показаны на рис. 7. серым.
Результаты апробации СУП в ОАО «Томскгазпром» подтвердили эффек тивность разработанных алгоритмических и программных средств системы и их практическую значимость. На основе результатов декомпозиции основных производственных бизнес-процессов с помощью метода стоимостного анализа была сделана оценка экономического эффекта от внедрения СУП в ГДК ОАО "Томскгазпром".
В заключении приведены основные полученные в диссертационной рабо те результаты и сделанные выводы.
В приложения вынесены акты о внедрении полученных результатов и ма териалы справочного характера.
Основные результаты и выводы В ходе выполнения диссертационной работы были получены основные на учные и практические результаты и сделаны следующие выводы.
1. Проведен анализ результатов работ ряда исследователей по проблеме автоматизации управления непрерывным производством ГДК и анализ алго ритмического и программного обеспечения существующих систем управления производством в газовой отрасли. Сделаны выводы о том, что существующие системы не обладают требуемой функциональностью и лишь иногда имеют в своем составе функции ИАД. По результатам анализа поставлена цель создания алгоритмического и программного обеспечения системы управления производ ством ГДК, причем для повышения качества управления производством в этой системе должны реализовываться методы ИАД.
2. Предложены принципы создания и разработана архитектура СУП, отли чающаяся от архитектуры традиционных систем управления производством та ких компаний ведущей ролью хранилища производственных данных, тематиче ских витрин данных и подсистемы ИАД. Разработаны структуры ХПД и тема тических витрин данных.
3. Разработан алгоритм формирования диспетчерских сводок. В результате проведенных исследований показано, что он позволяет производить формиро вание сводок в практически значимых случаях быстрее, чем традиционные ал горитмы.
4. Предложен оригинальный способ оперативного прогноза среднечасово го уровня добычи УВС, основанный на нейросетевом методе и дающий, как по казали исследования, практически приемлемую точность прогнозирования.
5. Разработаны алгоритмы расчета технологического режима работы газо вых скважин. При этом предложен подход к разбраковке результатов гидроди намических исследований скважин, путем решения задачи бинарной классифи кации. Сделан вывод о возможности производить автоматическую разбраковку результатов этих исследований.
6. Разработан подход к долгосрочному прогнозированию уровня валовой добычи газа по временному ряду из ежемесячных уровней добычи газа по ме сторождению. Результаты проведенных исследований показали, что он обеспе чивает точность прогноза выше, чем у широко применяемых в газовой отрасли методик прогноза валовой добычи газа.
7. Создано программное обеспечение СУП. Объем исходного кода разра ботанных программных средств составляет более 15000 строк кода на языках C#, Delphi, T-SQL, MDX и DMX.
8. Проведены апробация и внедрение разработанного алгоритмического и программного обеспечения СУП в газдобывающей компании ОАО «Томскгаз пром», при этом СУП была интегрирована с корпоративной геоинформацион ной системой управления «Магистраль-Восток». На основе результатов деком позиции основных производственных бизнес-процессов с помощью метода стоимостного анализа была сделана оценка экономического эффекта от внедре ния СУП. Результаты апробации подтвердили эффективность разработанной архитектуры, алгоритмических и программных средств СУП.
Основные публикации по теме диссертации Статьи, опубликованные в изданиях из перечня ВАК:
1. Богдан С.А., Ковин Р.В., Кудинов А.В., Марков Н.Г. Инструментальные средства разработки систем оперативного диспетчерского управления газо транспортными сетями // Известия Томского политехнического университета.
— 2006. — Т.309 — № 7. — С. 74–80.
2. Bogdan S.A., Kudinov A.V., Markov N.G., Rodikevich S.S. Automation of monitoring in gas producing company // Bulletin of the Tomsk Polytechnic Universi ty. — 2007. — V. 311 — № 5. — P. 27–32.
3. Богдан С.А., Кудинов А.В. Принципы построения систем принятия реше ний для оперативного диспетчерского управления в MES газодобывающих компаний // Известия Томского политехнического университета. — 2007. — Т.313 — № 5. — С. 153–157.
4. Богдан С.А., Кудинов А.В., Марков Н.Г. Опыт внедрения MES «Магист раль-Восток» в нефтегазодобывающей компании // Автоматизация в промыш ленности. — 2010. — №8. — С. 53–58.
5. Вейбер В.В., Богдан С.А., Кудинов А.В., Марков Н.Г. Концепция по строения платформы для интеграции производственных данных нефтегазодо бывающей компании // Известия Томского политехнического университета. – 2011. – № 5. – С. 126–131.
Статьи, тезисы докладов на междунар. и всеросс. конференциях:
6. Богдан С.А., Кудинов А.В., Марков Н.Г., Мирошниченко Е.А., Острасть П.М., Родикевич С.С. Автоматизация процессов диспетчерского управления нефте- и газотранспортными сетями // Автоматическое управление и информа ционные технологии. Межвуз. сборник научно-технических работ ученых. – Томск: Изд-во ТПУ. – 2005. – Вып. 1. – С. 56–64.
7. Богдан С.А., Ковин Р.В. Способ повышения эффективности визуализации цифровых рельефов местности, представленных в виде регулярной сети и опи санных большими массивами данных с помощью OPENGL // Современные техника и технологии: Труды XII Междун. научно-практ. конф. студентов и молодых ученых. – Томск: Изд-во ТПУ. – 2006. – С. 36–38.
8. Богдан С.А., Кудинов А.В., Марков Н.Г., Родикевич С.С. Применение геоинформационной системы «Магистраль-Восток» для решения задач диспет черского управления в газодобывающей компании // Компьютерные техноло гии поддержки принятия решений в диспетчерском управлении газотранспорт ными и газодобывающими системами: Междун. научно-техническая конф. – Москва: Изд-во ВНИИГАЗ. – 2007. – С. 48–53.
9. Богдан С.А., Кудинов А.В., Фам Тхи Зуен Анализ технологий для разра ботки диспетчерских листов // Сб. трудов VII Всеросс. научно-практ. конф.
студентов, аспирантов и молодых ученых «Молодежь и современные информа ционные технологии». – Томск: Изд-во СПБ Графикс – 2009. – С. 137–141.
10. Богдан С.А., Кудинов А.В. Реализация подсистемы диспетчерского лис та в составе АРМ диспетчера MES Магистраль – Восток на основе концепции OBA // Технологии Microsoft в теории и практике программирования: Сб. тру дов VI Всероссийской. научно-практической конф. студентов, аспирантов и молодых ученых. – Томск: Изд-во ТПУ. – 2009. – С. 82 – 84.
11. Bogdan S., Kudinov А., Markov N. Example of implementation of MES Magistral-Vostok for oil and gas production enterprise // Proceedings of 5-th Central and Eastern European Software Engineering Conference (CEE-SECR'2009). – Moscow: IEEE – ISBN 978-1-4244-5664-2. – 2009. – P. 131 – 136.
12. Bogdan S., Kudinov A., Markov N. Manufacturing Execution Systems Intel lectualization: Oil & Gas Implementation Sample // Proceedings of 1-st International Conference on Model & Data Engineering (MEDI'2011). – Portugal, Obidos. – L.
Bellatreche and F. Mota Pinto (Eds.). – Springer-Verlag Berlin Heidelberg. – 2011. – P. 170–177.