Table Of ContentФедеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
«Тюменский государственный нефтегазовый университет»
В. А. Белкина
МЕТОДЫ СИСТЕМАТИЗАЦИИ И НАКОПЛЕНИЯ
ГЕОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
В СРЕДЕ PARADOX
Учебное пособие
Тюмень
ТюмГНГУ
2010
1
УДК 55(075.8): 004(075.8)
ББК 26.3(я73) + 22ю18(я73)
Б 43
Рецензенты:
доктор геолого-минералогических наук, профессор А. А. Дорошенко
кандидат технических наук Р. К. Ахмадулин
Белкина, В. А.
Б 43 Методы систематизации и накопления геологической инфор-
мации в среде Paradox [Текст] : учебное пособие / В. А. Белкина. -
Тюмень: ТюмГНГУ, 2010. – 124 с.
ISBN 978-5-9961-0236-5
В учебном пособии рассмотрены особенности архитектуры баз дан-
ных и моделей данных в нефтегазовой геологии. Подробно изложены
средства работы с базами данных в среде Paradox (V 9.0), а именно осо-
бенности создания баз данных в геологической отрасли знаний и извле-
чения и преобразования информации геологом-нефтяником при решении
геологических задач. Излагаемые способы работы с объѐмной геологиче-
ской информацией проиллюстрированы на примере учебных баз данных.
Рекомендуется для студентов высших учебных заведений, обучаю-
щихся по специальности 130304 «Геология нефти и газа», а также для
инженеров, использующих компьютерные технологии.
УДК 55(075.8): 004(075.8)
ББК 26.3(я73) + 22ю18(я73)
ISBN 978-5-9961-0236-5 © Государственное образовательное
учреждение высшего
профессионального образования
«Тюменский государственный
нефтегазовый университет», 2010
2
ВВЕДЕНИЕ
Компьютерные технологии построения геологических моделей и
решения на их основе геологических задач последние 15-20 лет развива-
ются стремительно. Одновременно с этим процессом также быстро растут
объемы информации, подлежащие систематизации, хранению и обработке.
Современные компьютерные технологии предоставляют пользовате-
лю возможность составления произвольной технологии из набора доступ-
ных программ. Такой принцип формирования графов обработки потребо-
вал стандартизации и унификации информационных потоков, что стиму-
лировало дальнейшее развитие баз данных (БД).
В настоящее время основной упор делается на использование сете-
вых информационных технологий, базирующихся на архитектуре кли-
ент/сервер, и переходе от малопонятных внутренних процедур к содержа-
тельной работе с предметной областью, которую описывают хранимые
данные. Современные БД предоставляют пользователям, как правило,
возможность коллективной работы в глобальной информационной систе-
ме. Существует обширная научная литература, посвященная теоретиче-
ским аспектам создания БД и языкам программирования. Но практически
отсутствует литература по приобретению навыков работы с БД, содержа-
щими геологическую информацию. В настоящем учебном пособии изла-
гаются основы и примеры построения баз данных для различных разде-
лов нефтегазовой геологии, а также приѐмы работы в среде Paradox (Вер-
сия 9.0), разработанной фирмой Borland. СУБД Paradox в настоящее время
довольно широко используется на уровне цехов различных нефтегазодо-
бывающих предприятий и на уровне лабораторий проектных и недрополь-
зовательских центров.
Настоящее пособие является результатом обобщения опыта почти
десятилетнего чтения курса по тематике баз данных в институте геологии
и геоинформатики для студентов специальности «Геология нефти и газа».
Пособие состоит из девяти глав.
Глава 1 «Принципы организации баз данных и систем управления
БД» рассматривает основополагающие вопросы: что такое база данных,
виды моделей данных, реляционные модели данных. В этой же главе по-
дробно описаны учебные базы данных.
В главе 2 «Разработка и изменение структуры таблиц» изложены ко-
манды создания и редактирования структуры БД и информации в табли-
цах. Внимание также уделено различным способам проверки правильно-
сти вводимой эмпирической информации.
Глава 3 «Способы просмотра данных» помогает пользователю созда-
вать удобные способы выводы информации на экран дисплея.
3
В главе 4 «Запросы» подробно описаны и проиллюстрированы на
различных примерах основные команды, позволяющие извлекать и преоб-
разовывать информацию из таблиц.
Глава 5 «Сложные запросы» рассматривает возможности статисти-
ческой обработки информации из таблиц.
В главе 6 «Разработка документов» рассматриваются общие особен-
ности разработки двух видов документов, допустимых в среде Paradox:
формы и отчѐты.
Глава 7 «Разработка форм» содержит подробное изложение спосо-
бов создания форм.
Глава 8 «Кросстаблицы» содержит сведения о возможности созда-
ния таблиц в среде Paradox со значениями статистических параметров.
Глава 9 «Графики» рассматривает широкие возможности визуально-
го представления информации в среде Paradox.
Автор выражает большую благодарность и надежду на дальнейшее
сотрудничество А. А. Лаптеву (к. г. – м. н., заведующему лабораторией
ООО «ТюменНИИгипрогаз» и В. Ф. Гришкевичу (д. г.-м. н., главному спе-
циалисту «ГазПромНефть»), советами и помощью которых автор пользо-
вался при работе над пособием.
4
1. ПРИНЦИПЫ ОРГАНИЗАЦИИ БАЗ ДАННЫХ И СИСТЕМ
УПРАВЛЕНИЯ БАЗОЙ ДАННЫХ
1.1. Основные понятия
За прошедшие годы было сделано немало попыток дать определение
понятию «база данных». Для пользователей БД наиболее подходящим яв-
ляется следующее. База данных - это совокупность данных, отобранная
по определенным критериям (признакам) и организованная с определен-
ной целью. Под организованностью данных здесь понимается то, что БД
включает данные, которые сохраняются, имеют определенный формат
(отформатированы), к ним обеспечен доступ, и они могут быть представ-
лены потребителю в приемлемом виде. Использование в определении по-
нятия «цели» означает, что данные должны обеспечивать решение некото-
рого круга задач, и в то же время в базе не должны содержаться данные, не
имеющие отношения к этому классу задач.
В действующем в настоящее время Законе РФ «О правовой охране
программ для электронных вычислительных машин и баз данных» от
23.09.92 №3523-1 дано такое определение: «База данных – это объектив-
ная форма представления и организации совокупности данных (напри-
мер, статей, расчѐтов), систематизированных таким образом, чтобы они
могли быть найдены и обработаны с помощью ЭВМ» /9/. Это определение
используется в обязательном порядке при регистрации БД как интеллекту-
альной собственности.
Для полноты понимания приведѐм ещѐ такое определение. База
данных – это систематизация и унификация поступающих данных в об-
щую систему просмотра и использования данных.
В каждом из приведѐнных определений БД подчѐркиваются опреде-
лѐнные особенности базы данных. Например, в третьем определении де-
лается упор на обязательных для БД систематизации и унификации, но ни-
чего не говорится о методах отбора информации, а в первом определении,
наоборот, внимание сосредоточено только на виде информации в БД и це-
лях еѐ использования. Из этого следует, что приведѐнные определения до-
полняют друг друга.
Понятным примером может служить одна из самых востребованных
в геологии база данных, которую условно назовѐм «Скважины». В ней
должна содержаться вся информация, касающаяся расположения скважин
(их наименования, координаты устьев, забоев), параметров скважин (глу-
бины забоя, даты начала и конца бурения, конструкции и т.д.), их статуса
(добывающие, нагнетательные) и т.д. В то же время в ней не должна со-
держаться избыточная информация, например, описание местности, бли-
жайших населенных пунктов и т.д. Другими словами, в этой базе содер-
жатся только сведения, непосредственно связанные с целью ее создания,
5
поиска и извлечения из БД информации по скважинам по различным кри-
териям. Для примера приведем следующие критерии поиска информации
в этой базе данных:
пробуренные на участке, заданном координатами: Х , X , Y ,
min max min
Y ;
max
пробуренные в заданном интервале времени в некоторой области;
имеющие глубину, превышающую некоторый порог, и т. д.
Современные базы данных, как правило, служат для хранения и об-
работки информации, касающейся различных аспектов геологической дея-
тельности и различных подразделений отрасли (достаточно крупных или
мелких, состоящих всего из нескольких человек). Например, это могут
быть БД на уровне цеха, на основе этих баз данных интегрированием ин-
формации создаются БД нефтегазодобывающих управлений (НГДУ), сле-
дующий иерархический уровень – это БД нефтегазодобывающего объеди-
нения. На следующем уровне может быть база данных по региону.
Например, в г. Тюмени различными научно-аналитическими центрами
поддерживается совокупность БД :
по ХМАО (ГП ХМАО – Югры «Научно-аналитический центр раци-
онального недропользования им. В. И. Шпильмана»),
ЯНАО (Группа компаний «СибНАЦ» ОАО Сибирский научно-
аналитический центр),
Тюменской области (ФГУП «ЗапСибНИИГГ»).
В Норвегии корпорацией POSС (Petrotechnical Open Software Corpo-
ration) создан и поддерживается банк данных по нефтяной геологии по
всей планете Земля. Корпорация POSС, созданная в октябре 1990 года пя-
тью нефтяными компаниями, в настоящее время включает порядка ста
компаний. В соответствии с сущностями и форматами POSС ведѐтся раз-
работка ряда баз данных и в г. Тюмени. База данных с POSС – ориентиро-
ванной структурой для ряда месторождений ЯНАО и Восточной Сибири
создана и поддерживается в ООО «ТюменНИИгипрогаз» под руковод-
ством А. А. Лаптева. К сожалению, в настоящее время пока не разрабаты-
вается банк данных по нефтегазовой геологии для всей Западно-Сибирской
провинции.
В соответствии со сказанным выше также используются термины:
база данных объединения, база данных НГДУ, база данных цеха и т. д.
Для каждой из БД соответствующая информация не должна выходить за
рамки деятельности соответствующего предприятия. Например, в базе
данных цеха должна содержаться информация о геологических исследова-
ниях и результатах их интерпретации участка работ и параметры разработ-
ки группы скважин, находящихся в ведении только этого цеха.
Фактически, когда БД отдельных подразделений сливаются (инте-
грируются) в более крупную базу данных, есть смысл говорить о банке
6
данных (data warehouse). БД меньшего размера, которые служат источни-
ком информации для более крупных баз, иногда называют операционными
или продуцированными базами данных. Когда несколько небольших по
объему БД объединяются в одну относительно больших размеров, по-
следняя может обслуживать более широкий круг запросов (задач). Есте-
ственно, базе данных более высокого уровня должен соответствовать и бо-
лее высокий уровень организационной структуры данных. Информация из
БД высокого уровня, как правило, служит информационной основой не
только для решения геологических задач, но и для принятия ответствен-
ных управленческих решений.
Данные, содержащиеся в геологических банках данных, накоплены
за достаточно длительный период времени (это могут быть результаты ис-
следований, проводимых в течение нескольких десятков лет) и в связи с
высокой стоимостью замеров в геологии имеют высокую цену.
При слиянии БД в банк данных более высокого иерархического
уровня возникают достаточно серьѐзные проблемы разного рода. Это,
прежде всего, наличие и использование в практике геологических работ
разных определений и обозначений. Например, до сих пор в разных учеб-
никах и словарях даются различные определения таких основополагающих
понятий, как: «месторождение», «фация» и т. д.
В последние 5 – 6 лет банки данных не ограничиваются только чисто
геологической информацией: отдельные таблицы содержат и географиче-
скую, и правовую информацию. Связано это, как правило, с проблемами
лицензирования недр.
В связи с появлением новой информации, происходит постоянное
пополнение БД на всех уровнях. Но данные, полученные в результате гео-
логических исследований, заносятся в базы данных импульсно, через
определенные интервалы времени после первичного обязательного тести-
рования на предмет ошибок.
Базы данных, которые в настоящее время занимают свыше 100 гбайт
памяти, называют сверхбольшими. Совершенно естественно, что со вре-
менем по мере повышения плотности записи информации на носителях,
совершенствования методов и средств распараллеливания обработки и
программных комплексов для работы с большими массивами данных из-
менится и значение границы, отделяющей сверхбольшие БД от прочих.
Работа любой БД невозможна без наличия двух компонент: соб-
ственно самих наборов данных и пакета программ, обеспечивающего ра-
боту с этими наборами. Упомянутые приложения получили название си-
стем управления базами данных.
Система управления базами данных (СУБД. Database Management
System - DBMS) – это программный комплекс, обеспечивающий функцио-
нирование базы данных. Она обеспечивает сохранность, безопасность, це-
лостность, взаимное соответствие и доступ пользователей к данным.
7
Компоненты наиболее полного варианта СУБД следующие:
интерфейс, дающий возможность общения с СУБД, в частности,
непосредственное управление данными с клавиатуры;
интерпретатор, позволяющий на алгоритмическом языке разраба-
тывать программы обработки данных;
компилятор для придания завершѐнной программе вида готово-
го коммерческого продукта в форме EXE-файла;
программы-утилиты для быстрого составления графов стандарт-
ных рутинных операций (генераторы отчѐтов, форм, таблиц,
экранных образов представления информации из таблиц и других
приложений).
В ведении СУБД, кроме самой информации, находятся словари дан-
ных (data dictionary). В этих словарях содержатся сведения обо всем, что
хранится в базе данных: наименованиях, структуре, размещении и типах.
Словари данных позволяют вместо больших текстовых констант вводить
их коды, что облегчает заполнение БД, то есть ускоряет процесс ввода ин-
формации и заметно уменьшает количество ошибок.
1.2. Требования к базам данных
К базам данных предъявляется целый ряд требований: актуальность,
безопасность, целостность, корректность, сохранность и т.д.
При создании, тестировании и сопровождении БД должна обеспечи-
ваться, прежде всего, безопасность. Другими словами, система должна
обеспечивать доступ к данным только определенному кругу пользовате-
лей, причем каждому из пользователей доступен сегмент информации, не-
обходимый для решения тех задач, которыми он занимается. Это означа-
ет обязательную регистрацию всех пользователей и последующее распо-
знавание пользователей для предоставления им доступа к тем или иным
сегментам данных. При этом пользователи имеют доступ только к копи-
рованию информации, а доступ к редактированию данных БД имеет толь-
ко системный администратор.
Как правило, СУБД предлагают несколько специфических механиз-
мов повышения уровня безопасности в дополнение к тем, которые уже
обеспечиваются операционной системой и системой поддержки сети.
Под термином целостность (integrity) понимается взаимная согласо-
ванность отдельных фрагментов данных и их корректность. Согласован-
ность означает, что все сегменты данных в БД должны быть единообразно
смоделированы и включены в систему.
Поясним целостность на примере. Геология как наука состоит из це-
лого ряда взаимосвязанных разделов (дисциплин): структурная геология,
промысловая геология, геотектоника, палеонтология, стратиграфия, мине-
ралогия и петрография и т.д. Каждому из этих разделов соответствуют,
8
как правило, отдельные БД, состоящие из наборов файлов. При необходи-
мости выбора данных из разных БД, но относящихся к одному геологиче-
скому объекту, СУБД и структура БД должны обеспечивать получение
информации, относящейся только к указанным объектам.
Под корректностью данных здесь понимается их достоверность, точ-
ность и значимость.
В функции целостности данных обязательно входит контроль дан-
ных, которые вводятся в систему или редактируются, они должны отсле-
живаться на предмет соответствия требованиям спецификаций.
Под корректностью данных здесь понимается их достоверность, точ-
ность и значимость.
Любая БД, а геологическая особенно, имеет высокую стоимость. По-
этому остро стоит проблема сохранности еѐ информации. Для этого перио-
дически вся информация из БД должна копироваться на внешние носители.
Актуальность означает, что в БД должна находиться вся имеющаяся
информация по каждому геологическому объекту.
1.3. Структура баз данных
Важным этапом развития компьютерных технологий было создание
систем управления файлами. Файл – это именованная область внешней
памяти, в которую можно записывать и из которой можно считывать дан-
ные. Система управления файлами занимается распределением внешней
памяти, отображением имен файлов в соответствующие адреса внешней
памяти и обеспечением доступа к данным.
Система управления файловыми данными широко используется и в
настоящее время и, наверняка, не потеряет своей актуальности ближайшие
15-20 лет. Прежде всего, файлы используются для хранения текстовых
данных: документов, текстов программ, небольших наборов данных и т.д.
Такие файлы обычно создаются и модифицируются с помощью различных
редакторов. Эти редакторы могут быть довольно простыми, такими, как
Word, Excel, Acrobat Reader, Matlab и др. в среде Windows. Все они поз-
воляют хранить, выбирать и модифицировать данные соответствующей
прикладной области.
Но расширение и углубление информационных технологий потребо-
вало расширения объемов используемых данных и, следовательно, значи-
тельного усложнения структуризации данных. Поясним это на примере.
Пусть изучаются статистические зависимости геологических параметров,
например, проницаемости от пористости (одномерная зависимость), ко-
эффициента нефтенасыщенности от физического параметра α , высоты
пс
залежи над зеркалом воды и коэффициента пористости (трѐхмерная ре-
грессия). Решение этих важных задач опирается на относительно неболь-
шие объемы данных, да и математический статистический аппарат, ис-
9
пользуемый для решения этой задачи, не представляет большой вычисли-
тельной сложности, т.е. он не требует больших ресурсов памяти и компью-
терного времени. Реализовать решение этой задачи в настоящее время
вполне приемлемо средствами программных приложений Excel, Маtlab, а
эффективнее всего (по объѐму трудозатрат и возможностей анализа раз-
личных вариантов) приложением Statistica и т.д.
Другое дело, если необходимо построить двумерную или трехмер-
ную модель сложно построенной залежи, на которой проведен довольно
большой объем геологических исследований. Решение указанной задачи
должно опираться на всю имеющуюся информацию. Перечислим только
возможные виды исследований:
геофизические исследования скважин;
результаты сейсмических исследований;
результаты анализа керна, шлама;
геолого-промысловая информация (дебиты эксплуатационных
скважин и приемистость нагнетательных, обводнѐнность продук-
ции, газовый фактор, анализы проб нефти и пластовой воды);
гидродинамические исследования пластов и скважин;
геохимические методы изучения продуктивных пластов;
изучение разрезов скважин по буримости пород;
термометрические методы.
Уже из этого краткого обзора видно, какие большие объемы разно-
родной информации используются при построении геологических моде-
лей. Добавим, что разные замеры производятся на объектах существенно
разного размера и имеют различную точность. При этом требуется воз-
можность интерактивного оперирования данными в любых наборах и со-
четаниях. Эта ситуация, как уже говорилось, требует новых гибких подхо-
дов к управлению данными, в частности, и новой структуризации данных.
Понятия архитектуры и структуры являются одними из важнейших в
теории БД /2/ и служат основой для понимания возможностей современ-
ных СУБД. Различают три уровня архитектуры БД:
внутренний уровень – наиболее приближенный к физической си-
стеме хранения данных. Он описывает, каким образом хранится
информация на файловом уровне;
внешний уровень – это способ предоставления данных непосред-
ственно пользователям. На внешнем уровне пользователям
предоставляется возможность редактирования и преобразования
данных средствами специального языка СУБД. Такая ориентиро-
ванность на конечного пользователя делает БД независимой от
физических параметров среды хранения данных;
концептуальный уровень – на этом уровне содержание БД пред-
ставляется в целом и формулируется в виде модели данных.
10