Рекомендуемая структура БД QBIS.Bank

Структура БД описывается в файле bisquit.st. Формат st-файла:

 <тип> "код области":<# области>,RPB;BPC <размещение>
 где:
    RPB - records per block - максимальное количество записей в блоке
    BPC - blocks per cluster - количество блоков в одном кластере

В данной статье пойдет речь только об областях типа «d», содержащие данные.

Параметр RPB рекомендуется выбирать исходя из среднего размера записи для всех таблиц в области данных. Для размера блока 8 КБ оптимальны следующие значения этого параметра:

  • 32 - большой размер записи (от 227 байт)
  • 64 - средний размер записи (до 227 байт)
  • 128 - малый размер записи (до 104 байт)
  • 256 - сверхмалый размер записи (до 42 байт)

Параметр BPC рекомендуется выбирать исходя из скорости роста области данных. Если область данных большая и растет очень быстро, то желательно, чтобы и размер кластера был большим. Возможные значения - 8, 64, 512.

Рекомендуемый файл bisquit.st

Рекомендуемая структура в файле bisquit.st основана на анализе нескольких клиентских баз данных, работающих в многофилиальном режиме. В конкретном Банке характер данных может отличаться от проанализированных, поэтому значения RPB необходимо подбирать индивидуально (например, для однофилиального режима размер записей в области «pos» меньше, поэтому значение RPB для этой области можно установить равным 256).

# Описание области Before Image
b .
# Служебная область (добавление таблиц в эту область запрещено)
d "Schema Area":6,64;1 .
#
# Транзакционные данные (быстрый рост, средний размер записи)
d "op":7,128;512 .
d "op-i":27,1;64 .
#
# История изменений (очень быстрый рост, средний размер записи)
d "history":8,128;512 .
d "history-i":28,1;64 .
#
# Допреквизиты (в т.ч. темпоральные), связи (быстрый рост, средний размер записи)
d "signs":9,128;512 .
d "signs-i":29,1;64 .
#
# Аналитические данные (очень быстрый рост, средний размер записи)
d "olap":10,128;512 .
d "olap-i":30,1;64 .
#
# Справочники, небольшие таблицы (медленный рост, малый/средний размер записи)
d "other":11,128;64 .
d "other-i":31,1;8 .
#
# Права доступа (медленный рост, малый размер записи)
d "perm":12,256;64 .
d "perm-i":32,1;8 .
#
# Клиентская база, счета, договоры (средний рост, средний размер записи)
d "acct":13,128;64 .
d "acct-i":33,1;8 .
#
# Остатки по счетам, субаналитика по счетам и договорам (быстрый рост, малый размер записи)
d "pos":14,128;512  .
d "pos-i":34,1;64 .
#
# Сообщения импорта-экспорта, заголовки отчетных данных (быстрый рост, большой размер записи)
d "msg":15,32;512  .
d "msg-i":35,1;8 .
#
# Справочники, текстовая информация (медленный рост, большой размер записи)
d "text":16,64;64  .
d "text-i":36,1;8 .
#
# Витрины данных (быстрый рост, большой размер записи)
d "mart":17,64;512  .
d "mart-i":37,1;8 .

При анализе учитывались следующие требования:

  • таблицы и индексы располагаются в разных областях, это необходимо для указания меньших значений BPC для областей с индексами, чтобы минимизировать размер малозаполненных таблиц, а также для удобства администрирования;
  • области olap, history, op, signs, msg, mart растут быстрее остальных;
  • в областях msg, text и mart средний размер записи значительно превосходит средний средний размер записей в БД, а область perm содержит записи с наименьшей длиной.

Перенос данных между областями

Одним из параметров БД, влияющих на производительность, является размещение таблиц БД по областям. Для эффективного доступа к данным таблица должна быть размещена в той области, которая больше всего ей подходит как по величине среднего размера записи, так и по скорости роста объемов данных. Для переноса таблиц и индексов из одной области в другую есть несколько способов:

  • Использование методики двоичного dump/load для передампливания всей БД целиком либо по частям. Эту технологию эффективно выполнять вместе с переходом на новую структуру хранения данных Type Area II, которая значительно увеличивает производительность БД.
  • Использование штатной утилиты PROUTIL TABLEMOVE

Для автоматизации процесса переноса таблиц между областями можно воспользоваться процедурой genscript.p, которая создаёт скрипт переноса таблиц и индексов, находящихся не в «своих» областях. Она использует информацию о структуре из текущей БД и специальный файл table.cfg. Этот файл конфигурации имеет следующую структуру:

 <area-name>:<table-name1>,<table-name2>,...
 ...

Файл table.cfg регулярно обновляется и выходит в составе патчей.

Процедура genscript.p создает скрипт movetable для переноса таблиц в новые области данных. Таблицы, не включенные в конфигурационный файл, будут помещены в область other. Если в текущей базе данных существует область с наименованием <area name>-i, то индексы будут автоматически перенесены в эту область, в противном случае индексы будут перенесены в одну область с данными.

Вызов:

 bq41d -p genscript.p -param "table.cfg,movetable"

Учтите, что штатная утилита PROUTIL TABLEMOVE осуществляет перенос данных в рамках одной транзакции. Записи одна за одной читаются в исходной таблице, копируются в новую таблицу, а затем исходные записи удаляются. Поэтому размер BI-файла может вырасти до 10 раз от размера самой таблицы.

Дополнительная информация