G.1. pgpro_datactl — управление файлами данных Postgres Pro Enterprise
G.1.1. Обзор
Утилита pgpro_datactl предоставляет инструменты для управления файлами данных Postgres Pro Enterprise и включает в себя модуль для работы с CFS (Compressed File Storage, сжатая файловая система). Этот модуль предлагает следующую функциональность:
Получение метаданных сжатых файлов, включая алгоритм сжатия и их расположение.
Распаковка файлов CFS для дальнейшего анализа.
Перепаковка сжатых файлов и изменение их уровня сжатия.
Предотвращение потенциальных сбоев, вызванных повреждёнными файлами.
G.1.2. Установка
pgpro_datactl поставляется вместе с Postgres Pro Enterprise в виде отдельного пакета pgpro-datactl-ent-13 (подробные инструкции по установке приведены в Главе 17).
G.1.3. Команды
pgpro_datactl поддерживает следующие команды:
G.1.3.1. Важные замечания
Перед запуском этих команд ознакомьтесь со следующими особенностями их работы:
Операции
repackиunpackтребуют остановки кластера Postgres Pro Enterprise. Это необходимо для того, чтобы избежать повреждения данных и обеспечить целостность файлов.При использовании параметра
--in-placeс командойrepackследует учитывать следующее:Табличное пространство будет перезаписано непосредственно в процессе работы.
Все существующие данные в целевом табличном пространстве будут заменены.
G.1.3.2. unpack
pgpro_datactl unpack --source=исходный_путь--target=целевой_путь[--calg=алгоритм_сжатия] [--zero-on-error] [--log-level=уровень_сообщений] [--help]
Распаковывает файлы CFS.
-s=исходный_путь--source=исходный_путьУказывает путь к сжатому файлу или каталогу.
Примечание
Путь должен находиться в каталоге с именем
PG_, содержащем файлверсия_датаpg_compression.-t=целевой_путь--target=целевой_путьУказывает путь к каталогу, в который будут помещены распакованные файлы.
Если исходный и целевой каталоги совпадают, файлы распаковываются с расширением
.dec.-c=алгоритм_сжатия--calg=алгоритм_сжатияУказывает используемый алгоритм сжатия. Если параметр не указан, команда
unpackвозьмёт это значение из файлаpg_compression.--zero-on-errorПри указании этого параметра все повреждённые блоки заменяются нулями, что предотвращает аварийное завершение процесса или появление сообщений об ошибках.
--log-level=уровень_сообщенийУстанавливает уровень сообщений. Возможные значения:
debug,info,warningиerror.
Пример:
pgpro_datactl unpack -s /path/to/archive.cfs -t /path/to/destination -c zstd
В этом примере unpack извлекает файл archive.cfs, сжатый алгоритмом zstd, в каталог /path/to/destination.
G.1.3.3. probe
pgpro_datactl probe --source=исходный_путь[--log-level=уровень_сообщений] [--help]
Анализирует указанный файл и определяет следующее:
Тип сжатия. Алгоритм сжатия
zlibилиzstd.Уровень фрагментации. Анализирует соответствующий файл
*.cfm(при его наличии) и сообщает процент неиспользуемого пространства в физическом файле.Принадлежность файла к CFS. Проверяет наличие связанного файла
*.cfm, что указывает на принадлежность файла к архиву CFS.
-s=исходный_путь--source=исходный_путьУказывает путь к нужному файлу.
--log-level=уровень_сообщенийУстанавливает уровень сообщений. Возможные значения:
debug,info,warningиerror.
Пример вывода:
Probing path: /data/sample.dat Has cfm file: Yes pg_compression: zstd Actual compression: zstd Fragmentation: 5%
В этом примере файл сжат алгоритмом zstd, является частью архива CFS и имеет уровень фрагментации пять процентов.
G.1.3.4. info
pgpro_datactl info --source=исходный_путь[--log-level=уровень_сообщений] [--help]
Анализирует файл и отображает следующую информацию:
Физический и виртуальный размер файла, а также используемое им пространство в байтах.
Включён ли сборщик мусора (
GC).Наличие и доступность файла
*.cfm.
-s=исходный_путь--source=исходный_путьУказывает путь к нужному файлу.
--log-level=уровень_сообщенийУстанавливает уровень сообщений. Возможные значения:
debug,info,warningиerror.
Пример вывода:
Physical size: 10485760 Virtual size: 9437184 Used size: 7864320 GC active: Yes
G.1.3.5. repack
pgpro_datactl repack --source=исходный_путь--t-calg=целевой_алгоритм_сжатия--target=целевой_путь[--calg=алгоритм_сжатия] [--clevel=уровень_сжатия] [--zero-on-error] [--log-level=уровень_сообщений] [--help]
Меняет алгоритм сжатия и/или уровень сжатия файлов CFS.
Возвращает следующую информацию:
Идентификатор алгоритма сжатия
Уровень сжатия
Результат копирования:
1(завершено) или0(не завершено).
Если операция была прервана, при повторном выполнении команды с теми же параметрами сжатия (значения --t-calg и --calg) перепаковка продолжится с момента прерывания благодаря наличию соответствующего каждому файлу данных файла .status.
-s=исходный_путь--source=исходный_путьУказывает путь к сжатому файлу или каталогу.
Примечание
Путь должен находиться в каталоге с именем
PG_, содержащем файлверсия_датаpg_compression.--t-calg=целевой_алгоритм_сжатияУказывает целевой алгоритм сжатия. Если параметр опущен, файлы будут распакованы.
-t=целевой_путь--target=целевой_путьУказывает путь к каталогу для перепакованных файлов.
-c=алгоритм_сжатия--calg=алгоритм_сжатияУказывает текущий алгоритм сжатия. Если параметр не указан, команда
repackвозьмёт это значение из файлаpg_compression.--log-level=уровень_сообщенийУстанавливает уровень сообщений. Возможные значения:
debug,info,warningиerror.--clevel=уровень_сжатияОпределяет уровень сжатия для выбранного алгоритма. Значение по умолчанию —
1.--zero-on-errorПри указании этого параметра все повреждённые блоки заменяются нулями, что предотвращает аварийное завершение процесса или появление сообщений об ошибках.
--in-placeЕсли указать этот параметр без
целевого_пути, перепакованные файлы будут размещены в исходном каталоге.Предупреждение
При использовании этого параметра все исходные файлы будут удалены из исходного каталога, поэтому применяйте его с осторожностью.
G.1.3.6. ground
pgpro_datactl ground --source=исходный_путь--block-num=номер_блока[--calg=алгоритм_сжатия] [--log-level=уровень_сообщений] [--help]
Заменяет нулями указанные повреждённые блоки, которые могут появиться при распаковке.
-s=исходный_путь--source=исходный_путьУказывает путь к нужному файлу.
--block-num=номер_блокаУказывает номер блока, который нужно заменить.
-c=алгоритм_сжатия--calg=алгоритм_сжатияОпределяет текущий алгоритм сжатия. Если значение не соответствует алгоритму сжатия табличного пространства CFS, операция завершится ошибкой.
--log-level=уровень_сообщенийУстанавливает уровень сообщений. Возможные значения:
debug,info,warningиerror.
Пример:
pgpro_datactl ground -s /path/to/archive.cfs --block-num 4 --calg pglz
В этом примере команда ground заменяет блок номер 4 нулём и использует алгоритм pglz для его сжатия.
G.1.3.7. stat
pgpro_datactl stat --source=исходный_путь--cfs [--log-level=уровень_сообщений] [--help]
Собирает статистику табличного пространства и выводит результат в виде CSV-файла.
Эта команда не вносит изменений в файлы (режим только для чтения). Блокировки не устанавливаются.
-s=исходный_путь--source=исходный_путьУказывает путь к сжатому файлу или каталогу.
Примечание
Путь должен находиться в каталоге с именем
PG_, содержащем файлверсия_датаpg_compression.--cfsУказывает тип табличного пространства.
Примечание
В настоящее время реализована поддержка только типа CFS.
--log-level=уровень_сообщенийУстанавливает уровень сообщений. Возможные значения:
debug,info,warningиerror.
G.1.4. Коды ошибок pgpro_datactl
В Таблице G.1 показаны диапазоны кодов ошибок утилиты pgpro_datactl.
Согласно стандарту SQL, первые два символа кода ошибки обозначают класс ошибок, а последние три — определённое условие в этом классе.
Таблица G.1. Диапазоны кодов ошибок pgpro_datactl
| Код ошибки | Условие |
|---|---|
| 00XXX | Успех |
| 10XXX | Предупреждение |
| 20XXX | Ошибка командной строки |
| 30XXX | Ошибка базы данных |
| 40XXX | Ошибка исходных данных |
| 50XXX | Ошибка целевых данных |
| 60XXX | Ошибка файловой системы/ввода-вывода |
| 70XXX | Ошибка времени выполнения |
В Таблице G.2 перечислены все конкретные коды ошибок и действия, которые следует выполнить при их возникновении.
В утилите pgpro_datactl используется формат PRODCTL-XXXXX. Предупреждения возвращают ненулевой код выхода, но работа продолжается. Ошибки приводят к остановке текущей операции.
Таблица G.2. Коды ошибок pgpro_datactl
| Код ошибки | Сообщение | Причина | Действие |
|---|---|---|---|
| PRODCTL-00000 | Успех | Операция успешно завершена. | Никаких действий не требуется. |
| PRODCTL-10001 | File not found. | Отсутствует необязательный входной файл. | Проверьте путь. Если отсутствие файла ожидаемо, предупреждение можно игнорировать. |
| PRODCTL-10002 | Failed to read file. | Частичное чтение, ошибка прав доступа или временная проблема ввода-вывода. | Повторите операцию. Проверьте права доступа пользователя и состояние диска. |
| PRODCTL-10003 | Invalid parameter. | Неверное значение или формат некритического аргумента. | Введите допустимое значение, иначе будет применено значение по умолчанию. |
| PRODCTL-10004 | Failed to allocate memory. | Нехватка памяти в системе на некритическом этапе. | Уменьшите параллелизм или размер данных. |
| PRODCTL-10005 | Failed to create working directory. | Не удалось определить текущий или рабочий каталог. | Проверьте путь, права доступа и свободное место на диске. |
| PRODCTL-10006 | File contains invalid content. | Необязательный файл не прошёл проверку. | Замените или пропустите файл. |
| PRODCTL-10007 | Failed to remove file. | Файл заблокирован, или отсутствуют права доступа. | Закройте все дескрипторы файла и настройте права доступа. |
| PRODCTL-10008 | Parameter required but not set. | Для необязательной подзадачи не предоставлено обязательное значение, поэтому использовано значение по умолчанию. | Укажите отсутствующий параметр, чтобы не использовать резервный вариант. |
| PRODCTL-20001 | Required parameter is missing. | Отсутствует обязательный параметр командной строки. | Добавьте необходимый параметр и перезапустите команду. |
| PRODCTL-20002 | Invalid parameter. | У параметра командной строки недопустимое значение. | Укажите корректное значение согласно документации. |
| PRODCTL-30001 | Database connection failed. | Возникла ошибка сети, аутентификации или DSN. | Проверьте аутентификацию, сетевое соединение и конфигурацию SSL. |
| PRODCTL-30002 | Database query failed. | Ошибка SQL, тайм-аут или проблема прав доступа. | Проверьте SQL и журналы. Поправьте схему или права доступа. |
| PRODCTL-40001 | Failed to read source file. | Ошибка ввода-вывода входных данных. | Убедитесь, что путь существует и пользователь имеет к нему доступ. Повторите попытку. |
| PRODCTL-40002 | Source file not found. | Требуемый входной файл отсутствует. | Укажите верный файл или исправьте путь. |
| PRODCTL-40003 | Failed to construct source path. | Некорректный корневой путь, переменная окружения или шаблон. | Исправьте конфигурацию и шаблон пути. |
| PRODCTL-40004 | File contains invalid content. | Ошибка проверки обязательных входных данные или несоответствие контрольной суммы. | Замените файл или исправьте его формат. |
| PRODCTL-50001 | Target file write failed. | Ошибка прав доступа, дисковой квоты или диска. | Освободите место на диске, исправьте права доступа и повторите попытку. |
| PRODCTL-50002 | Target file not found. | Отсутствует ожидаемый выходной путь или родительский каталог. | Создайте необходимые каталоги, проверьте целевой путь. |
| PRODCTL-60001 | File remove failed. | Доступ запрещён, или файл используется. | Снимите все блокировки с файла, настройте права доступа. |
| PRODCTL-60002 | Open file failed. | Файл не найден, или доступ был запрещён. | Убедитесь, что файл существует, проверьте права доступа. |
| PRODCTL-60003 | Open stream failed. | Канал, сокет или файловый дескриптор недоступен. | Проверьте конечную точку и права доступа. |
| PRODCTL-60004 | File write failed. | Досрочное завершение записи или общая ошибка ввода-вывода. | Повторите попытку. Проверьте состояние диска и файловой системы. |
| PRODCTL-60005 | File fsync failed. | Не удалось сбросить данные в постоянное хранилище. | Проверьте диск, параметры монтирования и журналы ядра (dmesg). |
| PRODCTL-60006 | File create failed. | Родительский каталог отсутствует, или выданы неверные права доступа. | Убедитесь, что родительский каталог существует, исправьте umask или права доступа. |
| PRODCTL-60007 | File rename failed. | Исходный файл не существует, или прав доступа недостаточно. | Убедитесь, что исходный файл существует, проверьте права доступа. Повторите попытку. |
| PRODCTL-60008 | Failed to mmap file. | Ошибка mmap или нехватка адресного пространства. | Переключитесь на буферизованный ввод-вывод или уменьшите размер отображаемых данных. |
| PRODCTL-60009 | Failed to stat file. | Путь некорректен, или прав доступа недостаточно. | Проверьте путь и права доступа пользователя. |
| PRODCTL-70001 | Memory allocation failed. | Нехватка памяти в системе на критическом этапе. | Уменьшите параллелизм или увеличьте системные ограничения памяти. |
| PRODCTL-70002 | Failed to create directory. | Отсутствует родительский каталог, или прав доступа недостаточно. | Создайте родительский каталог, проверьте права доступа. |
| PRODCTL-70003 | Failed to open directory. | Указанный путь не ведёт к каталогу, или доступ запрещён. | Убедитесь, что путь указывает на каталог и доступ к нему разрешён. |