F.27. isn — типы данных для международных стандартов нумерации (ISBN, EAN, UPC и т. д.) #

Модуль isn предоставляет типы данных для следующих международных стандартов нумерации товаров: EAN13, UPC, ISBN (книги), ISMN (музыка) и ISSN (серийные номера). Номера проверяются на входе согласно жёстко заданному списку префиксов: этот список префиксов также применяется для группирования цифр при выводе. Так как время от времени появляются новые префиксы, этот список префиксов может устаревать. Ожидается, что будущая версия этого модуля будет получать список префиксов из одной или нескольких таблиц, благодаря чему его при необходимости смогут легко обновлять пользователи; однако в настоящее время этот список можно изменить, только модифицировав исходный код и перекомпилировав его. Также есть вероятность, что в будущем этот модуль лишится функций проверки префиксов и группирования цифр.

Данный модуль считается «доверенным», то есть его могут устанавливать обычные пользователи, имеющие право CREATE в текущей базе данных.

F.27.1. Типы данных #

В Таблице F.15 перечислены типы данных, реализованные модулем isn.

Таблица F.15. Типы данных isn

Тип данныхОписание
EAN13European Article Number (Европейский номер товара), всегда выводится в формате EAN13
ISBN13International Standard Book Number (Международный стандартный книжный номер), выводимый в новом формате EAN13
ISMN13International Standard Music Number (Международный стандартный музыкальный номер), выводимый в новом формате EAN13
ISSN13International Standard Serial Number (Международный стандартный серийный номер), выводимый в новом формате EAN13
ISBNМеждународный стандартный книжный номер, выводимый в старом коротком формате
ISMNМеждународный стандартный музыкальный номер, выводимый в старом коротком формате
ISSNМеждународный стандартный серийный номер, выводимый в старом коротком формате
UPCUniversal Product Code (Универсальный код товара)

Замечания:

  1. Номера ISBN13, ISMN13, ISSN13 являются номерами EAN13.

  2. Не все номера EAN13 (только их подмножество) представляют ISBN13, ISMN13 или ISSN13.

  3. Некоторые номера ISBN13 можно вывести в формате ISBN.

  4. Некоторые номера ISMN13 можно вывести в формате ISMN.

  5. Некоторые номера ISSN13 можно вывести в формате ISSN.

  6. Номера UPC являются подмножеством номеров EAN13 (по сути они являются номерами EAN13 без первой цифры 0).

  7. Любые номера UPC, ISBN, ISMN и ISSN можно представить как номера EAN13.

Внутри все эти типы представляются одинаково (64-битными целыми числами) и все они взаимозаменяемы. Различные типы введены для управления форматированием при выводе и для строгой проверки правильности ввода, что и определяет конкретный тип номера.

Типы ISBN, ISMN и ISSN выводят короткую версию числа (ISxN 10), когда это возможно, либо выбирают формат ISxN 13 для чисел, не умещающихся в короткую версию. Типы EAN13, ISBN13, ISMN13 и ISSN13 всегда выводят длинную версию ISxN (EAN13).

F.27.2. Приведения #

Модуль isn предоставляет следующие пары приведений типов:

  • ISBN13 <=> EAN13

  • ISMN13 <=> EAN13

  • ISSN13 <=> EAN13

  • ISBN <=> EAN13

  • ISMN <=> EAN13

  • ISSN <=> EAN13

  • UPC <=> EAN13

  • ISBN <=> ISBN13

  • ISMN <=> ISMN13

  • ISSN <=> ISSN13

При приведении EAN13 к другому типу выполняется проверка времени выполнения, соответствует ли исходное значение целевому типу, и если это не так, выдаётся ошибка. При других приведениях значения просто перемечаются, так что они успешно выполняются всегда.

F.27.3. Функции и операторы #

Модуль isn предоставляет стандартные операторы сравнения плюс поддержку индексов по хешу и B-деревьев для этих типов данных. Кроме того, он реализует ряд специализированных функций; они перечислены в Таблице F.16. В этой таблице под isn понимается один из типов данных модуля.

Таблица F.16. Функции isn

Функция

Описание

isn_weak ( boolean ) → boolean

Устанавливает ослабленный режим проверки ввода и возвращает новое состояние.

isn_weak () → boolean

Выдаёт текущее состояние ослабленного режима.

make_valid ( isn ) → isn

Делает неверный номер верным (сбрасывает флаг ошибки).

is_valid ( isn ) → boolean

Проверяет присутствие флага ошибки.


Ослабленный режим позволяет вставлять в таблицу неверные значения. Под неверным значением понимается номер, в котором не сходится проверочная цифра, а не номер отсутствует вовсе.

Зачем может понадобиться ослабленный режим? Ну например, у вас может быть большой набор номеров ISBN, и очень многие из них по каким-то странным причинам содержат неверную контрольную цифру (возможно, номера были отсканированы с печатного листа и были распознаны неправильно, или они вводились вручную, кто знает...). В любом случае суть в том, что вы хотите с этим разобраться, но вам нужно загрузить все эти номера в базу данных, а затем, возможно, использовать дополнительное средство поиска неверных номеров в базе данных, чтобы проверить и исправить данные; так что, например, вам нужно будет выбрать все неверные номера в таблице.

Если попытаться вставить в таблицу неверный номер в ослабленном режиме проверки, номер будет вставлен с исправленной проверочной цифрой, но выводиться будет с восклицательным знаком (!) в конце, например 0-11-000322-5!. Этот маркер ошибки можно проверить с помощью функции is_valid и очистить функцией make_valid.

Вы также можете принудительно вставить числа даже не в ослабленном режиме, добавив символ ! в конце номера.

Есть ещё одна особенность — во вводимом номере вместо проверочной цифры можно указать ? и нужная проверочная цифра будет вставлена автоматически.

F.27.4. Примеры #

-- Использование типов напрямую:
SELECT isbn('978-0-393-04002-9');
SELECT isbn13('0901690546');
SELECT issn('1436-4522');

-- Приведение типов:
-- заметьте, что номер ean13 можно привести к другому типу, только когда
-- этот номер будет допустимым для целевого типа;
-- таким образом, это НЕ будет работать: select isbn(ean13('0220356483481'));
-- а это будет:
SELECT upc(ean13('0220356483481'));
SELECT ean13(upc('220356483481'));

-- Создание таблицы с одним столбцом, который будет содержать номера ISBN:
CREATE TABLE test (id isbn);
INSERT INTO test VALUES('9780393040029');

-- Автоматическое вычисление проверочных цифр (обратите внимание на '?'):
INSERT INTO test VALUES('220500896?');
INSERT INTO test VALUES('978055215372?');

SELECT issn('3251231?');
SELECT ismn('979047213542?');

-- Использование ослабленного режима:
SELECT isn_weak(true);
INSERT INTO test VALUES('978-0-11-000533-4');
INSERT INTO test VALUES('9780141219307');
INSERT INTO test VALUES('2-205-00876-X');
SELECT isn_weak(false);

SELECT id FROM test WHERE NOT is_valid(id);
UPDATE test SET id = make_valid(id) WHERE id = '2-205-00876-X!';

SELECT * FROM test;

SELECT isbn13(id) FROM test;

F.27.5. Библиография #

Информация, на основе которой реализован этот модуль, была собрана с нескольких сайтов, включая:

Префиксы, используемые для группирования цифр, были также взяты с:

Алгоритмы реализованы со всей тщательностью и скрупулёзно сверены с алгоритмами, предлагаемыми в официальных руководствах ISBN, ISMN, ISSN.

F.27.6. Автор #

Герман Мендез Браво (Kronuz), 2004–2006

Этот модуль написан под влиянием кода isbn_issn Гаретта А. Уоллмена.