| От | Tom Lane |
|---|---|
| Тема | Re: Corruption of multibyte identifiers on UTF-8 locale |
| Дата | |
| Msg-id | 25540.1159029401@sss.pgh.pa.us обсуждение исходный текст |
| Ответ на | Corruption of multibyte identifiers on UTF-8 locale (Victor Snezhko <snezhko@indorsoft.ru>) |
| Ответы |
Re: Corruption of multibyte identifiers on UTF-8 locale
|
| Список | pgsql-bugs |
Victor Snezhko <snezhko@indorsoft.ru> writes:
> correct utf-8 byte sequence is 0xd18231, so it looks like we call
> tolower() somewhere on parts of multibyte characters, and it does the
> same as isspace() - it interprets it's argument as wide character, and
> converts it.
Indeed, and I am certainly wondering why we should not just say that
you've got a broken locale definition there. There is absolutely no
doubt that the ctype.h functions are defined to work on char, not wchar.
They have no business mangling high-bit-set bytes in a multibyte
encoding.
regards, tom lane
В списке pgsql-bugs по дате отправления:
Сайт использует файлы cookie для корректной работы и повышения удобства. Нажимая кнопку «Принять» или продолжая пользоваться сайтом, вы соглашаетесь на их использование в соответствии с Политикой в отношении обработки cookie ООО «ППГ», в том числе на передачу данных из файлов cookie сторонним статистическим и рекламным службам. Вы можете управлять настройками cookie через параметры вашего браузера