BUG #5743: Regexp engine fails to case-insensitively match multi-byte codepoints
В списке pgsql-bugs по дате отправления:
| От | Vlad Romascanu |
|---|---|
| Тема | BUG #5743: Regexp engine fails to case-insensitively match multi-byte codepoints |
| Дата | |
| Msg-id | 201011040048.oA40md61095262@wwwmaster.postgresql.org обсуждение исходный текст |
| Ответы |
Re: BUG #5743: Regexp engine fails to case-insensitively match multi-byte codepoints
|
| Список | pgsql-bugs |
The following bug has been logged online:
Bug reference: 5743
Logged by: Vlad Romascanu
Email address: vromascanu@accurev.com
PostgreSQL version: 8.4.3
Operating system: Windows, Linux
Description: Regexp engine fails to case-insensitively match
multi-byte codepoints
Details:
Already reported in 2006 but seems to have fallen through the cracks (I can
find no followup.) Problem still exists in v8.4.3.
Problem still appears to be pg_wc_tolower downcasting to char before calling
tolower() (instead of calling towlower().)
This one of several inconsistencies unfortunately still present in
case-insensitive regexp vs. LOWER(str) [str_lower] treatment (including char
to wchar conversion using MultiByteToWideChar/mbstowcs vs. char2wchar, or
towlower vs. pg_wc_tolower.)
Current workaround is to use LOWER(str) ~ LOWER('regexp').
В списке pgsql-bugs по дате отправления:
Сайт использует файлы cookie для корректной работы и повышения удобства. Нажимая кнопку «Принять» или продолжая пользоваться сайтом, вы соглашаетесь на их использование в соответствии с Политикой в отношении обработки cookie ООО «ППГ», в том числе на передачу данных из файлов cookie сторонним статистическим и рекламным службам. Вы можете управлять настройками cookie через параметры вашего браузера