| От | Léonard Benedetti |
|---|---|
| Тема | Re: BUG #13440: unaccent does not remove all diacritics |
| Дата | |
| Msg-id | 56E18841.2000406@mlpo.fr обсуждение исходный текст |
| Ответ на | Re: BUG #13440: unaccent does not remove all diacritics (Léonard Benedetti <benedetti@mlpo.fr>) |
| Ответы |
Re: BUG #13440: unaccent does not remove all diacritics
|
| Список | pgsql-bugs |
10/03/2016 15:35, Léonard Benedetti wrote: > Le 10/03/2016 14:46, Teodor Sigaev a écrit : >>> On the other hand, UTF-8 encoding for source code is *a feature of >>> Python 3* (to quote the documentation: “The default encoding for Python >>> source code is UTF-8”) so there is no possible ambiguity, and it will >>> not be a problem. That said, some non-ASCII characters may be removed >>> without prejudice from the source code of the script (I think in >>> particular to "“" and "”"). Nevertheless, for some comments, it would be >>> unfortunate (e.g. “# RegEx to parse rules (e.g. “Đ → D ; […]”)” or “# ℃ >>> °C”). >> Ok, I didn't know that. >> >> >>> Thus, I propose to adapt the code to Python 3 (the encoding of the >>> script does not seem to be a problem for the above reasons). I try to do >>> it shortly. >> We are waiting... >> > Sorry for the delay, adaptation to Python 3 was very easy (the code is > almost identical). > > As usual, you will find attached the new version of the script and the > generated output for convenience. > > Léonard Benedetti Here is the patch, attached. Léonard Benedetti
В списке pgsql-bugs по дате отправления:
Сайт использует файлы cookie для корректной работы и повышения удобства. Нажимая кнопку «Принять» или продолжая пользоваться сайтом, вы соглашаетесь на их использование в соответствии с Политикой в отношении обработки cookie ООО «ППГ», в том числе на передачу данных из файлов cookie сторонним статистическим и рекламным службам. Вы можете управлять настройками cookie через параметры вашего браузера