21 февраля 2017 Митап российского сообщества PostgreSQL: «Полнотекстовый поиск: рецепты от разработчиков»

Новости Источник: www.meetup.com/postgresqlrussia/

          21 февраля 2017 года в конференц-зале Государственного Астрономического Института им. Штернберга состоится встреча разработчиков и пользователей СУБД PostgreSQL в формате мини-конференции на тему «Полнотекстовый поиск: рецепты от разработчиков». От компании Postgres Professional участвуют докладчики Фёдор Сигаев и Артур Закиров.

          Полнотектстовый поиск существует в PostgreSQL достаточно давно, но продолжает развиваться. Тем не менее, многие продолжают использовать его в том стиле, как это делалось в начале века. Чтобы рассказать о том, как это делается сейчас, мы проводим этот семинар. Расскажем о том, как организовать полнотекстовый поиск по вашему массиву текстов на примере простого научно-популярного Web-сайта. Покажем фасетный поиск, расскажем о новинках свежей версии постгреса, покажем новый индекс RUM, и объясним, зачем он нужен.

 

  • Начало: 19:00
  • Регистрация участников обязательна
  • Регистрационного взноса нет

 

21 февраля 2017 года в конференц-зале Государственного Астрономического Института им. Штернберга состоится встреча разработчиков и пользователей СУБД PostgreSQL в формате мини-конференции на тему «Полнотекстовый поиск: рецепты от разработчиков».


          Будет замечательно, если вы придете со своими вопросами и задачами - мы постараемся ответить вам на месте. Если можете, присылайте вопросы заранее, чтобы мы включили ответы в своё выступление.

Дополнительный доклад (15 минут):

Андрей Коваленко

«Грязная математика и квалифицированный кворум запроса»

          При реализации полнотекстовых поисковых систем наиболее важными представляются два разительно различающихся вида запросов:
  • поиск точного вхождения фразы;
  • поиск наиболее полного, и при этом наиболее компактного вхождения поискового запроса в документ, или нечёткий поиск.
И если с первым типом поиска всё очевидно – следует лишь чётко отработать строгий логический запрос с учётом координат слов в документе, в идеале не проигнорировав предлогов и запятых, то второй тип поиска в реализации гораздо сложнее. Он предусматривает, с одной стороны, богатую комбинаторику, а с другой – определённый набор не совсем честных математических преобразований и достаточно вольную трактовку физического смысла операций. В масштабированных же системах, работающих с формально однородными текстами, модерируемыми или нет, эта задача осложняется дополнительно. В докладе представлены реализованные и обкатанные на реальных массивах способы качественного вычисления нечётких запросов с минимальной дополнительной нагрузкой на кластер поисковой машины.

 

 

Приветствуются блиц-доклады — короткие (5-10 мин) рассказы о проектах, так или иначе связанных PostgreSQL (не обязательно про полнотекстовый поиск).

Есть идея? — Пишите организаторам.

Полезная информация:

 

21 февраля 2017 года в конференц-зале Государственного Астрономического Института им. Штернберга состоится встреча разработчиков и пользователей СУБД PostgreSQL в формате мини-конференции на тему «Полнотекстовый поиск: рецепты от разработчиков».