Publish your project for free and start receiving offers from freelance contractors in serveral minutes after publication!
500 ₴

PHP Поиск с учетом морфологии по базе 2 млр ключевых фраз

closed without completion


  1.  1 day 500 ₴
    942    44  0   1

    Здравствуйте, есть опыт в написании программ, которые осуществляют поиск определенных слов из базы.
    Напишите мне!
    Связь тут или в телеграме: @Aooo3

  2.  freelancer isn't working in the service any longer
  3.  freelancer isn't working in the service any longer
  • Profile banned
    5 March 2019 |

    "2 млр", это 2 млрД или 2 млН?

    В первом случае решение "в лоб" - полнотекстовый поиск, PostgreSQL, Sphinx и пр. из коробки не дадут нормальной производительности. Нужно будет изобретать что-то эдакое.

    + интересует тематика. Не для каждой темы найдется морфологический словарь. (Даже 2 млн слов - это ок. 200-300 тыс слов с их словоформами. А это достаточно  для того, чтобы в этой куче встречались очень узкоспециализированные  слова и собственные названия).

    Вот: https://www.softportal.com/software-35151-helper-crossman.html

    Там "всего" 140 тыс уникальных слов. И там достаточно много собственных названий и таких слов, что словарь их содержащий поискать нужно.


    И еще есть много нехороших трудностей типа омонимичных словоформ, употребление которых зависит от контекста. Напр.

    ПОПУГАЙ - птица; ед.ч., м.р.

    ПОПУГАЙ - приказание кого-то пугать; глаг. сов.в. повел.накл.


    И прочее, прочее.


    Вообще, качественный поиск с учетом морфологии, это задача, граничащая с ИИ. )))