Publish your project for free and start receiving offers from freelance contractors in serveral minutes after publication!
1500 ₽

Доработка имеющегося сервиса по работе с текстовым содержимым

project complete
PHP


Сейчас имеется свой сервис, написанный на PHP. Что он делает? Он разбивает словосочетания на отдельные фразы и подсчитывает количество таких фраз с учетом словоформ.


Пример:

крапива для волос

крапива для волос отзывы

крапива для волос рецепты

отличные рецепты крапивы для волос

маски с крапивой для волос

крапива для волос полезные свойства

как сделать маску для волос с крапивой


Что выдаст сейчас сервис:


крапива 4 | 3 | 7

волос 7

рецепты 2

маску 1 | 1 | 2

сделать 1

свойства 1

отличные 1

отзывы 1

полезные 1


Здесь первая цифра - это количество слова в точной форме, вторая цифра - - в любой словоформе, а третья цифра - всего вхождений (точных + словоформ)


Что мне нужно доработать сейчас?

Нужно сделать поле для ввода "основной фразы".  Допустим основная фраза "крапива для волос"


Далее мне нужно, чтобы обновленный сервис анализировал, что находится слева и справа от этой основной фразы. А именно однословники или двух словники и трехсловники или в целом назовем все что от двухсловников и больше -  N словники. 


То есть сервис находит N словник - и заносит его в память.  И так по всем словам. Далее сервис берет все найденные однословники и проверяет их наличие в этих N словниках. Если наличие есть - то это слово не выводится в итоговый результат, а если не находится то выводится. Внимание - учет должен идти в любой словоформе!!!


После такой работы в итоговом результате должно быть следующее:

отзывы 1

отличные рецепты 1

сделать маску 1

полезные свойства 1


Пояснения:

1. Все предлоги, частицы и так далее (например, как из фразы "как сделать маску для волос с крапивой" - не учитываются, так как входят в список стоп слов - этот функционал реализован уже)

2. как я писал выше учет должен идти в любой словоформе. То есть у нас есть маски с крапивой для волос и 

как сделать маску для волос с крапивой. Здесь двухсловник - сделать маску. При этом однословник маски - является словоформной для маску. Поэтому в итоговый результат не пошел.


Такой же принцип действовать должен и для N словников. Вот взять основную фразу  - в точной форме она звучит "крапива для волос"


но у нас есть "крапивой для волос" и "волос с крапивой" - это все словоформы для "крапива для волос".  Предлог при этом лучше не учитывать вообще. у нас в основной фразе - для , а примере есть "с" - но тем не менее - это не влияет на результат. То есть важны все фразы которые рядом находятся (без учета предлога"). И если крапива и волос находятся друг за другом - то не важно какой между ними предлог. Система должна понять, что это и есть основная фраза.



Если что то непонятно - более детально - все обсудим по скайпу.

Client's feedback about the contractor Дмитрии Г.

Quality
Professionalism
Price
Availability
Terms

Дмитрий спасибо вам огромное! Вы выполнили мое нестандартное задание на все 10 балов. Все на высоком профессиональном уровне и в оговоренный срок. Я очень доволен работой с вами и надеюсь на дальнейшее сотрудничество!

Алексей Н. Алексей Нижегородцев | Safe Safe

Freelancer's feedback about the client Алексее Нижегородцеве

Payment
Task formulation
Requirements
Availability

Отличный и адекватный заказчик. По всем вопросам на связи. Оплата в срок.

Дмитрий Г. Дмитрий Габдрахманов | Safe Safe



  1. 7 days1500 ₽Winning proposal
    Дмитрий Габдрахманов
     518   13   0

    обращайтесь
    ))))))))))))))))))))))))))))))))
    ))))))))))))))))))))))))))))))))

    Russia Russia | 14 October at 23:05 |

Project published
14 October at 23:04
14 views
Share