Publish your project for free and start receiving offers from freelance contractors in serveral minutes after publication!
2 300 ₽

скрипт генератор текста

project complete


Перед созданием ТЗ, я поискал готовые решения для генерации текстов - меня мало что устроило:

  1. Треть сводится к тому, что нажми на кнопку получи заранее подготовленный автором текст;
  2. Треть к тому, что вот есть шаблон, давайте подставлять в него синонимы либо заменять прилагательные, (делая предложения фиксированного размера и особо не изменяя положение слов в тексте - сохраняя Манхеттенское расстояние)
  3. Треть к цепям Маркова, которые а) сложны б) дают бредовый результат в) уже лет 10 как успешно палятся поисковыми системами.


Для себя задачу я ставил так: я должен иметь возможность скормить генератору подобранный мною текст на заданную тематику (например, сборник статей из разных источников). Генератор должен сформировать текст, в котором есть заголовки разных уровней, параграфы, предложения разной длины


Должен соблюдаться некий ритм текста - чередование длинных и коротких предложений, и каждое предложение в целом должно соответствовать правилам русского языка. 


Решение состоит в том, что бы обучить генератор на примере входящего текста, и по этим знаниям сформировать новый текст (каждый раз новый).


При поступлении текста, генератор разбирает его на токены, и запоминает, какие слова обычно идут в начале предложения, какие в конце, какое слово чаще идет после данного, какое реже. В общем, строит этакое дерево последовательностей. После этого берет случайные первые слова, дополняет одним из слов, которые обычно за ним идут, то же самое делает со вторым словом, потом с третьим и так далее, пока не встретится последнее слово.

Соответственно, чем больше текста будет скормлено, и чем лучше соблюдена тематика, тем лучше будет результат.

Этот генератор текста https://bablofil.ru/text_generator делает так на 100%. Это будет эталоном.

Язык исполнения: php или python3 или bash (а вдруг)


./generator.py ./train.txt 100 ./out/result 11
./train.txt - текст для тренировки
100 - количество статей
./out/result - папка и начало имени файла, к которому добавляется номер файла с шагом +1
11 - начальный номер

Client's feedback on cooperation with Владиславом Переломовым

Quality
Professionalism
Price
Availability
Terms

По опыту работы с фрилансерами на этой площадке, я признаюсь, как обычно сомневался, будет ли результат так быстро, как было сказано. Но в этот раз, моим страхам не суждено было сбыться!

Генератор получился отличный. Буду тестировать его на разных текстах, но уже понятно, что эти тексты пойдут в работу.
Я считаю, что ТЗ было проработанное, однако в процессе мы его еще улучшили и получили настоящий шедевр!

Исполнителя рекомендую ещё и потому, что в процессе общения разговор идет хорошо, будто я общаюсь с давним другом.

Freelancer's feedback on cooperation with Дмитрием Киром

Payment
Task formulation
Requirements
Availability

Советую этого работодателя, оплата как и договорились(+ частичная оплата НЕ через сейф) так что этому заказчику можно на 100% доверять
Задача с четким ТЗ, конечно были правки но они не большие, даже сказал бы мизерные
Всегда был на связи, не конфликтный добрый человек)
Если сомневаетесь в заказчике, мой вам совет - не сомневайтесь)

Владислав
Владислав Переломов | Safe Safe


  1. 7076
       55  0

    1 day1 000 ₽

    Добрый день
    Работаю поэтапно или БС
    Огромный опыт работы
    Пишите обсудим
    Мой скайп – salvadordali.news
    Жду контакта чтобы задать свои вопросы.
    Интересует долгосрочное сотрудничество.
    Telegram - @mek2ireq

    Ukraine Kyiv | 19 January 2019 |
  2. proposal concealed by freelancer
  • Profile banned
    19 January 2019 |

    странный эталон http://prntscr.com/m9bucz )))

  • Дмитрий Кир — project author
    19 January 2019 |

    А что вы ему дали для обучения? В символах, сколько получилось?

  • Profile banned
    19 January 2019 |

    примерно 1K знаков

  • Дмитрий Кир — project author
    19 January 2019 |

    Мало. Я дал текст больше 5000 знаков. Сделал приемлемо.

  • Jotwin Staik
    19 January 2019 |

    Довольно интересная задача. Хотел бы взять в работу, но нету сейчас времени)

  • Jotwin Staik
    19 January 2019 |

    Если не найдете исполнителя напишите пожалуйста через 10 дней, реализуем. @elbit_98

  • Савва Мірзоян
    19 January 2019 |

    Одно из немногих тз, которое составлено правильно и очень понятно. Я бы поставил плюсик Вам, если бы смог 🙂

  • Дмитро К.
    19 January 2019 |

    у вас бюджеты просто "сказка"...😲 


Client
Дмитрий
Дмитрий Кир
Russia Russia  17  0
Project published
1 year ago
136 views
Labels
  • php
  • Python3
  • Linux/bash