Publish your project for free and start receiving offers from freelance contractors in serveral minutes after publication!
10 000 ₴

Парсинг контактов

project expired


Задача на парсінг


Настройка какого-либо из существующих парсеров (платных или бесплатных) для следующих задач:

Или розроботка нового

Задача 1.

 

В поисковых системах (гугл, яндекс, яху) нужно искать ссылки по ключевым словам (например, "аквариум", "зоотовары", "амуниция для собак" и т.д).

 

Нужно настроить работу с прокси и скорость запросов (количество потоков, паузы,  и т.д.) чтобы запросы не блокировались. Нужно порекомендовать прокси-сервер, тариф, сделать необходимые настройки (в идеале, чтобы я только оплатил на указанной странице).

 

Поиск нужно проводить только в указанной стране (для начала - Украина).

На найденной странице должно обязательно быть одно из ключевых слов (например "купить" или "продажа" или "опт" или "магазин" и т.д)

Возможно, отсеивать страницы, на которых присутствует одно из списка ненужных слов (например, "книга")

 

Может быть серия из нескольких таких поисковых запросов (в связи с тем, что появились новые ключевые слова по данной задаче). Результаты такой серии должны объединяться.

 

Результат - список ссылок на сайты (если возможно, дублирующиеся страницы, которые не одинаковые, но указывают на те же сайты или категории в каталогах или справочниках, должны быть объединены в одну)

 

При возможности, этот список ссылок должен быть разбит на виды сайтов: сайты, принадлежащие одному продавцу (визитки, интернет-магазины, и т.д), каталоги фирм и магазинов (типа https://www.0352.ua/catalog/23/zoosvit), порталы объявлений (типа ОЛХ). Разбитие связано с разным поиском на них контактных данных в следующей задаче. Возможно, есть еще какие-то принципиально другие категории.

 

Задача 2.

По ссылках из первой задачи отобрать контактные данные:

адреса е-мейл

телефоны

адрес (хотя бы город - если возможно)

:)

формат полученных данных: 

название - "это телефон" - телефон1

название - "это телефон" - телефон2

...

название - "это е-мейл" - емейл1

...

название - "это адрес" - адрес1



  1. 12 days25 000 ₴
    Роман Тетерятников
     213 

    цена начальная поскольку ваш проект из разряда хочу все и сразу, могу сделать скажу сразу не будет вам 100% имейлов и телефонов со всех ссылок кто говорит иначе врет. опыт большой, делал роботов для букмекерских контор и больших торговых площадок и прочего подобного где все отслеживается блокируется и т.д. обращайтесь в общем

    Ukraine Nikolaev | 23 April at 20:09 |
  2.  freelancer isn't working in the service any longer
  3. 10 days10 000 ₴
    Василь Заболотний
     360  verified   10  2   1

    Здраствуйте, готов поработать с Вами. https://vk.com/royal_standart или 0930039418

    Ukraine Vinnytsia | 26 April at 16:32 |
  1. proposal withdrawn
  • Набираю в поисковике запрос "аквариум" и получаю 20 миллионов результатов только по Украине. 

    Чего вам ещё надо? Поисковик по поисковику? 

    Я просто смысла не пойму.

  • По всей видимости вы немного не с той стороны подходите к задаче. Вам необходимо собрать базу данных - так закажите базу данных. Решение первой задачи - простое, но на выходе вы получите список огромного количества РАЗНОФОРМАТНЫХ страниц. В основном тех, которые Вас не интересуют. Автоматизированная обработка разноформатных страниц, собранных случайным образом, - заведомо гиблое дело. Тот кто возьмется за это проклянет тот день, когда взялся. То, что будет у него получаться не будет вас устраивать, потому что вы не этого хотите. Например. Путем титанических усилий программиста, программа по указанным словам выдернет с форума телефон подруги, у которой тоже есть белый ежик. А также телефон таксиста, который согласился взять в салон тибетского мастифа. А еще, гору мусора, которого никак не возможно избежать, т.к. машина за 10000 не сможет отличить телефон зоомагазина от телефона модератора.

  • Олег Зінкевич — project author
    Complain | 24 April at 14:59 |

    ок, неможу непогодитись, яка буде вартість бази даних дилерів які продають вхідні металеві двері в Казахстані! 

  • Т.к. это не моя тема, цену не подскажу. Разместите на этом же сайте проект, по сбору интересующей вас базы данных, можете цену не указывать, фрилансеры сами назовут. И за один - два дня сделают. Ко мне можете обращаться по вопросам парсинга данных с конкретных сайтов, наполнения товарами интернет - магазинов, автоматизации рекламных процессов (автоматическое размещение объявлений и рекламных постов в больших количествах). Удачи вам! 

  • Олег Зінкевич — project author
    Complain | 24 April at 15:45 |

    Дякую!