Publish your project for free and start receiving offers from freelance contractors in serveral minutes after publication!
2 000 ₴

написать парсилку для скачивания файлов с вики

project complete


Нужна парсилка для скачивания svg и png файлов с wikimedia.com


Тип страниц откуда скачиваться будет контент. Пример 

https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus

https://commons.wikimedia.org/wiki/Category:SVG_coats_of_arms_of_Angola

и тд, страницы однотипные

Что должно скачиваться:

1. svg каждого файла . Количество файлов пишется на самой странице https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus

The following 111 files are in this category, out of 111 total.


  Там файлы могут отображаться страницами, previous page, next page / например здесь две страницы https://commons.wikimedia.org/wiki/Category:SVG_road_signs_in_Japan


 В данном случае https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus все файлы отображаются на одной странице. 

Svg файлы лежат по такому пути: если кликнуть на файл попадём сюда https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus#/media/File:Flag_of_Belarus.svg

More details - и мы перейдём на https://commons.wikimedia.org/wiki/File:Flag_of_Belarus.svg

Исходник svg файла здесь http://prntscr.com/hn2z65

2. png каждого файла , исходник лежит там же http://prntscr.com/hn32rg . Достаточно самый минимальный размер png. 


Также нужен один фильтр . Чекпоинт "Public domain".   То есть по-умолчанию скачиваются все файлы. Если ставится чекпоинт public domain, то скачиваются только файлы с лицензией Public domain.  Лицензия каждого файла указывается здесь https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus#/media/File:Flag_of_Belarus.svg

конкретно http://prntscr.com/hn38ku


Принцип такой, указываться путь куда скачивать на компьютер, вводится урл с какой страницы скачивать, чекпонит Public domain  или нет, Пуск. 


Файлы скачиваются в папку , название svg оставляем такое же как в исходнике.

Есть один момент - нужно чтобы svg и png одного файла распологались рядом друг с другом. Так как они называются 

по-разному Flag_of_Belarus.svg  и 320px-Flag_of_Belarus.svg , то рядом они не будут . Можно например скачивать png все 500px http://prntscr.com/hn3wpy   тогда как-то программно удалять " 500px-  "  в названиях всех png файлов 500px-Flag_of_Belarus.svg.png  чтобы png совпадал буквенно с названием svg.   Либо может найдёте другое решение, попроще.    


Если я что-то упустил в правильном функционировании парсилки с вики, поправьте. 


Ставьте ваш бюджет и сроки.  


Отзыв заказчика о сотрудничестве с Давидом Манжулой

Quality
Professionalism
Price
Availability
Terms

крутой прог, сделал всё как хотел

Отзыв фрилансера о сотрудничестве с Иваном Энге

Payment
Task formulation
Requirements
Availability

Все чітко, зрозуміло. Необхідна інформація своєчасно. Оплата миттєва. Рекомендую замовника!

Давид Давид Манжула


Make a proposal!

The Customer does not want to make a prepayment? Payment through Safe will help avoid potential fraud.

  1. 3 days4 500 ₴
    Игорь
    Игорь Варфоломеев
    376   verified    1  0

    Ест большой опыт написания парсеров разной сложности, включая парсеры который обходят блокировки гугла, фейсбука и тд.

    Ukraine Khmelnitskyi | 13 December 2017 |
  2.  freelancer isn't working in the service any longer
  3. 7 days3 500 ₴
    Сергей
    Сергей К.
    2998   verified    62  0

    Могу сделать в виде софта, все будет так как Вам нужно.
    Обращайтесь, нюансы обсудим в процессе.

    Ukraine Kyiv | 13 December 2017 |
  4. 3 days2 000 ₴
    Anatoly
    Anatoly Novikov
    777     50  0

    <><><><><><><><><><><><><><><><><><><><><><><><><><><><><>

    Добрый день, готов выполнить ваше задание, обращайтесь.

    <><><><><><><><><><><><><><><><><><><><><><><><><><><><><>

    Ukraine Odessa | 13 December 2017 |
  5. 3 days4 000 ₽
    Саркис
    Саркис Абраамян
    1450   verified    20  2

    Добрый день! Есть огромный опыт парсинга и анализа данных с разных сайтов!
    Реализую на java под любой ОС в виде дескопного приложения!
    viber/telegram: +37495090598
    email: [email protected]

    Armenia Erevan | 13 December 2017 |
  6. 3 days2 000 ₴Winning proposal
    Давид
    Давид Манжула
    1372   verified    67  1   2

    Зроблю!
    Маю досвід розробки парсерів!
    t.me/da411d | da411d.pp.ua ­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​­​

    Ukraine Ivano-Frankovsk | 13 December 2017 |
  7. 4 days3 500 ₴
    Роман
    Роман Тулайдан
    1594     31  0

    Могу сделать в виде скрипта либо програмы. Пишите,обсудим детали

    Ukraine Ivano-Frankovsk | 13 December 2017 |
  8. 5 days2 500 ₴
    Юрій
    Юрій С.
    643   verified    16  3   2

    Здрвствуйте Иван.
    Заинтересован в выполнении задачи.
    Обращяйтесь.
    Сделаю.

    Ukraine Rovno | 14 December 2017 |