Freelance projects › написать парсилку для скачивания файлов с вики написать парсилку для скачивания файлов с вики
project completeНужна парсилка для скачивания svg и png файлов с wikimedia.com
Тип страниц откуда скачиваться будет контент. Пример
https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus
https://commons.wikimedia.org/wiki/Category:SVG_coats_of_arms_of_Angola
и тд, страницы однотипные
Что должно скачиваться:
1. svg каждого файла . Количество файлов пишется на самой странице https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus
The following 111 files are in this category, out of 111 total.
Там файлы могут отображаться страницами, previous page, next page / например здесь две страницы https://commons.wikimedia.org/wiki/Category:SVG_road_signs_in_Japan
В данном случае https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus все файлы отображаются на одной странице.
Svg файлы лежат по такому пути: если кликнуть на файл попадём сюда https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus#/media/File:Flag_of_Belarus.svg
More details - и мы перейдём на https://commons.wikimedia.org/wiki/File:Flag_of_Belarus.svg
Исходник svg файла здесь http://prntscr.com/hn2z65
2. png каждого файла , исходник лежит там же http://prntscr.com/hn32rg . Достаточно самый минимальный размер png.
Также нужен один фильтр . Чекпоинт "Public domain". То есть по-умолчанию скачиваются все файлы. Если ставится чекпоинт public domain, то скачиваются только файлы с лицензией Public domain. Лицензия каждого файла указывается здесь https://commons.wikimedia.org/wiki/Category:SVG_flags_of_Belarus#/media/File:Flag_of_Belarus.svg
конкретно http://prntscr.com/hn38ku
Принцип такой, указываться путь куда скачивать на компьютер, вводится урл с какой страницы скачивать, чекпонит Public domain или нет, Пуск.
Файлы скачиваются в папку , название svg оставляем такое же как в исходнике.
Есть один момент - нужно чтобы svg и png одного файла распологались рядом друг с другом. Так как они называются
по-разному Flag_of_Belarus.svg и 320px-Flag_of_Belarus.svg , то рядом они не будут . Можно например скачивать png все 500px http://prntscr.com/hn3wpy тогда как-то программно удалять " 500px- " в названиях всех png файлов 500px-Flag_of_Belarus.svg.png чтобы png совпадал буквенно с названием svg. Либо может найдёте другое решение, попроще.
Если я что-то упустил в правильном функционировании парсилки с вики, поправьте.
Ставьте ваш бюджет и сроки.
Client's feedback about the contractor Давиде Манжуле
написать парсилку для скачивания файлов с викикрутой прог, сделал всё как хотел
Freelancer's feedback about the client Иване Энге
написать парсилку для скачивания файлов с викиВсе чітко, зрозуміло. Необхідна інформація своєчасно. Оплата миттєва. Рекомендую замовника!
-
Игорь Варфоломеев
290 verified 1 0Ест большой опыт написания парсеров разной сложности, включая парсеры который обходят блокировки гугла, фейсбука и тд.
-
freelancer isn't working in the service any longer
-
Могу сделать в виде софта, все будет так как Вам нужно.
Обращайтесь, нюансы обсудим в процессе.
E-mail: [email protected] | skype: avtoparsing.ru | telegram: https://t.me/avtoparsing | -
Anatoly Novikov
646 36 0<><><><><><><><><><><><><><><><><><><><><><><><><><><><><>
Добрый день, готов выполнить ваше задание, обращайтесь.
<><><><><><><><><><><><><><><><><><><><><><><><><><><><><>
-
Саркис Абраамян
373 3 1Добрый день! Есть огромный опыт парсинга и анализа данных с разных сайтов!
Реализую на java под любой ОС в виде дескопного приложения!
viber/telegram: +37495090598
email: [email protected]
-
3 days2000 ₴Winning proposal
Зроблю!
Маю досвід розробки парсерів!
t.me/da411d | da411d.pp.ua
-
Роман Тулайдан
1763 31 0Могу сделать в виде скрипта либо програмы. Пишите,обсудим детали
-
Юрій Селецький
640 verified 16 2 2Здрвствуйте Иван.
Заинтересован в выполнении задачи.
Обращяйтесь.
Сделаю.
-
Be the first to ask a question.