Publish your project for free and start receiving offers from freelance contractors in serveral minutes after publication!

Парсинг каталога ОВО BETTERMANN

closed without completion


Необходимо сделать парсинг каталога товаров : http://www.obocom.ru/katalog/ и http://obo-bettermann.com/en-wo/23.html
В результате мы должны получить 2 файла англ и русский

ОПИСАНИЕ ФОРМАТА XLS

  1. categories - заполняет наш админ (ID рубрики) колонка 1 A
  2. donor_category
    (папка или категория). Рубрики должны идти через разделитель ">"
    напр. Шкафы, щиты и системы внутреннего распределения>Щиты для
    модульного оборудования>Щитки Nedbox Накладные распределительные
    щитки - от 8 до 48 модулей колонка 2 B
  3. donor_url Ссылка на страницу-оригинал колонка 3 C
  4. vendor Производитель колонка 4 D
  5. sku артикул колонка 5 E
  6. name
    - формируется таким образом - название товара из сайта донора, имя
    вендора (например, - Автоматичний вимикач, S801S-B8 , ABB) колонка 6 F
  7. image- ссылка на фото товара колонка 7G
  8. image_gallery
    - если несколько картинок, то заполняется в формате img1;img2;img3,
    картинка, которая указана в поле image в этом списке должна
    отсутствовать колонка 8 H
  9. price ( если указана на сайте) колонка 9 I
  10. measure колонка 10 J единица измерения или шт
  11. attributes -Атрибуты (или Характеристики) колонка 11 K. Все характеристики должны быть в одном поле. напр.
    Полное наименование: NUM - O 2х1,5 - 0,66::Количество жил: 2::Расцветка
    провода: гол.,бел.::Напряжение, В: 660::Тара: основная тара: бухта::Ед.
    измерения: м.::Температура эксплуатации: от -40 до +50::Температура
    монтажа: до -15 С::Сечение жилы, мм2: 1.5::Конструкция жилы:
    однопроволочная::Форма жилы: круглая::Наличие экрана: нет::Минимальный
    радиус изгиба: 10 наружных диаметров::Масса 1 км изделия, кг:
    100.7::Основание для производства: ТУ 3521-001-12350648-2007::Номер
    сертификата соответствия: RU C-RU.АЮ64.В.01107::Номер сертификата ПБ:
    C-RU.ПБ05.В.00619::Длина бухты: 0.1

    разделитель между
    атрибутами - :: (два двоеточия)разделитель между атрибутом и значением -
    :пробел (двоеточие и один пробел после двоеточия)

  12. description -в колонку 12 L (описание) -

из атрибутов формируем таблицу вида

<table>

<tbody>

<tr>

<td>Атрибут1</td><td>Значение атрибута1</td>

<td>Атрибут2</td><td>Значение атрибута2</td>

...................................

</tr>

</tbody>

</table>

если
на странице товара есть еще какой-то текст, то грабим его вместе с
тегами и вставляем ниже под таблицей с атрибутами, и это все будет поле
descr


  1. currency_name - UAH, USD или EUR согласно валюте, в которой указана цена на сайте донора колонка 13 M
    14.
    additional_materials- для доп. материалов (если есть) колонка 14 N
    (ссылки грабить вместе с дополнительными материалами ,а не просто
    ссылку)
    15. certificates- если сертификаты есть на сайте колонка 15 O
    (ссылки грабить вместе с названием сертификата ,а не просто ссылку)

ВОПРОСЫ
1.Сколько товаров реально спарсить здесь?

2 Какая Ваша стоимость?

3. Срок выполнения ?
4. Какая стоимость спарсить картинки архивным файлом и срок выполнения?
Благодарю за обратную связь!

Make a proposal!

The client doesn't want to make prepayment? Offer him to make a payment via Safe to avoid possible fraud.

  1.  freelancer isn't working in the service any longer
  2. 2 days1000 ₴
    Ваня Рябчич
     60 

    1. Все
    2. 1000
    3. 2 дня
    4. Картинки входят в заявленною стоимость и срок

    Ukraine Ukraine | 13 November 2015 |
  3. 4 days1000 ₴
    Павел Терещенко
     569   25   1

    готов выполнить,
    есть вопросы по сайту.

    Ukraine Zheltye Vody | 14 November 2015 |

Project published
13 November 2015
224 views
Share