Freelance projects › Конвертер файлов из MHT в HTML+data Конвертер файлов из MHT в HTML+data
Существует набор файлов с описанием товаров. Каждое описание в отдельном файле формата MHTML (*.MHT) с изображениями внутри.
Нам необходимо програмно перевести все файлы в формат HTML с изображениями внутри. То есть, все изображения дожны быть не отдельными JPG файлами, а именно внутри файла HTM, в виде записей типа
<img
src="data:image/gif;base64,R0lGODdhMAAwAPAAAAAAAP///ywAAAAAMAAw
AAAC8IyPqcvt3wCcDkiLc7C0qwyGHhSWpjQu5yqmCYsapyuvUUlvONmOZtfzgFz
ByTB10QgxOR0TqBQejhRNzOfkVJ+5YiUqrXF5Y5lKh/DeuNcP5yLWGsEbtLiOSp
a/TPg7JpJHxyendzWTBfX0cxOnKPjgBzi4diinWGdkF8kjdfnycQZXZeYGejmJl
ZeGl9i2icVqaNVailT6F5iJ90m6mvuTS4OK05M0vDk0Q4XUtwvKOzrcd3iq9uis
F81M1OIcR7lEewwcLp7tuNNkM3uNna3F2JQFo97Vriy/Xl4/f1cf5VWzXyym7PH
hhx4dbgYKAAA7"
alt="Larry" />
Таких файлов всего около 20000, потому желательно получить PHP решение для сервера, которое бы переводило все файлы из одной директории на сервере в другую, заменяя формат файла. Расмотрим также десктопное решение, для ручного запуска.
Сейчас файл MHT открывается коректно только в браузере IE. Во всех остальных - или не открывается совсем или кодировка текста выглядит кривой. Хотим решить ету проблему.
Кроме того, готовый файл должен иметь HTML разметку без CSS стилей. Необходмо удалить из файла все стили style=".....", все классы class="....." и идетификаторы id=".....", оставив только чистый html код + встроенные изображения.
Структура элементов в файле должна быть сохранена, все изображения должны быть на том же месте в тексте, что и в оригинальном файле. Конечный результат должен коректно открываться в любом браузере, Chrome, Firefox, Opera, Edge, Safari, а кодировка при этом не должна слетать.
Мы пробовали некоторые решения, в том числе онлайн конвекторы, но они не дали желаемый результат.
Готовы ответить на встречные вопросы.
Важное уточнение!
В ходе обсуждения задачи мы выяснили, что файлы MHT были созданы в программе Microsof Word, поэтому содержат огромное количество лишних тегов.
Мы хотим максимально уменшить размер готового кода, поэтому в коде дожны остаться только базовые теги, без класов, идентификаторов, других параметров, указания размеров блоков, и прочих стилей. То есть, все атрибуты от ворда нужно удалить.
Добавили файлы примеры, а также скриншоты, на которых много мусора.
Applications 5
Work result
Client's feedback on cooperation with Владимиром Масленко
Конвертер файлов из MHT в HTML+dataСделал всё что можно было, учитывая исходные данные.
Freelancer's feedback on cooperation with Dmitry Asmogilov
Конвертер файлов из MHT в HTML+dataВсё хорошо. Поставленную задачу решили =)
-
1618 26 0 1 Приветствую, легко выполню требуемую задачу.
Портфолио в профиле.
Буду рад сотрудничеству.
Мусор, речь о котором ведется в #1 Обновлении - Не является существенной проблемой в свете возможности его легко отсеять.
-
proposal concealed by freelancer
-
2755 94 4 2 Приветствую!
Могу попробовать написать решение задачи на php
Обращайтесь - буду рад сотрудничеству
-
253 1 0 Здравствуйте. Сделаю Вашу задачу за пару часов. Пишите в личные сообщения, все обсудим
-
proposal withdrawn
-
Приветствую, то бишь конечный файл должен содержать в себе исключительно HTML код, без CSS?
-
Напишите в ЛС. Скину пример обработанного файла.