Перейти к содержимому

Шкодим по крупному

  • записи
    2
  • комментария
    2
  • просмотров
    1 655

HTML это боль

Taruu

471 просмотр

Оказалось что парсер может парсить сайты НО! Как всегда будет НО которое испортит кайф. Получилось так что памяти не хвататет что логично.
Так что как бы не хотелось то велосипеды придется писать... Хотя время надо еще наскрести, но блок-схему уже накидал.
 

Скрытый текст

AqNFmkOe9FVtGPnE5cWhjSSPKgUrOyvqYT8n-03x

И хотя нефига не видно из за того что это картинка, если кратко то просто выписал список тегов которых чаще всего хранят текст

и буду их рекурсивно их сканировать до тех пор пока мы ничего не найдем.

И сразу же на пути будем записывать в файл что бы не хранить все в опертиве.

 

Главное только CSS убивать что бы он не попадался. . .  
 



0 комментариев


Рекомендуемые комментарии

Нет комментариев для отображения

Гость
Добавить комментарий...

×   Вы вставили отформатированное содержимое.   Удалить форматирование

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...