HTML это боль
Оказалось что парсер может парсить сайты НО! Как всегда будет НО которое испортит кайф. Получилось так что памяти не хвататет что логично.
Так что как бы не хотелось то велосипеды придется писать... Хотя время надо еще наскрести, но блок-схему уже накидал.
Скрытый текст
И хотя нефига не видно из за того что это картинка, если кратко то просто выписал список тегов которых чаще всего хранят текст
и буду их рекурсивно их сканировать до тех пор пока мы ничего не найдем.
И сразу же на пути будем записывать в файл что бы не хранить все в опертиве.
Главное только CSS убивать что бы он не попадался. . .
Войдите, чтобы подписаться
Подписчики
0
0 комментариев
Рекомендуемые комментарии
Нет комментариев для отображения