Собираю ссылки на опубликованные файлы из Национальной библиотеки. Раньше выкачивал выдачу через...
Собираю ссылки на опубликованные файлы из Национальной библиотеки. Раньше выкачивал выдачу через API, но часть материалов не скачал Доработать пайплайн загрузки, конечно, нужно, однако есть альтернативные способы для поиска прямых ссылок на PDF: — парсинг Google Search — вебархив (web.archive.org)...
Читать далее




