pdf_hunter

Search for and download PDF file links from a webpage.

Installation

This has been tested using Python 3 and Python 2.7.

pip install pdf_hunter

import pdf_hunter

url = "https://github.com/EbookFoundation/free-programming-books/blob/master/free-programming-books.md"

pdf_urls = pdf_hunter.get_pdf_urls(url)
pdf_urls[:10]

pdf_url = pdf_urls[0]
pdf_url

file_name = pdf_hunter.get_pdf_name(pdf_url)
file_name

'glib-gtk-dev-platform.pdf'

import os

os.path.isfile(file_name)

False

pdf_hunter.download_file(pdf_url, folder_path=os.getcwd())

os.path.isfile(file_name)

True

pdf_hunter.download_pdf_files(url, folder_path=os.getcwd())

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
.vscode		.vscode
notes		notes
pdf_hunter		pdf_hunter
tests		tests
.gitignore		.gitignore
.travis.yml		.travis.yml
LICENSE		LICENSE
README.md		README.md
create_environment.bat		create_environment.bat
pyPI load.bat		pyPI load.bat
renovate.json		renovate.json
requirements-dev.txt		requirements-dev.txt
requirements.txt		requirements.txt
run_tests.bat		run_tests.bat
setup.py		setup.py
tox.ini		tox.ini