glomerulus

pip install -r requirements.txt

from glomerulus.search.search import get_links_for_keywords

get_links_for_keywords('dzieci papierosy')

or

python main.py

then find and replace '&sa=.*' with '' in data/links.txt and delete all lines not starting with 'http'

scrapy runspider links_spider.py

scrapy runspider links_spider.py -o <json file>

or run spider and save in "data/articles.json":

python scrapy_run.py

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback