mzec / puobot

Web robot koji radi katalog PUO i SPUO postupaka nadležnog ministarstva za zaštitu okoliša i prirode RH


puobot

Uvod

puobot je web robot koji radi katalog PUO i SPUO postupaka nadležnog ministarstva za zaštitu okoliša i prirode RH. Powering Robo-MZOIP.

Problem

Dokumenti o postupcima procjene utjecaja na okoliš na web stranici nadležnog ministarstva za zaštitu okoliša i prirode se dodaju na način da je nemoguće sustavno i redovito pratiti objave novih dokumenata.

Rješenje

Web scraper koji redovito prati nove dodane dokumente i radi katalog zahvata i dokumenata, te po potrebi nove zahvate objavljuje putem twitter-a.

Korištenje

python3 puobot.py [--twitter 1]

Ulazni podaci

Twitter

Za twitter funkcionalnost potrebno je imati Twitter oauth podatke u zasebnim redovima u datoteci /input/twit_api_key.txt.

twit_api_key.txt: [API Key] [API Secret] [Access token] [Access token secret]

Izlazni podaci

Svi pronađeni dokumenti pospremaju se u arhivu u zasebne .tsv datoteke:

Sve razlike između posljednje verzije arhive spremljene u output/ folderu ispisuju se na standardni output (konzolu)

Zahtjevi

 • Python 3
 • requests (2.12.4)
 • BeautifulSoup4 (4.5.3)
 • lxml parser (3.7.2)
 • scraperwiki (0.5.1)
 • twython

Contributors mzec narimiran boromire

Last run failed with status code 1.

Console output of last run

Injecting configuration and compiling... -----> Python app detected ! The latest version of Python 3 is python-3.6.2 (you are using python-3.6.0, which is unsupported). ! We recommend upgrading by specifying the latest version (python-3.6.2). Learn More: https://devcenter.heroku.com/articles/python-runtimes -----> Installing python-3.6.0 -----> Installing pip -----> Installing requirements with pip Collecting lxml==3.7.2 Downloading lxml-3.7.2-cp36-cp36m-manylinux1_x86_64.whl (7.2 MB) Collecting scraperwiki==0.5.1 Downloading scraperwiki-0.5.1.tar.gz (7.7 kB) Preparing metadata (setup.py): started Preparing metadata (setup.py): finished with status 'done' Collecting beautifulsoup4==4.5.3 Downloading beautifulsoup4-4.5.3-py3-none-any.whl (85 kB) Collecting requests==2.12.4 Downloading requests-2.12.4-py2.py3-none-any.whl (576 kB) Collecting six Downloading six-1.16.0-py2.py3-none-any.whl (11 kB) Collecting sqlalchemy Downloading SQLAlchemy-1.4.39-cp36-cp36m-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.6 MB) Collecting alembic Downloading alembic-1.7.7-py3-none-any.whl (210 kB) Collecting importlib-metadata Downloading importlib_metadata-4.8.3-py3-none-any.whl (17 kB) Collecting importlib-resources Downloading importlib_resources-5.4.0-py3-none-any.whl (28 kB) Collecting Mako Downloading Mako-1.1.6-py2.py3-none-any.whl (75 kB) Collecting greenlet!=0.4.17 Downloading greenlet-1.1.2-cp36-cp36m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (147 kB) Collecting typing-extensions>=3.6.4 Downloading typing_extensions-4.1.1-py3-none-any.whl (26 kB) Collecting zipp>=0.5 Downloading zipp-3.6.0-py3-none-any.whl (5.3 kB) Collecting MarkupSafe>=0.9.2 Downloading MarkupSafe-2.0.1-cp36-cp36m-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_12_x86_64.manylinux2010_x86_64.whl (30 kB) Building wheels for collected packages: scraperwiki Building wheel for scraperwiki (setup.py): started Building wheel for scraperwiki (setup.py): finished with status 'done' Created wheel for scraperwiki: filename=scraperwiki-0.5.1-py3-none-any.whl size=6545 sha256=fcc389bd0d6641e428480768199f93ae1af1939f4fe7cb442ec378c40a2da25a Stored in directory: /tmp/pip-ephem-wheel-cache-6rehaave/wheels/cd/f8/ac/cd66eb1c557ab40d35c1ed852da3e9b37baa3e21b61906a5cf Successfully built scraperwiki Installing collected packages: zipp, typing-extensions, MarkupSafe, importlib-metadata, greenlet, sqlalchemy, Mako, importlib-resources, six, requests, alembic, scraperwiki, lxml, beautifulsoup4 Successfully installed Mako-1.1.6 MarkupSafe-2.0.1 alembic-1.7.7 beautifulsoup4-4.5.3 greenlet-1.1.2 importlib-metadata-4.8.3 importlib-resources-5.4.0 lxml-3.7.2 requests-2.12.4 scraperwiki-0.5.1 six-1.16.0 sqlalchemy-1.4.39 typing-extensions-4.1.1 zipp-3.6.0  -----> Discovering process types Procfile declares types -> scraper Injecting scraper and running... tražim PUO postupke... Traceback (most recent call last): File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/connection.py", line 138, in _new_conn (self.host, self.port), self.timeout, **extra_kw) File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/util/connection.py", line 98, in create_connection raise err File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/util/connection.py", line 88, in create_connection sock.connect(sa) OSError: [Errno 113] No route to host During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/connectionpool.py", line 594, in urlopen chunked=chunked) File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/connectionpool.py", line 361, in _make_request conn.request(method, url, **httplib_request_kw) File "/app/.heroku/python/lib/python3.6/http/client.py", line 1239, in request self._send_request(method, url, body, headers, encode_chunked) File "/app/.heroku/python/lib/python3.6/http/client.py", line 1285, in _send_request self.endheaders(body, encode_chunked=encode_chunked) File "/app/.heroku/python/lib/python3.6/http/client.py", line 1234, in endheaders self._send_output(message_body, encode_chunked=encode_chunked) File "/app/.heroku/python/lib/python3.6/http/client.py", line 1026, in _send_output self.send(msg) File "/app/.heroku/python/lib/python3.6/http/client.py", line 964, in send self.connect() File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/connection.py", line 163, in connect conn = self._new_conn() File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/connection.py", line 147, in _new_conn self, "Failed to establish a new connection: %s" % e) requests.packages.urllib3.exceptions.NewConnectionError: <requests.packages.urllib3.connection.HTTPConnection object at 0x7ffb562aa7b8>: Failed to establish a new connection: [Errno 113] No route to host During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/app/.heroku/python/lib/python3.6/site-packages/requests/adapters.py", line 423, in send timeout=timeout File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/connectionpool.py", line 643, in urlopen _stacktrace=sys.exc_info()[2]) File "/app/.heroku/python/lib/python3.6/site-packages/requests/packages/urllib3/util/retry.py", line 363, in increment raise MaxRetryError(_pool, url, error or ResponseError(cause)) requests.packages.urllib3.exceptions.MaxRetryError: HTTPConnectionPool(host='puo.mzoe.hr', port=80): Max retries exceeded with url: /hr/puo.html (Caused by NewConnectionError('<requests.packages.urllib3.connection.HTTPConnection object at 0x7ffb562aa7b8>: Failed to establish a new connection: [Errno 113] No route to host',)) During handling of the above exception, another exception occurred: Traceback (most recent call last): File "scraper.py", line 85, in <module> puo_tab = trazenje('puo') File "scraper.py", line 82, in trazenje return puoscrape(url, postupak) File "scraper.py", line 24, in puoscrape r = requests.get(urlname) File "/app/.heroku/python/lib/python3.6/site-packages/requests/api.py", line 70, in get return request('get', url, params=params, **kwargs) File "/app/.heroku/python/lib/python3.6/site-packages/requests/api.py", line 56, in request return session.request(method=method, url=url, **kwargs) File "/app/.heroku/python/lib/python3.6/site-packages/requests/sessions.py", line 488, in request resp = self.send(prep, **send_kwargs) File "/app/.heroku/python/lib/python3.6/site-packages/requests/sessions.py", line 609, in send r = adapter.send(request, **kwargs) File "/app/.heroku/python/lib/python3.6/site-packages/requests/adapters.py", line 487, in send raise ConnectionError(e, request=request) requests.exceptions.ConnectionError: HTTPConnectionPool(host='puo.mzoe.hr', port=80): Max retries exceeded with url: /hr/puo.html (Caused by NewConnectionError('<requests.packages.urllib3.connection.HTTPConnection object at 0x7ffb562aa7b8>: Failed to establish a new connection: [Errno 113] No route to host',))

Data

Downloaded 37 times by mzec igadmile curlin29

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 10 / 1851

kategorija ime dokument file_ime file_link
PUO postupci 2014.
Modernizacija postojećeg i izgradnja drugog kolosijeka željezničke pruge M201 na dionici Križevci - Koprivnica - državna granica
PUO javni uvid
Ne-tehnički sažetak Studije [PDF]
PUO postupci 2014.
Modernizacija postojećeg i izgradnja drugog kolosijeka željezničke pruge M201 na dionici Križevci - Koprivnica - državna granica
PUO javni uvid
STUDIJA o utjecaju na okoliš [PDF]
PUO postupci 2014.
Modernizacija postojećeg i izgradnja drugog kolosijeka željezničke pruge M201 na dionici Križevci - Koprivnica - državna granica
PUO javni uvid
15.10.2014. - INFORMACIJA o odluci da se Studija o utjecaju na okoliš upućuje na javnu raspravu [PDF]
PUO postupci 2014.
Modernizacija postojećeg i izgradnja drugog kolosijeka željezničke pruge M201 na dionici Križevci - Koprivnica - državna granica
PUO informacija o zahtjevu
28.04.2014. - INFORMACIJA o zahtjevu za provedbu postupka procjene utjecaja zahvata na okoliš [PDF]
PUO postupci 2014.
Izgradnja dionice pruge Hrvatski Leskovac - Josipdol
PUO informacija o zahtjevu
16.07.2014. - INFORMACIJA o zahtjevu za provedbu postupka procjene utjecaja zahvata na okoliš [PDF]
PUO postupci 2014.
Eksploatacija arhitektonsko-građevnog kamena (kao primarne sirovine) i tehničko-građevnog kamena (kao sekundarne sirovine) na budućim eksploatacijskim poljima 'Dalma-Dolit' i 'Dolit-Marasović' na području Grada Omiša
PUO javni uvid
17.12.2014. - INFORMACIJA o odluci da se Studija o utjecaju na okoliš upućuje na javnu raspravu [PDF]
PUO postupci 2014.
Eksploatacija arhitektonsko-građevnog kamena (kao primarne sirovine) i tehničko-građevnog kamena (kao sekundarne sirovine) na budućim eksploatacijskim poljima 'Dalma-Dolit' i 'Dolit-Marasović' na području Grada Omiša
PUO informacija o zahtjevu
10.09.2014. - INFORMACIJA o zahtjevu za provedbu postupka procjene utjecaja zahvata na okoliš [PDF]
PUO postupci 2014.
Eksploatacija tehničko-građevnog kamena na eksploatacijskom polju 'Zvečaj', Grad Duga Resa
PUO javni uvid
Ne-tehnički sažetak Studije [PDF]
PUO postupci 2014.
Eksploatacija tehničko-građevnog kamena na eksploatacijskom polju 'Zvečaj', Grad Duga Resa
PUO javni uvid
Grafički prilozi [PDF]
PUO postupci 2014.
Eksploatacija tehničko-građevnog kamena na eksploatacijskom polju 'Zvečaj', Grad Duga Resa
PUO javni uvid
Tekstualni prilozi [PDF]

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 10 / 7359

kategorija ime dokument file_ime file_link
OPUO postupci 2014.
Pogon za preradu proizvoda ribarstva - Poslovni park Karlovac, Logorište, kapaciteta prerade 3,27 t/dan, Općina Barilović
OPUO informacija
16.12.2014. - INFORMACIJA o zahtjevu za ocjenu o potrebi procjene utjecaja zahvata na okoliš [PDF]
OPUO postupci 2015.
Rekonstrukcija luke otvorene za javni promet Červar Porat
OPUO elaborat
Prilog: Presjeci [PDF]
OPUO postupci 2015.
Rekonstrukcija luke otvorene za javni promet Červar Porat
OPUO elaborat
Prilog: Situacija - novo stanje [PDF]
OPUO postupci 2015.
Rekonstrukcija luke otvorene za javni promet Červar Porat
OPUO elaborat
Prilog: Kopija katastarskog plana - novo stanje [PDF]
OPUO postupci 2015.
Rekonstrukcija luke otvorene za javni promet Červar Porat
OPUO informacija
09.01.2015. - INFORMACIJA o zahtjevu za ocjenu o potrebi procjene utjecaja na okoliš [PDF]
OPUO postupci 2015.
Sanacija i zatvaranje odlagališta neopasnog otpada Gajevi u Drenovcima
OPUO informacija
12.01.2015. - INFORMACIJA o zahtjevu za ocjenu o potrebi procjene utjecaja na okoliš [PDF]
OPUO postupci 2015.
Rekonstrukcija te povećanje kapaciteta, efikasnosti i energetske učinkovitosti postojećeg postrojenja Tvornice ulja Čepin, Općina Čepin
OPUO informacija
13.01.2015. - INFORMACIJA o zahtjevu za ocjenu o potrebi procjene utjecaja na okoliš [PDF]
OPUO postupci 2015.
Dogradnja poslovne građevine 'Klaonica i prerada mesa', Petrijevci
OPUO informacija
26.01.2015. - INFORMACIJA o zahtjevu za ocjenu o potrebi procjene utjecaja zahvata na okoliš [PDF]
OPUO postupci 2015.
Uređenje plaže u Općini Funtana (Istarska županija) od uvale Perila do autokampa Bijela uvala
OPUO informacija
02.02.2015. - INFORMACIJA o zahtjevu za ocjenu o potrebi procjene utjacaja na okoliš [PDF]
OPUO postupci 2015.
Uređenje sportsko-rekreacijskog centra Mujela na području Grada Novigrada u Istarskoj županiji
OPUO elaborat
Prilog: Vizualizacija klupske kuće [PDF]

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 10 / 22

ime file_ime file_link
Novi blokovi nuklearne elektrane Paks NPP II u Republici Mađarskoj
09.09.2015. - OBAVIJEST o javnoj raspravi o Studiji o utjecaju na okoliš [PDF]
Novi blokovi nuklearne elektrane Paks NPP II u Republici Mađarskoj
Sažetak za javnost [PDF]
Novi blokovi nuklearne elektrane Paks NPP II u Republici Mađarskoj
STUDIJA o utjecaju na okoliš - Međunarodno poglavlje [PDF]
Novi blokovi nuklearne elektrane Paks NPP II u Republici Mađarskoj
STUDIJA o utjecaju na okoliš [PDF]
Novi blokovi nuklearne elektrane Paks NPP II u Republici Mađarskoj
17.09.2015. - INFORMACIJA o javnoj raspravi o Studiji o utjecaju na okoliš [PDF]
Hidorelektrana Mokrice u Republici Sloveniji
Prilog Studiji 2 [ZIP]
Hidorelektrana Mokrice u Republici Sloveniji
Prilog Studiji 1 [ZIP]
Hidorelektrana Mokrice u Republici Sloveniji
STUDIJA o utjecaju na okoliš [ZIP]
Hidorelektrana Mokrice u Republici Sloveniji
19.10.2015. - INFORMACIJA o javnoj raspravi o Studiji o utjecaju na okoliš [PDF]
Hidorelektrana Mokrice u Republici Sloveniji
18.11.2015. - OBAVIJEST o produljenju trajanja javnog uvida i javne rasprave [PDF]

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 10 / 107

ime file_ime file_link
Državni prostorni plan za područje HE Brežice i Državni prostorni plan za područje HE Brežice u Republici Sloveniji
Državni prostorni plan za područje HE Brežice [PDF]
Državni prostorni plan za područje HE Brežice i Državni prostorni plan za područje HE Brežice u Republici Sloveniji
Strateška studija za Državni prostorni plan za područje HE Brežice [PDF]
Državni prostorni plan za područje HE Brežice i Državni prostorni plan za područje HE Brežice u Republici Sloveniji
01.03.2010. - INFORMACIJA o javnoj raspravi [PDF]
Nacionalni energetski program Republike Slovenije 2010. - 2030.
Sažetak Nacionalnog energetskog programa Republike Slovenije [PDF]
Nacionalni energetski program Republike Slovenije 2010. - 2030.
Ne-tehnički sažetak Strateške studije [PDF]
Nacionalni energetski program Republike Slovenije 2010. - 2030.
21.11.2011. - INFORMACIJA o javnoj raspravi [PDF]
Plan upravljanja vodnim područjem Dunavskog sliva i Jadranskog mora Republike Slovenije 2009. - 2015.
Strateška studija [PDF]
Plan upravljanja vodnim područjem Dunavskog sliva i Jadranskog mora Republike Slovenije 2009. - 2015.
Ne-tehnički sažetak Strateške studije [PDF]
Plan upravljanja vodnim područjem Dunavskog sliva i Jadranskog mora Republike Slovenije 2009. - 2015.
23.08.2012. - INFORMACIJA o javnoj raspravi [PDF]
Državni prostorni plan za područje HE Mokrice
Nacrt Državnog prostornog plana za područje HE Mokrice [PDF]

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 10 / 120

ime file_ime file_link
Strategija prilagodbe klimatskim promjenama u Republici Hrvatskoj za razdoblje do 2040. godine s pogledom na 2070. godinu
19.07.2017. - INFORMACIJA o pokretanju postupka strateške procjene i izradi strateške studije – određivanje sadržaja strateške studije utjecaja na okoliš (pdf)
Strategija prilagodbe klimatskim promjenama u Republici Hrvatskoj za razdoblje do 2040. godine s pogledom na 2070. godinu
19.07.2017. - ODLUKA o započinjanju postupka strateške procjene utjecaja na okoliš (pdf)
Operativni program 'Okoliš' 2007. - 2013.
Operativni program 'Okoliš' 2007.-2013. [PDF]
Operativni program 'Okoliš' 2007. - 2013.
21.05.2010. - INFORMACIJA o provedbi postupka određivanja sadržaja strateške studije [PDF]
Operativni program 'Okoliš' 2007. - 2013.
27.09.2010. - ODLUKA o sadržaju strateške studije [PDF]
Operativni program 'Okoliš' 2007. - 2013.
Nacrt prijedloga Operativnog programa 'Okoliš' [PDF]
Operativni program 'Okoliš' 2007. - 2013.
Ne-tehnički sažetak Strateške studije [PDF]
Operativni program 'Okoliš' 2007. - 2013.
Sažetak Operativnog programa 'Okoliš i energetika' [PDF]
Operativni program 'Okoliš' 2007. - 2013.
11.06.2012. - INFORMACIJA o javnoj raspravi [PDF]
Operativni program 'Okoliš' 2007. - 2013.
02.08.2013. - IZVJEŠĆE o provedenom postupku strateške procjene utjecaja na okoliš [PDF]

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 10 / 77

ime nadlezno-tijelo link
IV. Izmjene i dopune Prostornog plana Vukovarsko-srijemske županije
Nadležno tijelo je Vukovarsko-srijemska županija.
Plan gospodarenja otpadom u Gradu Zagrebu do 2015.
Nadležno tijelo je Grad Zagreb.
Operativni program 'Regionalna konkurentnost' 2007.-2013.
Nadležno tijelo je Ministarstva regionalnoga razvoja i fondova Europske unije.
Izmjene i dopune Prostornog plana Istarske županije
Nadležno tijelo je Istarska županija.
Prostorni plan Primorsko-goranske županije
Nadležno tijelo je Primorsko-goranska županija.
IV. Izmjene i dopune Prostornog plana Vukovarsko-srijemske županije
Nadležno tijelo je Vukovarsko-srijemska županija.
Nacionalni plan ribarstva Republike Hrvatske i Operativni program 'Ribarstvo' 2007.-2013.
Nadležno tijelo je Ministarstvo poljoprivrede.
Višegodišnji program gradnje regulacijskih i zaštitnih vodnih građevina i građevina za melioraciju 2013.-2017.
Nadležno tijelo je Ministarstvo poljoprivrede.
Program ruralnog razvoja Republike Hrvatske 2014.-2020.
Nadležno tijelo je Ministarstvo poljoprivrede.
Strategija prometnog razvoja Republike Hrvatske 2014.-2030.
Nadležno tijelo je Ministarstvo pomorstva, prometa i infrastrukture.

To download data sign in with GitHub

Download table (as CSV) Download SQLite database (4.29 MB) Use the API

rows 1 / 1

ime link
Plan o izmjenama Plana gospodarenja otpadom u Republici Hrvatskoj za razdoblje 2007.-2015.

Statistics

Average successful run time: 3 minutes

Total run time: 4 days

Total cpu time used: about 2 hours

Total disk space used: 4.83 MB

History

 • Auto ran revision dd347169 and failed .
  nothing changed in the database
 • Auto ran revision dd347169 and failed .
  nothing changed in the database
 • Auto ran revision dd347169 and failed .
  nothing changed in the database
 • Auto ran revision dd347169 and failed .
  nothing changed in the database
 • Auto ran revision dd347169 and failed .
  nothing changed in the database
 • ...
 • Created on morph.io

Show complete history

Scraper code

Python

puobot / scraper.py