ebook img

Programski jezik R u vizualizaciji i analizi prostornih podataka PDF

103 Pages·2016·3.75 MB·Croatian
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Programski jezik R u vizualizaciji i analizi prostornih podataka

Programski jezik R u vizualizaciji i analizi prostornih podataka S730 priručnik za polaznike © 2015 Srce Ovu inačicu priručnika izradio je autorski tim Srca u sastavu: Autorica: dr. sc. Andreja Radović Recenzentica: mr. sc. Melita Perčec Tadić Urednica: Irena Jandrić Sveučilište u Zagrebu Sveučilišni računski centar Josipa Marohnića 5, 10000 Zagreb [email protected] ISBN 978-953-7138-76-9 (meki uvez) ISBN 978-953-7138-77-6 (PDF) Verzija priručnika: S730-20160713 Ovo djelo dano je na korištenje pod licencom Creative Commons Imenovanje-Nekomercijalno-Dijeli pod istim uvjetima 4.0 međunarodna. Licenca je dostupna na stranici: http://creativecommons.org/licenses/by-nc-sa/4.0/. Sadržaj Uvod ........................................................................................................................... 1 1. Prostorni podaci ................................................................................................... 3 1.1. Vrste dvodimenzionalnih GIS-podataka ...................................................................................... 3 1.1.1. Vektorski prikaz prostornih podataka ................................................................................ 6 1.1.2. Rasterski prikaz prostornih podataka ................................................................................ 7 1.2. Geopozicioniranje i lokalne koordinate - projekcije ..................................................................... 7 1.2.1. 2D geografske koordinate ................................................................................................. 8 1.2.2. 3D koordinatni sustavi - 3D geodetske (geografske) koordinate ...................................... 9 1.2.3. Prelazak iz trodimenzionalnog (3D) na dvodimenzionalni (2D) sustav ............................ 9 1.2.4. Referentne površine .......................................................................................................... 9 1.2.5. 2D Kartezijev koordinatni sustav ..................................................................................... 11 1.2.6. 2D polarni koordinatni sustav .......................................................................................... 11 1.2.7. Osnovno o projekcijama..................................................................................................12 1.3. Prostorni podaci u specijaliziranom GIS programu – SAGA GIS ..............................................15 2. Prostorni podaci u sustavu R ........................................................................... 17 2.1. Struktura prostornih podataka u sustavu R ...............................................................................17 2.1.1. CRAN – Spatial ............................................................................................................18 2.2. Vizualizacija prostornih podataka u sustavu R .........................................................................29 3. Uvod u analizu prostornih podataka ................................................................ 31 3.1. Proces analize prostornih podataka ..........................................................................................31 3.1.1. Prostorni uzorak ..............................................................................................................32 3.2. Specifičnosti analitike u prostoru...............................................................................................36 3.2.1. Slučajnost ........................................................................................................................37 3.2.2. Zavisnost – nezavisnost opservacija (opažanja) ............................................................37 3.2.3. Prostorna heterogenost...................................................................................................37 3.2.4. Prostorna autokorelacija .................................................................................................38 3.2.5. Specifičnosti geometrije na sferi .....................................................................................42 3.2.6. Ekološka zabluda i problem promjenjivih jedinica površine (MAUP) ..............................42 4. Uključivanje informacije o međusobnim odnosima opservacija u analizu ... 43 4.1. Prostorni odnosi - topologija ......................................................................................................43 4.2. Uključivanje međusobne ovisnosti među opservacijama u analizu ..........................................44 4.2.1. Međusobna povezanost diskretnih prostornih pojava .....................................................44 4.3. Mjere opće povezanosti podataka ............................................................................................51 4.3.1. Izračun opće mjere međusobne povezanosti prostornih podataka. ...............................51 4.3.2. Tipovi prostorne autokorelacije .......................................................................................53 4.3.3. Testiranje statističke značajnosti izračunatih indeksa prostorne povezanosti ................57 4.3.4. Getis Ord G statistika ......................................................................................................61 4.3.1. Mjere lokalne prostorne autokorelacije (povezanosti) ....................................................61 5. Točkasti procesi ................................................................................................. 63 5.1. Tipovi točkastih procesa ............................................................................................................63 5.2. Analiza točkastih procesa .........................................................................................................63 5.2.1. Opisne statistike točkastog procesa ...............................................................................64 5.2.2. Disperzija i organizacija točaka u točkastom procesu ....................................................65 5.2.3. Intenzitet točkastog procesa ...........................................................................................65 5.3. Procjena postojanja prostorne ovisnosti među događajima .....................................................70 5.3.1. Modeliranje točkastih procesa ........................................................................................70 5.3.2. Hipoteza o potpunoj prostornoj slučajnosti (engl. Complete Spatial Randomnes - CSR)70 5.3.3. 2 test ..............................................................................................................................71 5.3.4. Metoda najbližih susjeda .................................................................................................72 6. Analitika kontinuiranih procesa i geostatistika ............................................... 77 6.1. Mehanički (deterministički) modeli ............................................................................................78 6.2. Modeli temeljeni na ekspertnom znanju ....................................................................................78 6.3. Statistički (vjerojatnosni) modeli ................................................................................................78 6.3.1. Regresijski modeli ...........................................................................................................78 6.3.2. Geostatistika u sustavu R ...............................................................................................89 6.3.3. Paket gstat ......................................................................................................................89 7. Prostorno vremenski podaci u sustavu R ....................................................... 95 7.1. Paket spacetime ........................................................................................................................95 7.1.1. Zapisivanje prostorno-vremenskih informacija u paketu spacetime ...............................95 Programski jezik R u vizualizaciji i analizi prostornih podataka (S730) Uvod U tečaju Programski jezik R u vizualizaciji i analizi prostornih podataka (S730) obrađuju se osnove rada s prostornim podacima u sustavu R. Tečaj je namijenjen polaznicima bez, ali i s iskustvom u radu s prostornim podacima. Kako bi polaznici mogli aktivno pratiti i sudjelovati u izvođenju ovog tečaja, potrebno je imati sljedeće predznanje: 1. Poznavanje programskog jezika R, a specifično:  traženje pomoći unutar sustava R  poznavanje osnovnih struktura podataka u sustavu R  korištenje funkcija u sustavu R  poznavanje rada s grafičkim sustavima (osnovna i trellis grafika)  rad s bojama  rukovanje (manipulacija) tekstom  znanje rada s formatima datuma. 2. Poznavanje statističkih koncepata, minimalno:  osnove matrične algebre  osnove vjerojatnosti  uzorkovanje  mjerne skale  slučajne varijable i distribucije vjerojatnosti  intervali pouzdanosti i testiranje hipoteza  vrste modela  korelacijski i regresijski modeli  testiranje pretpostavki za primjenu izabranog modela  razumijevanje grafičkih prikaza statističkih koncepata i rezultata analize 3. Opća znanja:  pasivno poznavanje engleskog jezika radi mogućnosti praćenja dokumentacije unutar sustava R  barem minimalno iskustvo u programiranju je prednost  poznavanje osnova rada s računalom i operacijskim sustavom MS Windows U ovom su priručniku naredbe pisane fontom s jednakim razmacima među slovima (engl. monospace) (na primjer, naredba install.packages()). Sintaksa naredbi pisana je plavim monospace slovima, sa sivom pozadinom te sivim komentarima za dijelove koje program ne izvodi: >library(help = "base") #pomoć za paket base 1 Programski jezik R u vizualizaciji i analizi prostornih podataka (S730) U nekim slučajevima u ovaj dokument stavljen je i ispis koji proizvede naredba na konzoli. Ispis na konzoli također je pisan sivim ukošenim slovima. Tipke na tipkovnici pisane su monospace/Courier New slovima u uglatim zagradama (na primjer, [Enter]). Važni pojmovi su prilikom prvog spominjanja pisani podebljano. Tijekom tečaja paralelno ćemo koristiti termine varijabla i atribut. 2 Programski jezik R u vizualizaciji i analizi prostornih podataka (S730) 1. Prostorni podaci Prostorni podaci su svi podaci koji su direktno ili indirektno povezani s određenim položajem u prostoru ili geografskim područjem. Prostorni objekt predstavlja apstraktan prikaz pojave iz stvarnog okruženja povezan s određenim položajem ili geografskim područjem. Geografska informacija sadrži podatak o geografskim objektima, njihovom obliku, lokaciji te međusobnim odnosima (topologiji). Najopćenitije iskazano, prostorni podaci su podaci s koordinatama, ali i podaci kojima se opisuje samo relativan međusobni položaj (kao, na primjer, međusobni odnos kolonija bakterija na podlozi). U osnovi ih možemo podijeliti na prostorne informacije koje predstavljaju diskretne pojave u prirodi i one kojima opisujemo kontinuirane pojave. U daljnjem tekstu i vježbama u ovom tečaju prostornim podacima ćemo smatrati podatke s neke zemljopisne lokacije. Budući da prostorni podaci nastaju u cijelom nizu različitih disciplina i područja, postoji i čitav spektar različitih tipova prostornih podataka, struktura i scenarija. Geografski, georeferencirani podaci u svojoj biti uključuju dvije komponente: 1. prostornu komponentu – (geometrijsku ili grafičku) koja opisuje prostornu distribuciju prostornog fenomena te predstavlja pojednostavljenu, digitalnu informaciju o nekom području 2. atributnu komponentu koja opisuje svojstva objekta ili pojave. 1.1. Vrste dvodimenzionalnih GIS-podataka Pokušaji klasificiranja tipova prostornih podataka uglavnom su ili pregrubi ili predetaljni. Prema Cressie (1993.) možemo ih podijeliti na: 1. obrasce točaka – točkaste procese (engl. point pattern) 2. poligonske objekte (engl. areal data, lattice data) 3. geostatističke (kontinuirane) pojave. Uobičajeno je prostorne podatke i njihove atribute pohranjivati i upravljati njima u okviru Geografskog informacijskog sustava (GIS). Prema zajedničkim standardima Open Geospatial Consortium – OGC (http://www.opengeospatial.org/) i International Organisation for Standardisation - ISO, definiran je veći broj osnovnih dvodimenzionalnih GIS objekata (engl. simple features). To su:  Geometry – geometrija  Point, MultiPoint – točkasti objekti  LineString, MultiLineString – linijski objekti  Polygon, MultiPolygon, Triangle – poligonski objekti  CircularString – kružni prsten  Curve, MultiCurve, CompoundCurve – tipovi krivulja  CurvePolygon – zaobljeni poligoni  Surface, MultiSurface, PolyhedralSurface – površine 3 Programski jezik R u vizualizaciji i analizi prostornih podataka (S730)  TIN (engl. Triangulated Irregular Networks - TIN) – triangularizirane nepravilne mreže  GeometryCollection – kolekcije geometrija. Ove osnovne GIS-strukture organizirane su hijerarhijski. Primijetite da je definiranje koordinatnog sustava (engl. Spatial Reference System) jedinstveno za sve vrste geometrija. Sustav R omogućuje učitavanje osnovnih vektorskih GIS-objekata kako ih definira Open Geospatial Consortium – OGC: http://www.opengeospatial.org/. Za sve vektorske objekte vrijedi da se mogu izrađivati u samom sustavu unosom formata Well-Known Binary (WKB) ili Well-Known Text (WKT) uporabom funkcionalnosti paketa Rgeos funkcije readWKT(). Paket Rgeos je sučelje na biblioteku GEOS (http://trac.osgeo.org/geos/) koja je pak C++ veza prema Java Topology Suite - JTS (http://tsusiatsoftware.net/jts/main.html). JTS pruža potpunu, dosljednu, robustnu provedbu temeljnih algoritama za obradu linearne geometrije na 2- dimenzionalnoj kartezijevoj ravnini. GEOS je dostupan pod Lesser General Public Licence (http://www.gnu.org/licenses/old-licenses/lgpl-2.1.html). >moj_poligon <- readWKT("POLYGON((1 0,0 1,1 2,2 1,1 0))") Kako smo već spomenuli u ovom tečaju, najveći broj korisnika ipak ne izrađuje prostorne objekte unutar sustava R, već najčešće u GIS-u pripremljene prostorne objekte unosi u sustav R radi analize i vizualizacije. Važno je naglasiti da veći broj kontribuiranih paketa koje ćemo koristiti koristi funkcionalnosti paketa Rgeos (veze prema biblioteci GEOS (engl. Geometry Engine Open Source) – biblioteka otvorenog kôda, napisana u programskom jeziku Java (http://trac.osgeo.org/geos/) koji podržava sve ključne operacije na OGC geometrijama, topološke upite, ali i vezu prema bazama prostornih podataka. 4 Programski jezik R u vizualizaciji i analizi prostornih podataka (S730) Podaci u GIS-u predstavljaju stvarne objekte i pojave (kao što su ceste, uporaba zemljišta, visina, stabla, putevi, udari munja itd.). Mogu predstavljati i lokacije neke pojave ili izmjerenog fenomena, npr. lokacije pojava munja ili zabilježeno kretanje neke životinje. Realni objekti mogu se podijeliti u dvije apstrakcije: diskretni objekti (kao što su stabla, kuće) i kontinuirane površine (kao što su količina oborina ili nadmorska visina). Tradicionalno, postoje dvije osnovne metode koje se koriste za pohranu podataka u GIS-sustavima kao rezultat potrebe pohrane informacija za obje glavne vrste pojava u prirodi: vektorska prezentacija razvijena prvenstveno radi diskretnih pojava te rasterska prezentacija (površine) (engl. grid) radi prikaza kontinuiranih pojava u prirodi. Osnovni modeli prikaza objekata u prostoru: Vektorski prikaz Rasterski prikaz Točke Linije Površine (poligoni) Oba modela prikaza podataka samo su pojednostavljeni prikaz realnog svijeta. Napomena: Važno je razumjeti radi čega je određeni prikaz bolji za pojedine prirodne pojave. 5 Programski jezik R u vizualizaciji i analizi prostornih podataka (S730) 1.1.1. Vektorski prikaz prostornih podataka Unutar vektorskog GIS-a, elementi realnog svijeta prikazuju se putem tri osnovna tipa geometrija koji se sastoje od jednog ili više međusobno povezanih verteksa. Ovisno o suštini pojave u prirodi koju želimo prikazati prostornim objektom, objekti se dijele na one bez dimenzija (predstavljene točkom), jednodimenzionalne (predstavljane linijama) te dvodimenzionalne površine (predstavljene poligonima). Vektorskom elementu pridruženi su određeni atributi koji ga opisuju. Prednosti vektorskog prikaza podataka: 1. podaci se prikazuju u originalnoj rezoluciji i obliku, bez gubitka informacija 2. grafički prikaz jako podsjeća na tradicionalni izgled geografske karte 3. za jedan prostorni objekt moguće je čuvati velik broj informacija 4. definiranje topologije je efikasno. Nedostaci vektorskog prikaza: 1. potrebno je znatno više memorije za čuvanje informacije 2. analize se teško provode 3. teško je prikazati kontinuirane pojave u prirodi 4. upravljanje objektima nije jednostavno 5. struktura je vrlo kompleksna. Jedna od važnih funkcionalnosti sustava R je njegova mogućnost učitavanja već postojećih vektorskih geografskih podataka. Formati vektorskih podataka izvan sustava R ESRI Shapefile ili jednostavnije shapefile je popularni vektorski format prostornih podataka za GIS softver. ESRI ga je razvio kao otvorenu specifikaciju za interoperabilnost podataka između različitih softverskih proizvoda. Shapefile prvenstveno opisuje geometriju osnovnih prostornih objekata kao što su točka, linija i poligon. Svaki od navedenih objekata sadrži neke od atributa koji ga opisuju bilo da se radi o rednom broju, duljini, površini ili nekom drugom svojstvu koje je vezano za objekt. Interoperabilnost (međudjelovanje) podrazumijeva mogućnost kombiniranja skupova prostornih podataka i međudjelovanje usluga bez ponavljajuće manualne intervencije, tako da je rezultat dosljedan i da je dobivena dodana vrijednost skupa podataka i usluga. Format Shapefile, koji je izvorno osmislila kompanija ESRI, danas je neformalni standard (nikad odobren od strane OGC) za vektorsku prezentaciju okoline i ne postoji programski paket koji barata prostornim podacima, a da ne može učitati ovaj format. Struktura ESRI shapefile-datoteke (shp, kolokvijalno shapefile, shape) je u biti skup od nekoliko datoteka jednakog imena, ali različitih ekstenzija (formata) od kojih su sljedeće tri obavezne i pohranjuju:  ime.shp – informacije o geometriji odnosno oblicima prostornih objekata  ime.dbf – bazu podataka o prostornim objektima 6

Description:
Uključivanje informacije o međusobnim odnosima opservacija u analizu 43. 4.1. Prostorni .. analyst.net/wiki/index.php?title=MGI_/_Balkans_coordinate_systems). Tijekom tečaja . data :'data.frame': 155 obs. of 12 variables:.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.