Aineiston esittäminen graafisesti Graafisesi aineistoa voidaan esittää:
käyränä
histogrammin muodossa
kumulatiivinen jakauma
scatterplot; tuo esiin korrelaatiot eri parametrien välillä
boxplot; esittää aineiston ulottuvuuden, kvartiilit sekä mediaanin. Poikkeamat (outliers) näytetään yleensä erillään muusta datasta
quantile-quantile plot; osoittaa aineiston jakauman poikkeaman jostain tietystä jakaumasta, esimerkiksi normaalista jakaumasta
aineiston esittäminen dynaamisesti linkitetyissä ikkunoissa
brushing; piirteet jotka valitaan esimerkiksi scatterplot-kuvassa aktivoituvat samanaikaisesti kartalla
Aineistokyselyt ominaisuustiedon perusteella Kyselyjen toteutus voi poiketa eri järjestelmissä sekä myös esim. ArcGIS:in sisällä. Jos aineisto on tallennettu geotietokantaan, ArcGIS käyttää SQL kyselyitä.
SQL lauseke sisältää kentät: select, from, where + kyselylauseke. Kyselylauseke voi sisältää tavallisten operaatioiden lisäksi loogisia operaatioita (AND, OR, NOT)
Valittujen piirteiden joukosta voidaan edelleen poistaa, siihen lisätä, tai valita alajoukko piirteitä
Jos ominaisuustiedon tauluja on linkitetty esim. relate-työkalulla, kyselyt voidaan tehdä samalla lausekkeella molempiin tauluihin
Spatiaalinen kysely Kysely (eli piirteiden valinta) voidaan tehdä karttanäkymällä esimerkiksi klikkaamalla niitä hiirellä tai määrittämällä piirteiden ympärille neliskulmainen alue.
Piirteitä voidaan valita myös esimerkiksi ympyrän tai monikulmion (polygon) muotoisen alueen mukaan
Lisäksi piirteitä voidaan valita niiden keskinäisen spatiaalisen suhteen mukaan:
sisältyvyys
päällekkäisyys
läheisyys (erikoistapauksena vierekkäisyys, jos etäisyys on 0)
Piirteiden valintaa ominaisuustiedon mukaan ja spatiaalisesti voidaan yhdistää (esim. valitaan väestö 5 km etäisyydellä kouluista tietyn syntymävuoden mukaan)
Kyselyt rasterimuotoiseen aineistoon Esimerkiksi ArcGIS:issä kyselyt rasterimuotoiseen aineistoon sisältyvät aineiston analyysiä koskeviin työkalupaketteihin
Rasterimuotoisen aineiston tapauksessa kyselyn kohteena ovat sen rasterin arvot itse (ei siis erikseen oleva ominaisuustieto). Kyselyllä voidaan valita rasterin solut (pikselit) joilla on tietty arvo tai jonka arvo on tietyllä arvoalueella.
Kyselyt rasterimuotoiseen aineistoon voivat käsittää useampia rastereita (esim. ([slope] = 2) AND ([aspect] = 1), jossa slope ja aspect ovat erillisiä rastereita)
Rasterimuotoisesta aineistoista voidaan valita soluja piirteiden mukaan (esim. tietyn monikulmion sisälle jäävät solut). Tällöin valikoidun joukon ulkopuolelle jäävien solujen arvo on ’NoData’
Vektorimuotoisen aineiston analyysimenetelmät Vektorimuotoisen paikkatietoaineiston analyysimenetelmät voidaan jakaa
Perusmenetelmät (tarvitaan sovellusalueesta riippumatta), esim.
puskurointi
päällekkäisyysanalyysi
etäisyysanalyysi
…
Sovellusaluekohtaiset menetelmät (esim. hydrologisessa mallinnuksessa käytettävät menetelmät)
Tässä materiaalissa keskitytään perusmenetelmiin
Puskurointi Puskurointi jakaa esitettävän alueen kahteen osaan:
kyseisen piirteen (feature) läheisyydessä (tietyn etäisyyden sisällä) oleva alue
siitä etäisyydestä kauempana oleva alue
Puskurointi voidaan tehdä pisteille, viivoille sekä alueille.
Puskurointi voi olla
vakioetäisyydellä tai vaihtelevalla etäisyydellä
molemmanpuoleinen tai yksipuoleinen
yhteinen tai erillinen eri piirteille
Puskuroinnin tarkoitus voi olla esimerkiksi
suojelualueiden määrittäminen jokien ja järvien ympärille
rakennuskielto-alueiden määrittäminen valtateiden
läheisyyteen
alueiden määrittäminen voimalinjojen läheisyyteen jotka
täytyy puhdistaa puustosta
…
Päällekkäisyysanalyysi Päällekkäisyysanalyysi voidaan tehdä
kahden alueita kuvaavan karttatason välillä
alueita kuvaavan ja joko pisteitä tai viivoja kuvaavan karttatason välillä
Spatial Join – analyysi lisää sisääntulo-tason ominaisuustieto-taulukkoon sarakkeen jossa on tieto siitä, mille alueelle kukin piirre osuu. Jos sisääntulo-taso koostuu viivoista (tai alueista), viivat (tai alueet) jotka kulkevat läpi useamman overlay-alueen, jaetaan alueiden mukaan osiksi.
Päällekkäisyysanalyysin tapoja ovat:
unioni (sisältää molemman lähtötason alueet; toimii vain alueiden välillä)
yhteinen osa
symmetrinen erotus (edellisen komplementti; toimii vain alueiden välillä)
identtisyys (säilyttää sisääntulo-tason geometrisesti muuttumattomana)
Päällekkäisyysanalyysi: pirstaleet Jos alueiden rajat eivät täsmää aivan tarkkaan, päällekkäisyysanalyysi voi aiheuttaa pirstaleiden syntymisen. Pirstaleet voivat syntyä myös muista syistä, esim. digitoinnin tai aineiston tulkinnan epätarkkuudesta.
Pirstaleet voidaan päällekkäisyysanalyysin yhteydessä välttää käyttämällä ns. cluster tolerance määrittelyä. Tällöin määritetyn toleranssin sisälle jäävät viivat tai pisteet yhdistetään. Jos käytetään liian isoa toleranssia, pienemmät piirteet voivat hävitä kokonaan.
Etäisyyksien ja keskipisteiden laskeminen Euklidisia etäisyyksiä voidaan laskea esim. pisteiden välillä tai pisteiden ja viivojen välillä.
ArcGIS:issä mahdollista esim. laskea etäisyyksiä lähimpään pisteeseen tai viivaan niin että etäisyys ilmaantuu ominaisuustaulukon uuteen sarakkeeseen (ns. spatial join)
Alueen tai pistejoukon keskipiste voidaan laskea hyvin monella tavalla, esim.:
kulmapisteiden keskiarvo
massakeskipiste
minimum bounding rectangle – keskipiste
minimum bounding circle – keskipiste
suurin sisältyvä suorakulmio – keskipiste
suurin sisältyvä ympyrä – keskipiste
minimietäisyys-keskipiste
Rakenne-analyysi Rakenne-analyysin tarkoitus on tutkia, ovatko piirteet jakautuneet tilassa satunnaisesti tai kuinka hajautuneet / ryhmittyneet piirteet ovat.
Lähin naapuri (NN) – analyysi:
- lähimpien naapureiden välinen keskimääräinen etäisyys
- vastaava etäisyys jos piirteet olisivat jakautuneet satunnaisesti tietyn jakauman mukaisesti
Jos R > 1, piirteet ovat enemmän hajalla kuin mitä käytetty jakauma edellyttäisi
Jos R < 1, piirteet muodostavat ryhmiä
NN (nearest neighbor) – etäisyyden perusteella voidaan laskea myös ns. z-score
*NN-analyysi NN-analyysia varten tarvitaan keskimääräinen lähimpien naapureiden välinen etäisyys tietyn referenssijakautuman tapauksessa. Yleensä referenssijakautuma on tasainen jakautuma eli sen mukaan pisteet oletetaan sijaitsevan spatiaalisesti täysin satunnaisesti.
Osoittautuu että täysin satunnaisen sijainnin tapauksessa etäisyys lähimpien naapureiden välillä jakautuu Poissonin jakautuman mukaisesti:
Keskiarvo tässä tapauksessa on:
Tässä m on pisteiden keskimääräinen
tiheys.
Spatiaalinen autokorrelaatio: Moran:in I NN-analyysi ottaa huomioon pelkästään aineiston spatiaalisen sijainnin eikä piirteiden ominaisuuksia. Spatiaalinen autokorrelaatio sen sijaan mittaa, ovatko esim. pisteet ryhmittyneet jonkun ominaisuuden mukaan.
Yleisin spatiaalisen autokorrelaation mitta on Moran:in I:
Tässä käsittää painokertoimet, jotka yleensä valitaan käänteisesti
suhteessa pisteiden i ja j etäisyyteen ( )
Jos pisteiden arvo ei korreloi niiden sijainnin kanssa, I:n arvo on:
Jos lähellä olevilla pisteillä on samanlainen arvo, I on suurempi kuin yllä oleva luku. Jos taas lähellä sijaitsevien pisteiden arvot poikkeavat toisistaan keskimääräistä enemmän, I on pienempi kuin yllä oleva luku.
Moran:in I Moran:in I voidaan esittää myös normalisoituna käyttäen z-skaalaa.
Moran:in I voidaan laskea pisteiden lisäksi esim. alueille. Tällöin painokertoimen arvona voidaan käyttää arvoa ’1’ jos kyseessä ovat vierekkäiset alueet ja arvoa ’0’ jos alueet eivät ole vierekkäin.
Moran:in I mitasta on kehitetty myös paikallinen versio: Local Indocator of Spatial Association (LISA). Se kertoo, onko kyseinen piirre (piste tai alue) vierekkäin samanlaista arvoa omaavien alueiden kanssa tai poikkeavaa arvoa omaavien alueiden kanssa.
G-mitta klusteroitumisen tason määrittelyyn Moran:in I kertoo, sijaitsevatko arvoltaan samanlaiset pisteet lähekkäin. Se ei kerro ovatko näiden lähekkäin sijaitsevien pisteiden arvot suuria tai pieniä. Asiaa voidaan tutkia G-mitan avulla:
d on etäisyys jonka rajoissa G-mittaa lasketaan (eli maksimietäisyys i:n ja j:n välillä).
Jos klusterointia ei esiinny,
G-mitan suuri / pieni arvo kertoo että arvoltaan suuret / pieneet pisteet tai alueet ovat klusteroituneet.
Myös G-mitasta on kehitetty paikallinen versio (local G-statistic). Jos sen arvo on jossain kohdassa suuri / pieni, puhutaan ns. hot / cold spot - alueesta
Rakenne-analyysin (pattern analysis) sovellukset Rakenne-analyysin oleellisempia sovelluksia ovat esimerkiksi
rikostilastojen analyysi
terveystiedon analyysi
tuhoeläinten havaintojen analyysi
kiinteistöhintojen analyysi
…
Spatiaalisen autokorrelaation avulla voidaan seurata ilmiöiden spatiaalisen jakautuman muutoksia
Spatiaalinen autokorrelaatio on tärkeä tilastollisten testien soveltamisessa. Monet tilastolliset testit edellyttävät että aineisto on korreloimaton. Jos edellä esitetyt mitat tuovat ilmi aineiston voimakkaan korrelaation, tällaisten testien käyttö ei ole oikeutettu
Piirteiden manipulointi Piirteitä voidaan manipuloida:
Sulauttamalla yhteen samaa ominaisuusarvoa omaavat vierekkäiset alueet (dissolve)
Leikkaamalla tietystä karttatasosta vain tietylle rajatulle alueelle jäävät piirteet (clip)
Yhdistämällä karttatasoja (append)
Valikoimalla uuteen karttatasoon vain tietyt kyselyllä valikoidut piirteet (select)
Poistamalla karttatasosta tietyt kyselyllä valikoidut piirteet (eliminate)
Korvaamalla tietylle rajatulle alueelle jäävät piirteet toisen karttatason piirteillä (update)
Poistamalla tietylle rajatulle alueelle jäävät piirteet karttatasosta (erase)
Halkaisemalla karttataso kahteen tai useampaan karttatasoon (split)
Comments