Newest Viewed Downloaded

Luento 3 Paikkatietoaineiston tarkastelu ja analyysi

Luento 3 Paikkatietoaineiston tarkastelu ja analyysi

Aineiston tilastolliset mitat Yleisimpiä tilastollisia mittoja ovat: ulottuvuus (range) mediaani kvartiili (ensimmäinen (25%) ja kolmas (75%)) keskiarvo varianssi keskihajonta (neliöjuuri varianssista) Z-arvo

Aineiston esittäminen graafisesti Graafisesi aineistoa voidaan esittää: käyränä histogrammin muodossa kumulatiivinen jakauma scatterplot; tuo esiin korrelaatiot eri parametrien välillä boxplot; esittää aineiston ulottuvuuden, kvartiilit sekä mediaanin. Poikkeamat (outliers) näytetään yleensä erillään muusta datasta quantile-quantile plot; osoittaa aineiston jakauman poikkeaman jostain tietystä jakaumasta, esimerkiksi normaalista jakaumasta aineiston esittäminen dynaamisesti linkitetyissä ikkunoissa brushing; piirteet jotka valitaan esimerkiksi scatterplot-kuvassa aktivoituvat samanaikaisesti kartalla

Aineistokyselyt ominaisuustiedon perusteella Kyselyjen toteutus voi poiketa eri järjestelmissä sekä myös esim. ArcGIS:in sisällä. Jos aineisto on tallennettu geotietokantaan, ArcGIS käyttää SQL kyselyitä. SQL lauseke sisältää kentät: select, from, where + kyselylauseke. Kyselylauseke voi sisältää tavallisten operaatioiden lisäksi loogisia operaatioita (AND, OR, NOT) Valittujen piirteiden joukosta voidaan edelleen poistaa, siihen lisätä, tai valita alajoukko piirteitä Jos ominaisuustiedon tauluja on linkitetty esim. relate-työkalulla, kyselyt voidaan tehdä samalla lausekkeella molempiin tauluihin

Spatiaalinen kysely Kysely (eli piirteiden valinta) voidaan tehdä karttanäkymällä esimerkiksi klikkaamalla niitä hiirellä tai määrittämällä piirteiden ympärille neliskulmainen alue. Piirteitä voidaan valita myös esimerkiksi ympyrän tai monikulmion (polygon) muotoisen alueen mukaan Lisäksi piirteitä voidaan valita niiden keskinäisen spatiaalisen suhteen mukaan: sisältyvyys päällekkäisyys läheisyys (erikoistapauksena vierekkäisyys, jos etäisyys on 0) Piirteiden valintaa ominaisuustiedon mukaan ja spatiaalisesti voidaan yhdistää (esim. valitaan väestö 5 km etäisyydellä kouluista tietyn syntymävuoden mukaan)

Kyselyt rasterimuotoiseen aineistoon Esimerkiksi ArcGIS:issä kyselyt rasterimuotoiseen aineistoon sisältyvät aineiston analyysiä koskeviin työkalupaketteihin Rasterimuotoisen aineiston tapauksessa kyselyn kohteena ovat sen rasterin arvot itse (ei siis erikseen oleva ominaisuustieto). Kyselyllä voidaan valita rasterin solut (pikselit) joilla on tietty arvo tai jonka arvo on tietyllä arvoalueella. Kyselyt rasterimuotoiseen aineistoon voivat käsittää useampia rastereita (esim. ([slope] = 2) AND ([aspect] = 1), jossa slope ja aspect ovat erillisiä rastereita) Rasterimuotoisesta aineistoista voidaan valita soluja piirteiden mukaan (esim. tietyn monikulmion sisälle jäävät solut). Tällöin valikoidun joukon ulkopuolelle jäävien solujen arvo on ’NoData’

Vektorimuotoisen aineiston analyysimenetelmät Vektorimuotoisen paikkatietoaineiston analyysimenetelmät voidaan jakaa Perusmenetelmät (tarvitaan sovellusalueesta riippumatta), esim. puskurointi päällekkäisyysanalyysi etäisyysanalyysi … Sovellusaluekohtaiset menetelmät (esim. hydrologisessa mallinnuksessa käytettävät menetelmät) Tässä materiaalissa keskitytään perusmenetelmiin

Puskurointi Puskurointi jakaa esitettävän alueen kahteen osaan: kyseisen piirteen (feature) läheisyydessä (tietyn etäisyyden sisällä) oleva alue siitä etäisyydestä kauempana oleva alue Puskurointi voidaan tehdä pisteille, viivoille sekä alueille. Puskurointi voi olla vakioetäisyydellä tai vaihtelevalla etäisyydellä molemmanpuoleinen tai yksipuoleinen yhteinen tai erillinen eri piirteille Puskuroinnin tarkoitus voi olla esimerkiksi suojelualueiden määrittäminen jokien ja järvien ympärille rakennuskielto-alueiden määrittäminen valtateiden läheisyyteen alueiden määrittäminen voimalinjojen läheisyyteen jotka täytyy puhdistaa puustosta …

Päällekkäisyysanalyysi Päällekkäisyysanalyysi voidaan tehdä kahden alueita kuvaavan karttatason välillä alueita kuvaavan ja joko pisteitä tai viivoja kuvaavan karttatason välillä Spatial Join – analyysi lisää sisääntulo-tason ominaisuustieto-taulukkoon sarakkeen jossa on tieto siitä, mille alueelle kukin piirre osuu. Jos sisääntulo-taso koostuu viivoista (tai alueista), viivat (tai alueet) jotka kulkevat läpi useamman overlay-alueen, jaetaan alueiden mukaan osiksi. Päällekkäisyysanalyysin tapoja ovat: unioni (sisältää molemman lähtötason alueet; toimii vain alueiden välillä) yhteinen osa symmetrinen erotus (edellisen komplementti; toimii vain alueiden välillä) identtisyys (säilyttää sisääntulo-tason geometrisesti muuttumattomana)

Päällekkäisyysanalyysi: pirstaleet Jos alueiden rajat eivät täsmää aivan tarkkaan, päällekkäisyysanalyysi voi aiheuttaa pirstaleiden syntymisen. Pirstaleet voivat syntyä myös muista syistä, esim. digitoinnin tai aineiston tulkinnan epätarkkuudesta. Pirstaleet voidaan päällekkäisyysanalyysin yhteydessä välttää käyttämällä ns. cluster tolerance määrittelyä. Tällöin määritetyn toleranssin sisälle jäävät viivat tai pisteet yhdistetään. Jos käytetään liian isoa toleranssia, pienemmät piirteet voivat hävitä kokonaan.

Etäisyyksien ja keskipisteiden laskeminen Euklidisia etäisyyksiä voidaan laskea esim. pisteiden välillä tai pisteiden ja viivojen välillä. ArcGIS:issä mahdollista esim. laskea etäisyyksiä lähimpään pisteeseen tai viivaan niin että etäisyys ilmaantuu ominaisuustaulukon uuteen sarakkeeseen (ns. spatial join) Alueen tai pistejoukon keskipiste voidaan laskea hyvin monella tavalla, esim.: kulmapisteiden keskiarvo massakeskipiste minimum bounding rectangle – keskipiste minimum bounding circle – keskipiste suurin sisältyvä suorakulmio – keskipiste suurin sisältyvä ympyrä – keskipiste minimietäisyys-keskipiste

Rakenne-analyysi Rakenne-analyysin tarkoitus on tutkia, ovatko piirteet jakautuneet tilassa satunnaisesti tai kuinka hajautuneet / ryhmittyneet piirteet ovat. Lähin naapuri (NN) – analyysi: - lähimpien naapureiden välinen keskimääräinen etäisyys - vastaava etäisyys jos piirteet olisivat jakautuneet satunnaisesti tietyn jakauman mukaisesti Jos R > 1, piirteet ovat enemmän hajalla kuin mitä käytetty jakauma edellyttäisi Jos R < 1, piirteet muodostavat ryhmiä NN (nearest neighbor) – etäisyyden perusteella voidaan laskea myös ns. z-score

*NN-analyysi NN-analyysia varten tarvitaan keskimääräinen lähimpien naapureiden välinen etäisyys tietyn referenssijakautuman tapauksessa. Yleensä referenssijakautuma on tasainen jakautuma eli sen mukaan pisteet oletetaan sijaitsevan spatiaalisesti täysin satunnaisesti. Osoittautuu että täysin satunnaisen sijainnin tapauksessa etäisyys lähimpien naapureiden välillä jakautuu Poissonin jakautuman mukaisesti: Keskiarvo tässä tapauksessa on: Tässä m on pisteiden keskimääräinen tiheys.

Spatiaalinen autokorrelaatio: Moran:in I NN-analyysi ottaa huomioon pelkästään aineiston spatiaalisen sijainnin eikä piirteiden ominaisuuksia. Spatiaalinen autokorrelaatio sen sijaan mittaa, ovatko esim. pisteet ryhmittyneet jonkun ominaisuuden mukaan. Yleisin spatiaalisen autokorrelaation mitta on Moran:in I: Tässä käsittää painokertoimet, jotka yleensä valitaan käänteisesti suhteessa pisteiden i ja j etäisyyteen ( ) Jos pisteiden arvo ei korreloi niiden sijainnin kanssa, I:n arvo on: Jos lähellä olevilla pisteillä on samanlainen arvo, I on suurempi kuin yllä oleva luku. Jos taas lähellä sijaitsevien pisteiden arvot poikkeavat toisistaan keskimääräistä enemmän, I on pienempi kuin yllä oleva luku.

Moran:in I Moran:in I voidaan esittää myös normalisoituna käyttäen z-skaalaa. Moran:in I voidaan laskea pisteiden lisäksi esim. alueille. Tällöin painokertoimen arvona voidaan käyttää arvoa ’1’ jos kyseessä ovat vierekkäiset alueet ja arvoa ’0’ jos alueet eivät ole vierekkäin. Moran:in I mitasta on kehitetty myös paikallinen versio: Local Indocator of Spatial Association (LISA). Se kertoo, onko kyseinen piirre (piste tai alue) vierekkäin samanlaista arvoa omaavien alueiden kanssa tai poikkeavaa arvoa omaavien alueiden kanssa.

G-mitta klusteroitumisen tason määrittelyyn Moran:in I kertoo, sijaitsevatko arvoltaan samanlaiset pisteet lähekkäin. Se ei kerro ovatko näiden lähekkäin sijaitsevien pisteiden arvot suuria tai pieniä. Asiaa voidaan tutkia G-mitan avulla: d on etäisyys jonka rajoissa G-mittaa lasketaan (eli maksimietäisyys i:n ja j:n välillä). Jos klusterointia ei esiinny, G-mitan suuri / pieni arvo kertoo että arvoltaan suuret / pieneet pisteet tai alueet ovat klusteroituneet. Myös G-mitasta on kehitetty paikallinen versio (local G-statistic). Jos sen arvo on jossain kohdassa suuri / pieni, puhutaan ns. hot / cold spot - alueesta

Rakenne-analyysin (pattern analysis) sovellukset Rakenne-analyysin oleellisempia sovelluksia ovat esimerkiksi rikostilastojen analyysi terveystiedon analyysi tuhoeläinten havaintojen analyysi kiinteistöhintojen analyysi … Spatiaalisen autokorrelaation avulla voidaan seurata ilmiöiden spatiaalisen jakautuman muutoksia Spatiaalinen autokorrelaatio on tärkeä tilastollisten testien soveltamisessa. Monet tilastolliset testit edellyttävät että aineisto on korreloimaton. Jos edellä esitetyt mitat tuovat ilmi aineiston voimakkaan korrelaation, tällaisten testien käyttö ei ole oikeutettu

Piirteiden manipulointi Piirteitä voidaan manipuloida: Sulauttamalla yhteen samaa ominaisuusarvoa omaavat vierekkäiset alueet (dissolve) Leikkaamalla tietystä karttatasosta vain tietylle rajatulle alueelle jäävät piirteet (clip) Yhdistämällä karttatasoja (append) Valikoimalla uuteen karttatasoon vain tietyt kyselyllä valikoidut piirteet (select) Poistamalla karttatasosta tietyt kyselyllä valikoidut piirteet (eliminate) Korvaamalla tietylle rajatulle alueelle jäävät piirteet toisen karttatason piirteillä (update) Poistamalla tietylle rajatulle alueelle jäävät piirteet karttatasosta (erase) Halkaisemalla karttataso kahteen tai useampaan karttatasoon (split)

Showing 1 - 18 of 18 items Details

Name: 
Luento3_Tarkastelu
Author: 
Tarmo Lipping
Company: 
Tampereen teknillinen ...
Description: 
Luento 3 Paikkatietoaineiston tarkastelu ja analyysi
Tags: 
voidaan | esim | piirteet | aineiston | analyysi | välillä | arvo | pisteiden
Created: 
9/1/2008 9:58:24 AM
Slides: 
18
Views: 
16
Downloads: 
0
Rating: 
0


> Comment



Share this presentation
|

Comments

Share this presentation:

|
Sitemap