Wikipedia:Projekt Kustvatten/Mappings
Föreslagen arbetsgång
[redigera | redigera wikitext]Detta projekt kommer fokusera på den strukturerade miljöinformationen om statusklassningen för Sveriges kustvattenförekomster som återfinns och samlas hos EIONET . För att göra informationen mer förståelig ska ytterligare information inkluderas i de slutgiltiga wikidataobjekten. Den tänkta arbetsgången för att inkludera nyttig och läsbar miljöinformation om Sveriges kustvattenförekomster på Wikidata är
- Använd Quick statements (QS) för att skapa 654 kustvattenförekomster på Wikidata (WD). Inkludera i denna process EUCD-numret för kustvattenförekomsten. (Steg 1)
- Använd Python-script uppsatta under WFD-data till Wkidata 2016 för att fylla på WD-objekten med miljöinformation så som statusklassning och signifikant miljöpåverkan. Denna process använder strukturerad data i xml- och gml-format för Sveriges vattendistrikt på EIONET. (Steg 2)
- Använd databasen SVAR för att göra ett uttag av spatial information för kustvattenförekomsterna (kommuntillhörighet, länstillhörighet, etc).
- Använd QS för att fylla på Wikidataobjekten med den spatiala informationen från databasen SVAR. (Steg 3)
Egenskaper
[redigera | redigera wikitext]Tack vare arbetet i WFD-data till Wikidata 2016 skapades det en rad nya och användbara Wikidata-egenskaper för denna typ av miljödata. Projektet resonerade kring hur man skulle mappa WFD-rapporteringens data till Wikidata och de principer som lades fram återanvänds i detta projekt. Stöd tas i hur den resulterande mappningen ser ut för exemplet Orlången Q3424558 vilken noteras som ett användbart exempel. De egenskaper som dokumenteras i kustvattenförekomsternas wikidataobjekt, dess tillhörande Wikidata-property, källa och motsvarande egenskap i WFD-rapporteringen är
Egenskap | Wikidata statement | Källa | Egenskap i WFD-rapporteringen | Steg |
---|---|---|---|---|
Namn | Label | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) ex http://cdr.eionet.europa.eu/se/eu/wfd2016/districts/se3/envwntytq/SWB_SE_20170329.xml (eionet) |
wfdgml:nameText | 1 |
EUCD-nummer | Vattenförekomst ID (P2856) Qualifier är en sträng. | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) ex http://cdr.eionet.europa.eu/se/eu/wfd2016/districts/se3/envwntytq/SWB_SE_20170329.xml (eionet) |
euSurfaceWaterBodyCode | 1 |
Att det är en kustvattenförekomst | Instance of (P31) coastal water body (Q16615865) | Stated in (P248) WFD-2016 reporting-Sweden och Reference url (P854) ex http://cdr.eionet.europa.eu/se/eu/wfd2016/districts/se3/envwntytq/SWB_SE_20170329.xml (eionet) | surfaceWaterBodyCategory | 1 |
Ekologisk statusklassning | WFD Ecological status (P4002). Qualifier är en instance of WFD Ecological status category (Q30092063) som t.ex WFD Ecological status: Poor status (Q30092163) | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) ex http://cdr.eionet.europa.eu/se/eu/wfd2016/districts/se3/envwntytq/SWB_SE_20170329.xml |
swEcologicalStatusOrPotentialValue | 2 |
Kemisk statusklassning . | WFD Chemical status (P4202). Qualifier är en instance of WFD Chemical status category (Q30893493) som t.ex WFD Chemical status: Poor status (Q30899434) | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) ex http://cdr.eionet.europa.eu/se/eu/wfd2016/districts/se3/envwntytq/SWB_SE_20170329.xml (eionet) |
2 | |
Signifikant miljöpåverkan | Significant environmental impact (P3643). Qualifier är en subclass av environmental issue (Q2144359) som nutriernt pollution (Q12203192) och/eller chemical pollution (Q28854976) | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) ex http://cdr.eionet.europa.eu/se/eu/wfd2016/districts/se3/envwntytq/SWB_SE_20170329.xml |
swSignificantImpactType | 2 |
Area | Area (P2046). Qualifier är en sträng. | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) http://cdr.eionet.europa.eu/se/eu/wfd2016/spatial/envwdqi7a/SurfaceWaterBody_SE_20160322.gml (SVAR) |
wfdgml:sizeValue | 2 |
Basin country | Basin country (P205). Qualifier är t.ex Sverige (Q34). | Tas ej med | 2 | |
Land | Country (P17). Qualifier är Sverige (Q34) | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) Ex http://cdr.eionet.europa.eu/se/eu/wfd2016/spatial/envwdqi7a/SurfaceWaterBody_SE_20160322.gml (SVAR) |
3 | |
Kommuntillhörighet | Inom administrativt område (P131) Qualifier är en instance of Sveriges kommuner (Q127448) t.ex Huddinge kommun (Q492575) | Reference url (P854) Lantmäteriet. Denna källa skulle man kunna skapa ett eget objekt för. | 3 | |
Länstillhörighet | Tas ej med då Kommun redan finns i länet. | Tas ej med då Kommun redan finns i länet. | 3 | |
Djup | Vertical depth (P4511). Qualifier är sträng. | Tas ej med | 3 | |
Vilket distrikt den tillhör | Part of (P361) ett vattendistrikt. Qualifier är instance of river basin district (Q132017) som t.ex Bottenvikens vattendistrikt, Bottenhavets vattendistrikt, Norra Östersjöns vattendistrikt, Södra Östersjöns vattendistrikt, Västerhavets vattendistrikt) | Stated in (P248) WFD-2016 reporting-Sweden.
Reference url (P854) Qualifyer är http://cdr.eionet.europa.eu/se/eu/wfd2016/spatial/envwdqi7a/SurfaceWaterBody_SE_20160322.gml (SVAR) |
3 | |
Objekt i VISS | described at URL (P973) Qualifier är ex https://viss.lansstyrelsen.se/waters.aspx?waterMSCD=WA44654285 | |||
Vilket projekt som givit upphov till objektet | Maintained by WikiProject (P6104) Qualifier är Wikipedia: Projekt Kustvatten Q63105775 | |||
Position | Qualifier är en länk som tar en till exempel till https://tools.wmflabs.org/geohack/geohack.php?params=65.521854067906_N_22.659133246902_E_globe:earth&language=en. |
Som man kan se har djupet ingen källa fastställd ännu. Anledningen är att det inte finns ett enhetligt och exakt sätt att finna och ange denna data för alla kustvattenförekomster, det ingår heller inte i detta projekt att skapa en sådan enhetlig lista.
Användbart material
[redigera | redigera wikitext]Det finns redan två objekt som är kustvattenförekomster på Wikidata. Dessa är
- Kyrkfjärden: Q10551453. Kyrkfjärden på VISS
- Askeröfjorden: Q16497241. Askeröfjorden på VISS
Det exempelobjekt som togs upp i WFD-data till Wkidata 2016 är
- Orlången: Q3424558
Testobjekt för detta projekt
Utmaningar
[redigera | redigera wikitext]Som redan konstaterats känner gemene man oftast till ett vatten vid kusten som till exempel en fjord, en vik eller ett sund. I vissa fall överlappar det vi kallar en kustvattenförekomst med det sätt som gemene man skulle avgränsa som ett visst kustvatten. Ett exempel på det är Kyrkfjärden Q10551453. Men även här kan det råda viss förvirring då det i skrivande stund finns 2 olika svenska Kyrkfjärden på Wikipedia. (I detta fall är det dock Kyrkfjärden, Stora Värtan som menas.) Ett exempel där flera mindre kustvattenförekomster tillsammans utgör det gemene man känner till som en känd vik är Bråviken som enligt Vattendirektivet delas upp i kustvattenförekomsterna Inre Bråviken, Mellarsta Bråviken och Yttre Bråviken. De fall där flera kustvattenförekomster utgör ett större mer välkänt område skapar problem när det kommer till notability-kriteriet på Wikipedia och dess artiklar. Det blir kanske inte vettigt att skapa artiklar om dessa tre enskilda kustvattenförekomster. De fall där kustvattenförekomsten helt och hållet överlappar med ett känt kustvatten men som inte redan är uppmärkt i Wikidata som en kustvattenförekomst bör kanske ändå få ett eget objekt på Wikidata då konceptet kustvattenförekomst är skilt från konceptet fjord, vik eller liknande.
Skillnad på vatten och kustvattenförekomst
[redigera | redigera wikitext](Föranlett av ett antal sammanslagningar av objekt på Wikidata.)
För att få mest nytta av dataset som importeras till Wikidata är det viktigt att göra skillnad på administrativt definierade entiteter och annat som definieras av geografi, folkvilja, natur eller andra skäl. Specifikt i det här fallet när det gäller kustvattenförekomster behöver de hållas skilda från motsvarande objekt i den fysiska geografin (vikar, floder, stränder och liknande), även om geografi och utbredning till stor del är överlappande. Då kustvattenförekomster används i forskning, vattenflödesmätningar och andra sammanhang ska de inte slås ihop med vattenområden som har liknande namn. Se till exempel Norrtäljevikens kustvattenförekomst (Q63438880) som är den administrativa ytan definierad av SMHI, och Norrtäljeviken (Q10602971) som är den geografiska viken. Vi utnyttjar här Wikidatas flexibilitet, som gör det möjligt att modellera olika begrepp på en väldigt granulär nivå, på ett sätt som inte vore praktiskt på Wikipedia.Axel Pettersson (WMSE) (diskussion) 3 maj 2019 kl. 15.57 (Signatur tillagd i efterhand.)
- De är inte bara överlappande. De är i de flesta fall identiska. Det är fullkomligt onödigt att ha olika poster för kustvattenförekomst (Q16615865) och geografiska objekt lika lite som vi har olika poster för SCB:s tätortsdefinitioner och tätorter. Inte heller har vi skilda poster för sjöar och ytvattenförekomster. Om inget revolutionerande framkommer kommer jag nästa vecka att slå ihop samtliga kustvattenförekomster med deras geografiska objekt. Dessutom kommer jag att ta bort beskriven på URL (P973) eftersom den är redundant med vattenförekomst-ID (P2856) /ℇsquilo 3 maj 2019 kl. 16.13 (CEST)
- När det gäller de fall där kustvattenförekomsterna är mer uppdelade än de geografiska objekten (som i fallet med Bråviken ovan) så kan de få vara kvar, men då behöver de länkas ihop med har del(ar) (P527) och del av (P361). Det görs även med geografiska objekt (som Frykensjöarna (Q1471113) som består av Övre Fryken (Q16879501), Mellan-Fryken (Q16879499) och Nedre Fryken (Q2060422)). /ℇsquilo 3 maj 2019 kl. 17.41 (CEST)
- Indelningen av kustvattenförekomster skiljer sig ibland från vad gemene man beskriver som sammanhållna eller enhetliga kustvatten eftersom kriterierna bland annat har att göra med Vattendirekrivets definition och vattenförvaltningens behov kring kustvattenförekomsterna. Se 2012 års SVAR rapport och 2016 års SVAR rapport och vad som föranleder skillnader där emellan. Oftast finns en mer eller mindre stark koppling till områdena som definieras av gemene man eftersom kriterier som vattenförvaltning använder för att kategorisera och dela in vatten delvis överlappar med andra indelningar av kustvatten. Kustvattenförekomsterna är entiteter som har en rad egenskaper vilka skiljer sig från egenskaperna hos de geografiska eller naturliga förekomsterna av kustvatten/fjordar/vikar. Kustvattenförekomsterna kan uppkomma, tas bort och förändras i 6-års cykler. De skiljer sig med sina egenskaper ungefär som geografiska objekt kan skilja sig från naturreservat i samma område. För naturreservaten är min förståelse att man vill separera dessa objekt från de geografiska områdena av samma anledning; de beskriver olika saker vars egenskaper inte stämmer överens. Och när det kommer till sjöarna och sjövattenförekomsterna så tror jag det är minst två saker man måste överväga. Jag är en expert på kustvatten, men inte på sjövatten och sjövattenförekomster så mina argument väger kanske inte lika tungt här, men here goes. 1) Kan det vara så att sjöar oftare sammanfaller med sjövattenförekomster tack vare en tydligare topografisk indelning i sjöar? (Jag vet inte ens om det är så att de faktiskt sammanfaller oftare.) Fjordars trösklar, uppgrundningar, djup mm är inte i närheten lika uppenbart och utbytet mellan bassängerna beror dessutom på bland annat densitetsskiktning och kustens/havets cirkulation i ett mycket mer ihopkopplat system där det inte ens finns något som är ”uppströms”! Väldigt jobbigt. Det betyder alltså att man inte kan se lika tydligt vad som är en bassäng jämfört med vad som är en sjö. Det skulle (i min åsikt som inte väger lika tungt här, jag är relativt ny till wikidata och sjövattenförekomster) kunna motivera att man har sjöar och sjövattenförekomster sammanslagna, men inte kustvattenförkomster och kustvatten. 2) Att objekten är ihopslagna behöver inte betyda att det är den bästa lösningen wikidata-mässigt. Det kan hända att det inte är lika enkelt att mappa infon om kustvattenförekomster till kustvatten som det är att mappa sjövattenförekomster till sjöar. Syftet med Vattendirektivet är att man ska ha koll på vattenkvalitén och kunna åtgärda det. Och det mappar inte alltid så enkelt mot vad folk i allmänhet vet om sina vatten. Josefina Algotsson (diskussion) 24 maj 2019 kl. 13.55 (CEST)
- Recap
- Nu har jag i en vecka slagit ihop kustvattenförekomsternas objekt med geografiska objekt (de flesta av dem importerade från GeoNames). Jag har gått igenom kustvattenförekomsterna från norr till söder, kollat ifall något annat objekt med samma eller snarlikt namn har koordinater som pekar på samma vattenområde, kollat i VISS att kustvattenförekomstens utbredning stämmer överens med det geografiska objektet och därefter slagit ihop dem. Det har fungerat jättebra för hela Norrlandskusten från Haparandafjärdens kustvattenförekomst (Q61779814) ner till Ortalavikens kustvattenförekomst (Q61779563). I Stockholms skärgård däremot är det bara ungefär en tredjedel av kustvattenförekomsterna som stämmer precis överens med ett geografiskt objekt. Den geografiska utbredningen av en "fjärd" är ofta ganska luddig (ligger den här ön i fjärden eller slutar fjärden vid ön och vad är det i så fall för vatten på andra sidan ön? Är den här viken en del aj den intilliggande fjärden eller är den ett eget vatten?) vilket gör att ytterligare en tredjedel har kunnat kopplas ihop med motsvarande geografiska objekt trots att utbredningen inte är 100% överensstämmande. Den resterande tredjedelen av kustvattenförekomsterna inte alls stämmer överens med något geografiskt objekt. Det verkar som om SMHI mitt i indelningen har infört ett tak på antalet kustvattenförekomster och därför slagit ihop olika vattenkroppar som Dävelsöfjärden (Q32232559) och Möja söderfjärd (Q10593492) i samma kustvattenförekomst. Det enligt min mening märkligaste är att Ådskärsfjärden (Q49114253) inte är en egen kustvattenförekomst utan har delats på mitten mellan Vidingefjärdens kustvattenförekomst (Q61779807) och Granhamnsfjärdens kustvattenförekomst (Q61779853). Samma sak med Kudoxafjärden (Q32270726).
- Det är en stor besvikelse. VISS har varit extremt användbart för att skapa artiklar om alla Sveriges sjöar och fylla dem med data och har potential att vara lika användbar för vattendrag. Den bitvis märkliga indelningen av kustvattenförekomster gör dock att VISS inte alls är lika användbar för kustvatten. Även om jag återställer alla ändringar jag har gjort så kvarstår fortfarande problemet att vi inte kan hämta data som koordinater, area, föroreningar och ekologisk status till våra artiklar om kustens fjärdar och sund från VISS. Det tycker jag är oerhört synd.
- Feedback
- Egenskaperna land (P17), inom det administrativa området (P131) och geografiska koordinater (P625) ska inte har tillägget tidpunkt (P585). Egenskapen area (P2046) kan ha det om man förväntar sig att den förändras med tiden (till exempel genom landhöjning).
- Värdena för area (P2046) behöver avrundas till hela kvadratmeter innan de importeras. Det inger ingen trovärdighet att arean för en fjärd är specificerad ner till kvadratmikrometern. Det gäller till viss del även värdena för geografiska koordinater (P625).
- Om det inte är meningen att kustvattenförekomster ska vara geografiskt objekt (Q618123) objekt så är de i så fall administrativ territoriell enhet (Q56061). Det innebär att inom det administrativa området (P131) ska användas i stället för del av (P361).
- Dessutom finns det information i VISS som SmhiSwbBot inte har importerat till Wikidata, men som jag har importerat för hand när jag slagit ihop objekt. Det är främst gränsar till (P47) och tillflöde (P200) jag tänker på.
- /ℇsquilo 18 maj 2019 kl. 10.15 (CEST)
- Tack för denna feedback. Den är användbar men jag har några saker jag vill diskutera om den. Eftersom utformningen av kustvattenförekomsterna kan förändras utan att byta identitet (EUCD/MSCD-nummer) kan arean, som du påpekar, ha en tidpunkt. Koordinaterna vi använt är en beräknad (med GIS) mittpunkt av kustvattenförekomsternas polygoner, så därför har jag tyckt det är logiskt att om arean får ändras och ha en tidpunkt, så får den geografiska koordinaten också ha det eftersom mittpunkten kommer förskjutas om kustvattenförekomstens utsträckning ändras. Men att jämställa mittpunkten av polygonen och egenskapen för den geografiska koordinaten i wikidata blir kanske för stringent (?). Arean är den beräknade arean av kustvattenförekomsternas polygoner i SVAR-databasen och var inte avrundad innan importen. Jag håller med dig om att man kanske borde ha avrundat denna. Men samtidigt får jag rätta dig, en kustvattenförekomst är en kustvattenförekomst, inte en fjord eller vik. Den är definierad på ett stringent sätt och därför blir arean också definierad stringent. Du har rätt i att man bör använda “inom administrativt område”. När jag tittar på det igen är det helt klart logiskt att göra så. När det kommer till tidsangivelse för “land” och “tillhör administrativt område” tänker jag att med tanke på att områdena dras om och kan försvinna är det bra med en tidsangivelse. Kanske är det bättre att ha från- och till år istället? Josefina Algotsson (diskussion) 24 maj 2019 kl. 14.05 (CEST)
- Alicia, Axel och jag har tänkt vidare på saken och tror detta kan bli snyggt.
- Ta bort tidsangivelsen för geografiska koordinater, land och tillhör administrativt område. Behövs kanske inte om Esquilo redan tagit bort detta för alla kvf?
- Lägga till egenskap för inception date P571. Det förtydligar vilken/vilka förvaltningscykler kustvattenförekomsten används i. Man behöver ta fram underlag för att kunna ange det eftersom några kvf är nya i denna cykel och många bör ha ett tidigare datum.
- Lägga till located on terrain feature P706 för några kustvattenförekomster. Detta kan fungera som exempel på hur man skulle kunna lösa problemet att koppla kustvattenförekomsterna till de geografiska objekten utan att slå ihop dem. Det gör kopplingen kustvattenförekomst-->geografiskt objekt, men inte kopplingen åt andra hållet. Finns en spegel-egenskap för detta? En sådan lösning skulle funka fint för t.ex. Bråvikens kustvattenförekomster. Alla Bråvikens kustvattenförekomster skulle kunna få statement located on terrain feature Bråviken.
- Ändra point in time-qualifier för area till från-qualifier. Här behövs också underlag för att ange detta. Om arean får ett uppdaterat värde sätts ett slutdatum på den gamla arean, och ett nytt area-värde med endast från-datum.
- Avrunda arean till hela kvadratmeter.
- Eftersom projektet är i sitt slutskede är det inte säkert att vi från SMHIs sida hinner genomföra dessa ändringar, men man skulle kunna ha det som rekomendation till den som vill editera eller som minnesanteckning när arbetet tas upp igen. Josefina Algotsson (diskussion) 29 maj 2019 kl. 08.24 (CEST)
- tidpunkt (P585) bör användas antingen för händelser, eller som i det här fallet för samplat data (vi kollade 2016 och då var det så här). Därför passar den jättebra som tillägg till signifikant miljöpåverkan (P3643), WFD Ekologisk status (P4002) och WFD Kemisk status (P4202). För ändringar genomförs vid en bestämd tidpunkt passar startdatum (P580) och slutdatum (P582) bättre. Vilket som passar bäst för geografiska koordinater (P625) beror på hur den ändras.
- datum för grundande eller skapande (P571) för kustvatten är en bra idé. Det förtydligar ännu mer att det rör sig om ett administrativt område och inte om ett geografiskt objekt. Samma sak görs med t.ex. naturskyddsområden.
- placerad på/i landform (P706) tror jag det är väldigt få kustvattenförekomster som kan ha användning för. Prästmarens kustvattenförekomst (Q61779444) är placerad på/i landform (P706) Vindö (Q10715730) till exempel. Vatten brukar inte räknas som "terrain feature" och därför används ligger i eller vid vattenområde (P206) i stället.
- Om man vill beskriva vilka geografiska objekt som ingår i en kustvattenförekomst så är "det rätta" sättet att använda har del(ar) (P527) (Strömmens kustvattenförekomst (Q61779232) är ett bra exempel). Det blir dock besvärligt när det geografiska objektet antingen är större än kustvattenförekomsten (som Bråviken) eller delas mellan två olika kustvattenförekomster (som Nassafjärden). Om man bara vill koppla ihop objektet med samma namn så funkar uppkallad efter (P138).
- Det viktigaste, enligt min mening, är att hitta eller skapa en egenskap som kan användas i geografiska objekt (oavsett storlek) för att peka ut det objekt där miljödatat finns. När vi robotskapade artiklar om sjöar stötte vi inte på det problemet eftersom ytvattenförekomsten sammanföll med det geografiska objektet för alla sjöar utom de allra största (som vi redan hade artiklar om). Men för vattendrag kommer vi också att behöva en sådan egenskap.
- /ℇsquilo 29 maj 2019 kl. 09.13 (CEST)
- Alicia, Axel och jag har tänkt vidare på saken och tror detta kan bli snyggt.
@Josefina Algotsson: Jo, en sak till. Jag tror att Användare:SmhiSwbBot behöver se över sin lista över kustvattenförekomster på Wikidata eftersom den i några fall gör ändringar i fel objekt, t.ex. Kyrkfjärden (Q10551453) i stället för Kyrkfjärdens kustvattenförekomst (Q61685136). Alla kustvattenförekomster har index på minst Q61600000 eller högre. Äldre objekt är geografiska objekt. /ℇsquilo 3 juni 2019 kl. 17.29 (CEST)
- @Esquilo: Tackar, vi ska se över detta.