Hoppa till innehållet

Wikipediadiskussion:Projekt USA

Sidans innehåll stöds inte på andra språk.
Från Wikipedia

Är det inte lite märkligt att i Wikipedia, som respekterar upphovsrätten, utlova lösenord till upphovsrättsligt skyddade verk?

Hans Iwan Bratt 30 maj 2006 kl.08.17 (CEST)

Det är inte Wikipedia, det är Användare:Brallan; och det är inte märkligt, det är minst sagt dumt. —CÆSAR 30 maj 2006 kl.08.24 (CEST)

Stubbmallar

[redigera wikitext]

Behövs det så många olika stubsorter för det här projektet. Om Mall:USA-stub och Mall:geografistub-USA används till att börja med så kan de delas upp ytterligare i lämpliga ämnen först när kategorierna blir för stora.--82.212.68.183 30 maj 2006 kl.11.44 (CEST)


Skörda data ur artiklar

[redigera wikitext]

Jag har lite smått börjat koda i AWB och har börjat tanka ur data ur artiklar, bla annat mallparametrar, koordinater, bilder och kategorier. Det är med andra ord möjligt att släppa AWB lös i en kategori och få ut en CSV-fil med vad artiklarna innehåller. Det kan vara mycket smidigt om man ska robotskapa artiklar eller skapa geoboxar. För att det här ska vara användbart så måste man ha behörighet att köra AWB på den språkversionen som har de mest utvecklade artiklarna (i detta fall enwiki). Jag är inte klar med skriptet. Det kommer att ta någon vecka av min fritid att fixa till det, och mycket fritid har jag inte nu då semestern är slut och jag har 5000 franska kommuner kvar att rulla ut.

Jag har också en metod där man använder catscan och ett kalkylprogram (Excel) för att leta upp commonslänkar till artiklar som saknar sådana. Svwiki har idag 550 artiklar över USA:s "städer" som saknar commonscat. Jag provkörde lite skript igår och kom fram till att 537 av dem har kategori på commons som går att länka till. Dessa kan med andra ord läggas in med robot sist i artikeln (ovanför kategorierna). Det går även att göra en noggrannare analys och ta reda på vilka artiklar som har rubriken "Externa länkar" och referens-tagg och skapa rubrikerna om de saknas, men detta ser jag som överkurs.

Finns det intresse för att använda AWB för att tömma artiklar på data så kan jag lägga ner lite tid på att knåpa ihop ett skript som jag kan publicera någon gång i september. Nasko (disk) 4 augusti 2012 kl. 22.58 (CEST)[svara]

Om vi nu ska tala om "skapandet" av artiklar här så vet jag inte om det finns ngt omedelbart behov just nu. Jag själv klarar utmärkt att tömma enstaka eller alla mallar på ett projekt på data om det skulle behövas. Det har jag gjort för huvudorter här precis och har sedan tidigare gjort för att hjälpa till att identifiera Countys och det görs löpande för att identifiera tidszoner. (I de källor jag har så identifieras vilka countys staden ligger i med hjälp av en länkar som bygger på countyts fips-county-kod, vilket jag sedan använder för att identifiera vilken artikel som har motsvarande fips-kod. När sedan tidszonen läggs in så bygger det på den första county-länken och innehållet i den countyartikelns parametrar för tidszon.)
Idag så "skapas" alla artiklar i formatet "X, Y" och roboten letar efter sidor på enwp med samma format. Om det finns en sådan sida (om så bara en omdirigering) så skapas en iw-länk dit. Om det också finns en "commons:Category:X, Y" så läggs en länk till commons under externa länkar. Alla artiklar får en källrubrik med references/ och en rubrik med externa länkar och en individuellt anpassad länk till Quickfacts. Det är dessutom min primära källa för artikeln, även om jag även går till andra sidor för få källor som är lättare att arkivera. (Hellre en arkivering per delstat än en arkivering per stad.)
Det jag hade tänkt göra i ett senare skede är att mjölka enwp på sådan data som "Stadsvapen/flagga", postkod och riktnummer. När det gäller stadsvapen/flagga så är de flesta sådana uppladdade lokalt på enwp, så där måste sökningen ske i två steg. Först hämta namnen på enwp, och sedan kolla på commons, om en fil med det namnet finns där.
-- Lavallen 5 augusti 2012 kl. 08.23 (CEST)[svara]
Det tekniska vet jag inte något om men ett tips är att alla städer i USA heter stad, delstat på commons. --NERIUM (disk) 5 augusti 2012 kl. 09.49 (CEST)[svara]
Ett trassel kan även bokstäver med udda diakritiska tecken vara. Quickfacts använder inte sådana tecken i sin databas, vilket nog har sina randiga orsaker. -- Lavallen 5 augusti 2012 kl. 11.18 (CEST)[svara]
Ingen brådska med att skörda parametrar. Jag hade mest tänkt använda metoden för att göra korsreferenser. Det är aldrig fel att sprida kunskap så fler kan delta. Det där med att kolla om en bild finns på commons har jag löst utan läsbehörighet på Commons. Om man använder uttrycket:
{{#if: {{filepath:Exempelfil.jpg}} | '''Hurra! Filen finns på Commons.''' | '''Attans! Lokalt uppladdad på annat projekt.''' }}
Test om filen Kalvestaaircrash.jpg finns på Commons ger resultatet: Attans! Lokalt uppladdad på annat projekt.
Medan filen Schwörstadt - Katholische Kirche5.jpg ger svaret: Hurra! Filen finns på Commons.
Jag testade att göra en lista med över 50 000 filer på en av mina undersidor på detta sättet, och svaret tog bara några sekunder (omkring 5% av filerna var lokalt uppladdade på frwiki). Man behöver inget botkonto eller programmeringskunskaper för att göra kollen (bortsett från god allmän datavana). Tänkte bara sprida lite kunskap med detta sidospår. Nasko (disk) 5 augusti 2012 kl. 13.14 (CEST)[svara]
Det där sista med bilderna låter riktigt smart och intressant. För då borde man kunna köra det resultat och kolla via iwlänkar om den svenska motsvarigheten till artikeln har någon bild? Då skulle det bli "Hurra, vi kan illustrera en bild på svenskspråkiga wp för amerikanerna (eller andra) har haft vett att fixa en fri bild lägga den på commons!" Det är något som jag skulle vara mycket intresserad av, så många gånger som man klickat på en iwlänk och sen hamnat i en artikel med en lokalt uppladdad bild! /Hangsna (disk) 11 augusti 2012 kl. 19.34 (CEST)[svara]
Hmm! Det kanske skulle gå att knåpa ihop ett skript så går igenom artiklar med illustrationsbehov och kollar på andra språkversioner om det finns bilder. Det skulle kunna vara ett upplägg för en tävling där bildlänkar från olika språkversioner listas i en tabell. Jag har inte tid med ett sådant projekt nu, men vi behöver inte stressa. Nu är vi inne på fel sida och diskuterar då denna sida handlar om USA-relaterade artiklar. Jag föreslår att diskussionen avslutas så diskussionssidan kan användas till att diskutera rätt saker. Den som vill kan arkivera eller flytta inläggen till min diskussionssida så den inte smutsar ner projektsidan. Nasko (disk) 11 augusti 2012 kl. 23.18 (CEST)[svara]

Projekt USA/Städer

[redigera wikitext]

Istället för

Andalusia är en stad (city) i Covington County, Alabama. föreslår jag
Andalusia är en stad (city) i Covington County i delstaten Alabama, USA. (från Wikipedia:Projekt USA/Städer/Andalusia, Alabama). Mera brödtext skulle kunna vara Andalusia är huvudort i Covington County (vilket den inte är) och då skulle man kunna använda listorna i USA:s countyn#Antal countyn per delstat. Inte mycket till brödtext kanske men det finns 3140 artiklar som den gäller. --NERIUM (disk) 4 augusti 2012 kl. 17.26 (CEST)[svara]
Hur man ska kunna använda: USA:s countyn#Antal countyn per delstat får jag fundera på. Det går inte använda rakt uppochner, utan måste bearbetas.
Finns en kategori: en:Category:County seats of the United States, men den säger inget om vilket County som staden är huvudort i. I många fall ligger en stad i flera County's vilket rör till det.
(Och Andalusia är faktiskt huvudort i Covington). -- Lavallen 4 augusti 2012 kl. 17.43 (CEST)[svara]
En möjlighet som jag tror är mer lovande, är att skapa ett register utifrån alla County-mallar. Det förutsätter att alla County-mallar har huvudortern rätt ifylld förstås.
Vissa Countys har mer än en huvudort, eller hur är det? -- Lavallen 4 augusti 2012 kl. 17.51 (CEST)[svara]
Oj. Ja vissa counyn har fler än en huvudort och rätt huvudort bör vara ifylld i countymallen. Man får nog dubbelkolla men det kan man göra i efterskott med listorna i USA:s countyn#Antal countyn per delstat. --NERIUM (disk) 4 augusti 2012 kl. 18.05 (CEST)[svara]
Då kör vi på det. En risk finns om samma ort är huvudort i mer än ett County. Men jag tror vi kan förutsätta att artiklarna om de största städerna redan är skapade, och att antalet sådana är begränsade. -- Lavallen 4 augusti 2012 kl. 18.54 (CEST)[svara]
Jag har aldrig sett att en ort varit huvudort i flera contyn men det är ju så många så jag kan ha missat det. Ja de största städerna är nog skapade men ganska så ofta är det en småort som är countyt huvudort istället för den största orten i countyt. Men det har inte någon betydelse så kör på. --NERIUM (disk) 4 augusti 2012 kl. 19.03 (CEST)[svara]
Vi har åtminstone ett fall (Kalawao County) där det inte finns ngn huvudort, så inte heller i Alaskas Census Areas av naturliga skäl.
Kommer du på rak arm på ngt exempel på ett County med mer än en huvudort, så jag kan titta hur jag ska skapa det här registret? Mitt minne sa: "Kolla North Dakota", men jag minns tydligen inte rätt. -- Lavallen 4 augusti 2012 kl. 19.13 (CEST)[svara]
NYC ser ut att vara huvudort i flera Counties, men det är ett udda fall. -- Lavallen 4 augusti 2012 kl. 19.24 (CEST)[svara]
I en:County seat beskrivs uddavarianter. --NERIUM (disk) 4 augusti 2012 kl. 19.40 (CEST)[svara]
Tack för den! -- Lavallen 4 augusti 2012 kl. 19.50 (CEST)[svara]
Här finns nu det register jag talade om ovan. Det syns i princip bara i redigeringsläge. Det ser kanske rörigt ut, men ska hjälpa roboten. -- Lavallen 4 augusti 2012 kl. 20.04 (CEST)[svara]
I test med just Andalusia här ovan, så der det ut som det där med Huvudort nu är löst! -- Lavallen 4 augusti 2012 kl. 20.47 (CEST)[svara]
Toppen! --NERIUM (disk) 4 augusti 2012 kl. 20.52 (CEST)[svara]
De städer som roboten kommer att kunna skriva väl dokumenterade artiklar om är de som finns i "Quickfacts". Övriga är inte lika lätta att hitta vissa data om. -- Lavallen 4 augusti 2012 kl. 19.50 (CEST)[svara]
Brook Highland, Alabama saknar siffror för folkmängd 2011 i de källor jag använt för de andra städerna. Där får jag ta vägen över Quickfacts, som åtminstone har 2010 års siffror. Inga problem, men måste provas ut lite då det är en annan kod som är lite omständigare. Får återkomma imorgon om det, för nu vill ngn ngt. -- Lavallen 4 augusti 2012 kl. 20.59 (CEST)[svara]
Brook HIghland är ju en cdp och inte en city, och den automatiska anpassningen till detta i brödtexten verkar funka bra. -- Lavallen 6 augusti 2012 kl. 13.17 (CEST)[svara]
Ja, det ser ut att fungera fint. --NERIUM (disk) 8 augusti 2012 kl. 21.56 (CEST)[svara]
Alla städer jag har tillräckligt bra källor för är nu skapade i Alabama. Bara en bråkdel är dock ännu utlagda i huvudnamnrymden. Jag kör lite försiktigt med den delen än så länge. -- Lavallen 8 augusti 2012 kl. 20.39 (CEST)[svara]
Spännande! --NERIUM (disk) 8 augusti 2012 kl. 21.56 (CEST)[svara]

Summering Alabama

[redigera wikitext]

Gjort en liten räkning på hur mycket kategorin "orter i Alabama" har ökat, och fick det till 80 nya artiklar. Jag hade tänkt låta dem ligga kvar här som omdirigeringar, men ambitiösa administratörer raderade dem som "olämpliga omdirigeringar", så jag lade ner det. Istället flyttar jag dem till huvudnamnrymden utan omdirigeringar. -- Lavallen 10 augusti 2012 kl. 12.27 (CEST)[svara]

Det ser finfint ut. Har gjort några förgreningar men väntar lite med flera tills fler städer i andra delstater är gjorda. --NERIUM (disk) 11 augusti 2012 kl. 16.00 (CEST)[svara]

10 nya artiklar varav tre bara var röda länkar på enwp. Sådana flyttas inte av roboten, utan de måste jag titta igenom manuellt först, så det inte läggs ut ngt kostigt i huvudnamnrymden. -- Lavallen 12 augusti 2012 kl. 11.07 (CEST)[svara]

De tre har nu fått iw-länkar. De fanns på spanskspråkiga wikipedia. --NERIUM (disk) 15 augusti 2012 kl. 14.53 (CEST)[svara]
Även Shaw Heights, Colorado är röd på enwp. -- Lavallen 15 augusti 2012 kl. 15.52 (CEST)[svara]
Den finns inte på någon annan språkversion. --NERIUM (disk) 15 augusti 2012 kl. 16.02 (CEST)[svara]

Arizona och Arkansas

[redigera wikitext]

gav 105 nya artiklar. -- Lavallen 12 augusti 2012 kl. 16.57 (CEST)[svara]

Tummen upp! /Hangsna (disk) 12 augusti 2012 kl. 17.36 (CEST)[svara]

Colorado gav 86 nya artiklar. -- Lavallen 15 augusti 2012 kl. 13.12 (CEST)[svara]

Connecticut, Delaware och Florida

[redigera wikitext]

Gav 433 artiklar, nästan alla i Florida. Körningen gjorde dessutom att en feluppmärkning i Connecticut och en felkategorisering i Florida upptäcktes. -- Lavallen 18 augusti 2012 kl. 08.31 (CEST)[svara]

Georgia och Hawaii

[redigera wikitext]

147, de flesta i Georgia. -- Lavallen 18 augusti 2012 kl. 19.17 (CEST)[svara]

Idaho och Illinois

[redigera wikitext]

297. --Lavallen 21 augusti 2012 kl. 19.24 (CEST)[svara]

Indiana och Iowa

[redigera wikitext]

144. -- Lavallen 8 september 2012 kl. 13.59 (CEST)[svara]

Kalifornien

[redigera wikitext]

491. -- Lavallen 9 september 2012 kl. 18.01 (CEST)[svara]

32. -- Lavallen 19 september 2012 kl. 21.19 (CEST)[svara]

Postnummer

[redigera wikitext]

En databas med USA:s postnummer (och koordinater) går att finna här Samma ort förekommer flera gånger om den har mer än 1 postnummer, men databasen kanske ändå kan vara till nytta. Nasko (disk) 22 augusti 2012 kl. 21.24 (CEST)[svara]

Missade tydligen detta inlägg. (Så går det när bevakningslistan växer.) Hittade en annan källa hos US Census Bureau som visar samband mellan zip-koder och fips-koder. Lagt in det i alla delstater fram till Iowa och lagt in i några artiklar i Kalifornien på prov.
Nu upptäckt att den källa jag använt för area och koordinater, även innehåller invånarsiffror. Kan vara bra när jag ska fånga in de mindre icke-inkorporerade orter som inte fått en ny källa för invånare än. Rena tabeller kan vara förvirrande ibland... Nåväl, jag tror jag fixar det senare. Just nu är det så många koder att jag är snurrig. -- Lavallen 26 augusti 2012 kl. 18.57 (CEST)[svara]