Hieman yleistietoa px-tiedostomuodosta ja -avainsanoista ======================================================== ver. 2.5.001 Lisätietoja hans.baumgartner@stat.fi Muutokset: 18.08.2017 - DATA avainsanan kohdalla tarkennettu pistekoodien ja viivan käyttöä - Standardoitu käytettäväksi Neljännesvuosi, Kvartal ja Quarter (EI siis Quarters) - Lisätty aikamuuttujasta monikieliset esimerkit VALUES ja CODES avainsanojen kohdalle - Esimerkkiä ja selitettä MATRIX avainsanalle parannettu /Hb 15.08.2017 - SYNONYMS avainsana lisätty hakusanoja varten /Hb 19.04.2017 - Lisätty avainsana OFFICIAL-STATISTICS Suomessa SVT (Suomen Virallinen Tilasto) - TIMEVALissa korjattu TLIST - CODES ja VALUES muuttujan nimi "Neljännes" on tarkennettu "Vuosineljännes" - Aikamuuttujilla sekä CODES että VALUES identtiset (standardointi) - Kartapohjan avainsana MAP lisätty /Hb 23.01.2023 - Lisätty tietoa VARIABLECODE avainsanaan liittyen /Hb Yleistä: -------- - avainsanat kirjoitetaan omille riveilleen ISOILLA kirjaimilla - avainsanan arvo annetaan yleensä lainausmerkeillä rajattuna - avainsanalauseke päättyy puolipisteeseen - Taulukkokohtaisen avainsanan perään tulee yhtäsuuruusmerkki NOTE="taulukkoalaviite"; - monikielisissä taulukoissa pääkielinen avainsana on ilman kielitunnistetta, muille se tulee antaa heti avainsanan jälkeen - kielikoodit ovat kaksikirjaimisia ja ne annetaan pienillä (TK:ssa fi, sv ja en) ilman lainausmerkkejä NOTE="Taulukkoalaviite"; NOTE[sv]="Samma på svenska"; NOTE[en]="The same in English"; - tekstejä sisältävät taulukkokohtaiset avainsanat tulee antaa joka kielelle erikseen (vaikka toisinaan sisältö voi olla sama) - pitkät tekstit voidaan katkaista usealle riville siten, että katkaisukohta päätetään lainausmerkkiin, ja seuraava rivi aloitetaan heti lainausmerkillä (tämä ei ole uudessa PX-Web-versiossa enää kovinkaan tarpeellista) NOTE="tämä on olevinaan pitkä" " teksti, joka piti katkaista" " usealle riville"; - #-merkillä osoitetaan rivinvaihdot, jotka käyttäjä näkee palvelussa NOTE="Tämä#teksti#jaetaan#viidelle#riville"; - tekstin sisäisiä www-linkkejä () ei saa katkaista usealle riville NOTE="Lisätietoja osoitteessa Klikkaa mua"; - lainausmerkkejä ei käytetä numeerisissa tai YES/NO-arvon saavissa avainsanalausekkeissa DECIMALS=2; COPYRIGHT=YES; OFFICIAL-STATISTICS=YES; - joidenkin avainsanojen arvot annetaan listoina, jolloin jokainen listan alkio annetaan lainausmerkeissä ja alkiot erotetaan pilkuilla STUB="Vuosi","Ikä","Sukupuoli"; - pitkät listat jaetaan riveille siten, että edellinen rivi päättyy pilkkuun ja seuraava rivi alkaa normaalista, viimeinen listarivi päättyy puolipisteeseen STUB="Vuosi", "Ikä", "Sukupuoli"; - Muuttujakohtaisen avainsanan perään annetaan sulkeissa muuttujan nimi (mahdollisen kielikoodin jälkeen) - monikielisissä taulukoissa tulee kaikki muuttujakohtaiset avainsanat antaa joka kielelle erikseen kielikohtaisin muuttujatekstein NOTE("Ikä")="alaviite"; NOTE[sv]("Ålder")="nånting"; NOTE[en]("Age")="hello"; - Arvokohtaisille avainsanoille tulee antaa sulkeissa sekä muuttujan nimi että arvoteksti - monikielisilla taulukoissa tulee kaikki arvokohtaiset avainsanat antaa joka kielelle erikseen kielikohtaisin muuttuja -ja arvotekstein VALUENOTE("Vuosi","1959")="Vuosisadan paras viinivuosi"; - Solukohtaisille avainsanoille annetaan sulkeissa jokaisen muuttujan vastaava arvo muuttujajärjestyksessä, kaikki arvot voidaan ilmaista *-merkillä - solukohtaisten avainsanojen käyttö on toistaiseksi varsin harvinaista - Avainsanojen tulisi olla seuraavassa järjestyksessä: CHARSET, AXIS-VERSION, CODEPAGE, LANGUAGE, LANGUAGES, CREATION-DATE, NEXT-UPDATE, PX-SERVER, DIRECTORY-PATH, UPDATE-FREQUENCY, TABLE-ID, SYNONYMS, DEFAULT-GRAPH, DECIMALS, SHOWDECIMALS, ROUNDING, MATRIX, AGGREGALLOWED, AUTOPEN, SUBJECT-CODE, SUBJECT-AREA, CONFIDENTIAL, COPYRIGHT, DESCRIPTION, TITLE, DESCRIPTIONDEFAULT, CONTENTS, UNITS (taulukkokohtainen), STUB, HEADING, CONTVARIABLE, VALUES, TIMEVAL, CODES, DOUBLECOLUMN, PRESTEXT, DOMAIN, VARIABLE-TYPE, HIERARCHIES, HIERARCHYLEVELS, HIERARCHYLEVELSOPEN, HIERARCHYNAMES, MAP, PARTITIONED, ELIMINATION, PRECISION, LAST-UPDATED, STOCKFA, CFPRICES, DAYADJ, SEASADJ, UNITS (sisältömuuttujakohtainen), CONTACT, REFPERIOD, BASEPERIOD, DATABASE, SOURCE, SURVEY, LINK, INFOFILE, INFO, NOTEX, NOTEX (muuttujakohtainen), NOTE, NOTE (muuttujakohtainen), VALUENOTEX, VALUENOTE, CELLNOTEX, CELLNOTE, DATASYMBOL1, DATASYMBOL2, DATASYMBOL3, DATASYMBOL4, DATASYMBOL5, DATASYMBOL6, DATASYMBOLSUM, DATASYMBOLNIL, DATANOTECELL, DATANOTESUM, FIRST-PUBLISHED, META-ID, OFFICIAL-STATISTICS, DATANOTE, ATTRIBUTE-ID, ATTRIBUTE-TEXT, ATTRIBUTES, KEYS, DATA - huomaa, että suuri osa avainsanoista ei ole pakollisia, joidenkin käyttöä ei edes suositella PAKOLLISET ja SUOSITELTAVAT avainsanat -------------------------------------- AXIS-VERSION - PX-Web-versiotunnus tekstinä - vakioarvo: 2013 AXIS-VERSION="2013"; CODEPAGE - Merkistökoodaus - TK:ssa vakioasetus: iso-8859-15 CODEPAGE="iso-8859-15"; CHARSET - historiallinen jäänne - vakioarvo: ANSI CHARSET="ANSI"; LANGUAGE - taulukon peruskielen kielikoodi - TK:n oletuskieli: fi LANGUAGE="fi"; LANGUAGES (käytetään vain monikielisissä tiedostoissa) - monikielisen taulukon kaikki kielikoodit - ensimmäinen koodi on sama kuin LANGUAGE-asetuksessa - TK:ssa suositellaan: fi,sv,en. LANGUAGES="fi","sv","en"; CONTACT - yhteystiedot CONTACT="Tilastokeskus#Lisätietoja" "#Tilaston kotisivu"; CONTACT[sv]= ... ; CONTACT[en]= ... ; COPYRIGHT - tekijänoikeustieto - TK:ssa aina YES (Tilastokeskuksella on EU-lainsäädännön mukaan aina tekijänoikeus vaikka olisi kyse avoimest datasta yms.) COPYRIGHT=YES; CREATION-DATE - taulukon luontipäivämäärä muotoa "vvvvkkpp hh:mm" CREATION-DATE="20100406 11:07"; LAST-UPDATED - julkaisuajankohta, aikaleima kuten edellä LAST-UPDATED="20160414 09:00"; NEXT-UPDATE - päivitysajankohta, aikaleima kuten edellä NEXT-UPDATE="20170414 09:00"; DESCRIPTION - koko taulukon kuvaus HUOM: kuvaa koko taulukkoa ei siitä poimittua osataulukkoa. Aikaväli mukaan. DESCRIPTION="Elävänä syntyneet äidin iän ja lapsen sukupuolen mukaan alueittain 1987-2015"; DESCRIPTION[sv]= ... ; DESCRIPTION[en]= ... ; CONTENTS - sisällön kuvaus, dynaamisen otsikon siemen - on muistettava osataulukon poiminnan mahdollisuus (ei vuosia otsikkoon) CONTENTS="Elävänä syntyneet"; CONTENTS[sv]="Levande födda"; CONTENTS[en]="Live births"; TITLE - poiminnan yhteydessä muodostettava dynaaminen taulukko-otsikko - muodostetaan CONTENTS-avainsanasta (jossa ei ole vuosilukuja) ja muuttujien nimistä - dynaaminen, poimitun taulukon otsikko toimii huomattavasti paremmin kuin staattinen kiinteä otsikko - dynaamisessa otsikossa listataan vain lopullisen poimitun taulukkodatan muuttujat TITLE="Elävänä syntyneet muuttujina Alue, Vuosi ja Sukupuoli"; TITLE[sv]="Levande födda efter Region, År och Kön"; TITLE[en]="Live births by Area, Year and Gender"; DECIMALS - koko taulukon desimaalimääritys (tallennustarkkuus) DECIMALS=2; SHOWDECIMALS - taulukossa näytettävien desimaalien määrä SHOWDECIMALS=0; PRECISION - muuttujan arvojen (luokitusten) tarkkuusasetus (vain yhdelle muuttujalle) - SHOWDECIMALSLaatuselosteet" "#Käsitteet ja määritelmät"; NOTE[sv]= ... ; NOTE[en]= ... ; CONTVARIABLE (content variable) - koostemuuttuja johon viedään määrämuuttuja"t" (kutsutaan myös tutkimusmuuttuja"t", tilastomuuttuja"t" tai sisältömuuttuja"t"). - mahdollistaa mm. yksikkötietojen antamisen eri tilastomuuttujan arvoille - muista antaa kaikille tilastomuuttujille yksikkö CONTVARIABLE="Tiedot"; CONTVARIABLE[sv]="Information"; CONTVARIABLE[en]="Information"; UNITS("autot")="kpl"; UNITS[sv]("bilar")="st"; UNITS[en]("cars")="units"; UNITS("Asuntojen pinta-ala")="m2"; UNITS[sv]("Bostädernas yta")="m2"; UNITS[en]("Sama englanniksi")="m2"; TIMEVAL - aikamuuttujan asetus (vain yhdelle muuttujalle) - vuosi ja jaksotustieto tulee yhdistää samaan muuttujaan - vuosimuuttujan muoto: TLIST(A1),"vvvv","vvvv",... - neljännesmuuttujan muoto: TLIST(Q1),"vvvv1","vvvv2",... - kuukausimuuttujan muoto: TLIST(M1),"vvvv01","vvvv02",... TIMEVAL("Vuosi")=TLIST(A1),"2011","2012","2013","2014","2015"; TIMEVAL[sv]("År")=TLIST(A1),"2011","2012","2013","2014","2015"; TIMEVAL[en]("Year")=TLIST(A1),"2011","2012","2013","2014","2015"; TIMEVAL("Vuosineljännes")=TLIST(Q1),"20171","20172","20173","20174"; TIMEVAL[sv]("Kvartal")=TLIST(Q1),"20171","20172","20173","20174"; TIMEVAL[en]("Quarter")=TLIST(Q1),"20171","20172","20173","20174"; TIMEVAL("Kuukausi")=TLIST(M1),"201701","201702","201703","201704","201705"; TIMEVAL[sv]("Månad")=TLIST(M1),"201701","201702","201703","201704","201705"; TIMEVAL[en]("Month")=TLIST(M1),"201701","201702","201703","201704","201705"; SOURCE - lähdetiedot SOURCE="Tilastokeskus"; SOURCE[sv]="Statistikcentralen"; SOURCE[en]="Statistics Finland"; SUBJECT-AREA SUBJECT-CODE - aihealue ja sitä vastaava aihealuekoodi - Esimerkki standardikoodeista ja -aihealueista: koodi | suomi | ruotsi | englanti HOU | Asuminen | Boende | Housing LIV | Elinolot | Levnadsförhållanden | Living Conditions ENE | Energia | Energi | Energy PRI | Hinnat ja kustannukset | Priser och kostnader | Prices and Costs GFI | Julkinen talous | Offentlig ekonomi | Government Finance NAA | Kansantalous | Nationalräkenskaper | National Accounts TRA | Kauppa | Handel | Trade EDU | Koulutus | Utbildning | Education CUL | Kulttuuri ja viestintä | Kultur och massmedier | Culture and the Media TRA | Liikenne ja matkailu | Transport och turism | Transport and Tourism AFF | Maa-, metsä- ja kalatalous | Jord- och skogsbruk samt fiske | Agriculture, Forestry and Fishery JUS | Oikeus | Rättsväsende | Justice WAG | Palkat ja työvoimakustannukset | Löner och arbetskraftskostnader | Wages, Salaries and Labour Costs SER | Palvelut | Tjänster | Services FIN | Rahoitus ja vakuutus | Finansiering och försäkring | Financing and Insurance CON | Rakentaminen | Byggande | Construction SOS | Sosiaaliturva | Socialskydd | Social Protection MAN | Teollisuus | Industri | Manufacturing HEL | Terveys | Hälsa | Health STI | Tiede, teknologia ja tietoyhteiskunta | Vetenskap, teknologi och informationssamhället | Science, Technology and Information Society INC | Tulot ja kulutus | Inkomst och konsumtion | Income and Consumption LAB | Työmarkkinat | Arbetsmarknaden | Labour Market ELE | Vaalit | Val | Elections POP | Väestö | Befolkning | Population ENV | Ympäristö ja luonnonvarat | Miljö och naturresurser | Environment and Natural Resources ENT | Yritykset | Företag | Enterprises COL | Kokooma | Samling | Collection OTH | Muu | Diverse | Other SUBJECT-AREA="Väestö"; SUBJECT-AREA[sv]="Befolkning"; SUBJECT-AREA[en]="Population"; SUBJECT-CODE="VRM"; ELIMINATION - muuttujan autommaattinen ylisummaus, jos muuttujasta ei valita mitään - käytetään vain summautuvilla muuttujilla, joille summatasot on laskettu valmiiksi taulukkoon ELIMINATION("Sukupuoli")="Sukupuolet yhteensä"; ELIMINATION[sv] ... ; ELIMINATION[en] ... ; VALUES - jokaisen muuttujan (luokituksen) arvotekstit (luokat) pilkkueroteltuna listana - jokaisen arvon tulee olla yksilöivä, ts. toisteisia tekstejä EI saa käyttää VALUES("Alue")="KOKO MAA","Akaa","Alajärvi","Alavieska"; VALUES[sv]("Region")= ... ; VALUES[en]("Area")= ... ; - aikamuuttujilla muoto riippuu jaksotuksesta - aikamuuttujilla sekä CODES että VALUES identtiset (standardointi) VALUES("Vuosi")="2014","2015","2016","2017"; VALUES[sv]("År")="2011","2012","2013","2014","2015"; VALUES[en]("Year")="2011","2012","2013","2014","2015"; VALUES("Vuosineljännes")="2014Q1","2014Q2","2014Q3","2014Q4"; VALUES[sv]("Kvartal")="2017Q1","2017Q2","2017Q3","2017Q4"; VALUES[en]("Quarter")="2017Q1","2017Q2","2017Q3","2017Q4"; VALUES("Kuukausi")="2014M01","2014M02","2014M03","2014M04","2014M05","2014M06"; VALUES[sv]("Månad")="2017M01","2017M02","2017M03","2017M04","2017M05"; VALUES[en]("Month")="2017M01","2017M02","2017M03","2017M04","2017M05"; CODES - jokaista arvotekstiä vastaava yksilöivä tunniste - summataso ilmaistaan S-merkeillä (muuta kooditusta vastaavan verran, yleensä SSS) CODES("Alue")="SSS","020","005","009"; CODES[sv] ... ; CODES[en] ... ; - aikamuuttujilla muoto riippuu jaksotuksesta - aikamuuttujilla sekä CODES että VALUES identtiset (standardointi) CODES("Vuosi")="2014","2015","2016","2017"; CODES("Vuosineljännes")="2014Q1","2014Q2","2014Q3","2014Q4"; CODES("Kuukausi")="2014M01","2014M02","2014M03","2014M04","2014M05","2014M06"; CODES[sv]("År")="2011","2012","2013","2014","2015"; CODES[sv]("Kvartal")="2017Q1","2017Q2","2017Q3","2017Q4"; CODES[sv]("Månad")="2017M01","2017M02","2017M03","2017M04","2017M05"; CODES[en]("Year")="2011","2012","2013","2014","2015"; CODES[en]("Quarter")="2017Q1","2017Q2","2017Q3","2017Q4"; CODES[en]("Month")="2017M01","2017M02","2017M03","2017M04","2017M05"; DOMAIN - arvojoukkomäärittely, jonka avulla voidaan toteuttaa vakioituja ryhmittelyjä (kytkentä tietokannan .agg- ja .vs-ryhmittelytiedostoihin) - vaikuttaa PX-Web-käyttöliittymän pudotusvalikoihin ja edelleen taulukkopoimintoihin näkyviä ryhmittelytiedostoja (.agg ja .vs) - vakioituja ryhmittelytiedostoja on esimerkiksi hakemistossa U:\PC-Axis-luokitukset - HUOM: kirjainkokojen tulee vastata kaikissa tiedostoissa toisiaan DOMAIN("Kunta 2016")="kunta2016"; DOMAIN[sv] ... ; DOMAIN[en] ... ; MAP (tulevalle karttasovellukslle) - karttapohjan nimi esim. "kartta_kunta2017" MAP("Kunta 2017")="kartta_kunta2017"; MAP[sv]("Komun 2017")="karta_komun2017"; MAP[en]("Municipalility 2017")="map_municipality2017"; OFFICIAL-STATISTICS - Suomessa SVT (Suomen Virallinen Tilasto) OFFICIAL-STATISTICS=YES; DATA - taulukon dataosa on aina px-tiedoston lopussa - tiedot annetaan käytetyn taulukoinnin mukaisessa järjestyksessä (viimeinen sarakemuuttuja voidaan mieltää tulostuvan nopeiten) - puhtaat luvut tallennetaan välilyöntieroteltuina, desimaalierottimena käytetään pistettä, EI tuhaterottimia - jokaisen tulostusrivin lopussa tulee olla välilyönti, lukuja ei saa katkaista keskeltä - viimeisen rivin loppuun tulee puolipiste - pistekoodit annetaan lainausmerkeissä (".", "..", "..." , jne.), pistekoodissa voi olla korkeintaan kuusi pistettä (1-6 pistettä ja "-") - viivakoodi ("-") tarkoittaa tavallisesti absoluuttista nollaa, jonka toimii laskettaessa nollana. - Pistekoodit näytetään Tilastokeskuksessa sellaisinaan mutta ne on mahdollista määrittää px-tiedostossa näytettäviksi muulla tavalla. - HUOM! Jos PX-SOVELLUKSISSA laskettava (.px) data sisältää yhdenkin pistekoodin, vastaus on PISTEKOODI. Vain "-" ja 0 tulkitaan nollana laskettaessa px-sovelluksissa. Tämä siksi ettei laskennassa saa laskettua esim. vääriä totaaleja. DATA=1 "." 3 4 5 ".." 7 "-"; px-esimerkkitiedosto: --------------------- CHARSET="ANSI"; AXIS-VERSION="2013"; CODEPAGE="iso-8859-15"; LANGUAGE="fi"; LANGUAGES="fi","sv","en"; CREATION-DATE="20100406 11:07"; NEXT-UPDATE="20170414 09:00"; DECIMALS=0; SHOWDECIMALS=0; MATRIX="030synt103"; SUBJECT-CODE="VRM"; SUBJECT-AREA="Väestö"; SUBJECT-AREA[sv]="Väestö"; SUBJECT-AREA[en]="Väestö"; COPYRIGHT=YES; DESCRIPTION="Elävänä syntyneet äidin iän ja lapsen sukupuolen mukaan alueittain 1987-2015"; DESCRIPTION[sv]="Levande födda efter kön, moderns ålder och område 1987-2015"; DESCRIPTION[en]="Live births by sex, age of mother and area 1987-2015"; TITLE="Elävänä syntyneet muuttujina Alue, Vuosi ja Sukupuoli"; TITLE[sv]="Levande födda efter Område, År och Kön"; TITLE[en]="Live births by Area, Year and Sex"; CONTENTS="Elävänä syntyneet"; CONTENTS[sv]="Levande födda"; CONTENTS[en]="Live births"; UNITS="henkilöitä"; UNITS[sv]="Persons"; UNITS[en]="Persons"; STUB="Alue"; STUB[sv]="Område"; STUB[en]="Area"; HEADING="Vuosi","Sukupuoli"; HEADING[sv]="År","Kön"; HEADING[en]="Year","Sex"; VALUES("Alue")="KOKO MAA","Akaa","Alajärvi","Alavieska"; VALUES[sv]("Område")="HELA LANDET","Akaa","Alajärvi","Alavieska"; VALUES[en]("Area")="WHOLE COUNTRY","Akaa","Alajärvi","Alavieska"; VALUES("Vuosi")="2011","2012","2013","2014","2015"; VALUES[sv]("År")="2011","2012","2013","2014","2015"; VALUES[en]("Year")="2011","2012","2013","2014","2015"; VALUES("Sukupuoli")="Sukupuolet yhteensä","Pojat","Tytöt"; VALUES[sv]("Kön")="Båda könen","Pojkar","Flickor"; VALUES[en]("Sex")="Both sexes","Boys","Girls"; TIMEVAL("Vuosi")=TLIST(A1),"2011","2012","2013","2014","2015"; TIMEVAL[sv]("År")=TLIST(A1),"2011","2012","2013","2014","2015"; TIMEVAL[en]("Year")=TLIST(A1),"2011","2012","2013","2014","2015"; CODES("Alue")="SSS","020","005","009"; CODES[sv]("Område")="SSS","020","005","009"; CODES[en]("Area")="SSS","020","005","009"; CODES("Vuosi")="2011","2012","2013","2014","2015"; CODES[sv]("År")="2011","2012","2013","2014","2015"; CODES[en]("Year")="2011","2012","2013","2014","2015"; CODES("Sukupuoli")="S","1","2"; CODES[sv]("Kön")="S","1","2"; CODES[en]("Sex")="S","1","2"; DOMAIN("Alue")="kunta 2016"; DOMAIN[sv]("Område")="kunta2016sv"; DOMAIN[en]("Area")="kunta2016en"; MAP("Alue")="kartta_kunta2016"; MAP[sv]("Område")="kartta_kunta2016sv"; MAP[en]("Area")="map_kunta2016en"; ELIMINATION("Sukupuoli")="Sukupuolet yhteensä"; ELIMINATION[sv]("Kön")="Båda könen"; ELIMINATION[en]("Sex")="Both sexes"; LAST-UPDATED="20160414 09:00"; CONTACT="Tilastokeskus#Lisätietoja#Tilaston kotisivu"; CONTACT[sv]="Statistikcentralen#Statistikens hemsida#Tilläggsupgifter"; CONTACT[en]="Statistics Finland#Statistics' home page#Further information"; SOURCE="Tilastokeskus"; SOURCE[sv]="Statistikcentralen"; SOURCE[en]="Statistics Finland"; NOTE="Tilaston kuvaus#Laatuselosteet#Käsitteet ja " "määritelmät##Tilastossa käytetään 1.1.2016 aluejakoa koko aikasarjassa.#Alueliitoskuntien tiedot yhdistetty."; NOTE[sv]="Begrepp och definitioner#Beskrivning#Kvalitetsbeskrivning##I statistiken används områdesindelningen 1.1.2016 i hela tidsserien.#Uppgifterna om de inkorporerade kommunerna har sammanslagits."; NOTE[en]="Concepts and definitions#Description#Quality description##These statistics apply the regional division of 1 January 2016 to the#whole time series. Data for annexed municipalities have been combined."; DATA= 59961 30546 29415 59493 30308 29185 58134 29858 28276 57232 29272 27960 55472 28469 27003 177 86 91 209 106 103 186 100 86 167 83 84 162 82 80 122 60 62 107 58 49 100 47 53 98 45 53 101 53 48 29 18 11 35 23 12 32 14 18 37 19 18 35 14 21;