Som bekendt har Folketinget en ny hjemmeside på vej og i går blev en beta-udgave offentliggjort. Du kan prøvekøre betaversionen her: http://betawww.ft.dk/.
Jeg kendte af forskellige årsager en del til hvordan den nye hjemmeside kom til at se ud, men det er godt at få mulighed for at klikke lidt rundt. Jeg synes designet er rigtig flot og +1 for at bredden er flydende og ikke begrænset til 960px. Den nye hjemmeside er i det hele taget meget mere behagelig at arbejde med end den gamle (et udsagn der dog ikke siger ret meget). Jeg har ikke fundet mange reelle nye features endnu, men politikernes profiler har fået en oversigt over nylig aktivitet, her f.eks. Johanne Schmidt-Nielsen. Afstemningsresultater vises også meget bedre, se f.eks. Lov om statsligt kapitalindskud i kreditinstitutter. På den gamle hjemmeside stod stemmer i ASCII-tabeller.
Særligt interessant for Folkets Ting er naturligvis om den nye hjemmeside lader sig scrape for data (der er nemlig ikke kommet noget API eller anden mulighed for at downloade indhold). Alle url’er er naturligvis anderledes, så robotten der tramper rundt på siden skal ændres. Til gengæld er HTML’en nøjagtig den samme som på den gamle side (og den går i øvrigt igen på retsinfo). Det betyder at parseren der piller love og taler fra hinanden nok ikke skal ændres ret meget, en stor lettelse (jeg lå ret meget i fosterstilling og rystede dengang jeg skrev netop det kode, fordi mark-up’en er så dårlig). Det nye site svarer ikke ret hurtigt (og det er ikke fordi jeg allerede har skrevet en scraper der hamrer det
), men det bliver forhåbentligt rettet således at Folkets Ting kan scrape hver nat. En god ting ved beta’en er, at jeg har en måneds til at implementere en ny scraper. Forhåbentligt er Folkets Ting klar til at hente data når Folketinget åbner til oktober.
Overordnet synes jeg at den nye side fremstår temmelig teknokratisk og den har det samme knold-i-nakke-bibliotikar-feel som den gamle side. Det er også klart at det er Folketingets administrations processer og terminologier der er i centrum, ikke den almindelig interesserede borgers behov. Hvis du har kommentarer, bug-reports eller forslag til betaversionen er der en feedback formular til formålet. +1 for det også.

April 13th, 2010 at 9:23 pm
[...] opgave har været at omskrive den robot (“scraper”), der hver nat henter data fra Folketingets nye hjemmeside. Nogle ting er ikke ændret synderligt på den nye sider, men meget indhold vises helt anderledes [...]