ODF vai OOXML?

Petteri Järvinen • Kuva: Timo Simpanen

ODF vai OOXML?

Kaksintaistelu avoimuudesta

Avointen tiedostomuotojen kilpajuoksu on muuttunut jännitysnäytelmäksi, johon sekoittuu politiikkaa ja mielikuvia. Kädenväännön lopputulos vaikuttaa kaikkien pc-käyttäjien elämään.

1980-luvulla tiedostomuodot olivat varsinainen villi länsi. Esimerkiksi tekstinkäsittelyohjelmia oli tusinoittain, ja jokaisella niistä oli oma tiedostomuotonsa. Tiedostojen siirto ohjelmasta toiseen oli käytännössä mahdotonta.

1990-luvun alussa Microsoft onnistui levittämään Windowsin siivellä omat Office-sovelluksensa kaikkialle. Samalla dos-sovellukset hävisivät käytöstä.

Wordin, Excelin ja Powerpointin vahvasta markkina-asemasta oli hyötyä vähän myöhemmin, kun sähköposti alkoi yleistyä. Vakioitujen sovellusten ansiosta käyttäjät saattoivat lähettää työtiedostoja toisilleen luottaen siihen, että vastaanottaja pystyi avaamaan ne.

Microsoft alkoi käyttää asemaansa hyväkseen muuttamalla Office-paketin tiedostomuotoja. Tallennus aiempaan versioon oli muutosten jälkeen niin kömpelöä, että moni käyttäjä mieluummin päivitti ohjelmansa. Näin yhtiö sai sidottua asiakkaat itseensä ja varmistettua tasaisen päivitystulojen virran.

XML selätti suljetut muodot

Uuden vuosituhannen lähestyessä html-koodauksesta kehittyi uusi riippumaton standardi. Office 2000 -versiossa saattoi ensi kertaa tallentaa työtiedostot html-muotoon, jota muutkin ohjelmat ymmärsivät.

Html korvautui pian xml-tekniikalla (extended markup language). Yksinkertaisella xml-koodauksella voi kuvata minkä tahansa tiedon, ja kuka tahansa voi tehdä xml-tiedostoja lukevia ja kirjoittavia ohjelmia. Yrityksen talousohjelma voi esimerkiksi lukea lähtötiedot Word-raportista, kirjoittaa niistä taulukot Exceliin ja päivittää tiedot lopuksi grafiikkana suoraan Powerpoint-esitykseen.

Office-tiedostoja on voinut tähänkin asti lukea ja kirjoittaa myös maksuttomalla Openofficella, mutta erillisen muunnoksen kautta. Muunnostoimintoja taas on ylläpidettävä erikseen, eivätkä ne koskaan toimi täydellisesti. Xml-tekniikan myötä muunnoksista voidaan luopua ja standardoinnin ansiosta ohjelmien omat tiedostomuodot menettävät merkityksensä.

Toimisto-ohjelmien markkinat ovat kypsyneet, eikä perussovelluksilla voi enää rahastaa entiseen malliin. Jatkossa rahakkain bisnes on yrityksissä, jotka integroivat toimistosovelluksia sisäisiin järjestelmiinsä. Tässä valossa avoimet tiedostoformaatit ovat myös Microsoftin etu.

ODF nappasi paalupaikan

Keväällä 2002 julkistettu avoimen lähdekoodin ilmainen Openoffice versio käytti Starofficesta periytynyttä suljettua binaariformaattia, mutta lokakuussa 2005 julkistettu versio 2.0 otti käyttöön avoimen odf-tiedostomuodon (Open Document Format). Kuka tahansa voi ladata netistä odf-standardin ja koodata omia sitä tukevia sovelluksia.

Microsoftin vastaus oli oma avoin xml-formaatti, joka sai nimen Office Open XML eli lyhyemmin ooxml. Office 2007 tallentaa tiedostot ooxml-muodossa, mutta yhteensopivuussyistä käyttäjä voi valita tallennuksen myös vanhempiin muotoihin.

Odf:n takana on laaja joukko yrityksiä, joita yhdistää ainakin kriittinen asenne Microsoftiin. IBM, Sun ja Novell ovat tukeneet vahvasti odf:n leviämistä. Nykyisin standardin kehittämisestä vastaa OASIS-niminen yhteenliittymä (Organization for the Advancement of Structured Information Standards).

Kansainvälinen ISO-standardointijärjestö hyväksyi ODF 1.0 -version vuonna 2006. Sen myötä odf:stä tuli virallinen standardi ISO 26300. Hyväksyntä tasoitti odf:n tietä etenkin julkishallinnossa.

OOXML:n vastaisku

Microsoftille tuli kiire saada vastaava hyväksyntä ooxml:lle. Sitä toivoi myös EU, jonka kilpailuvirasto oli pitkään tutkinut yhtiön toimia ja määrännyt sille tuntuvia sakkoja epäreilujen kilpailukeinojen käytöstä.

Joulukuussa 2006 Microsoft sai ooxml:lle stadardointijärjestö Ecma Internationalin hyväksynnän. Järjestö suositteli myös standardin käsittelyä ISO:ssa nopeutetun aikataulun mukaisesti.

ISO:ssa valtaa käyttävät jäsenvaltiot. Suomen kanta ooxml-ehdotukseen oli tarkoitus lyödä lukkoon elokuussa 2007 järjestetyssä SFS:n kokouksessa. Kiista kuumeni nopeasti ja SFS saikin runsaasti uusia jäseniä juuri äänestyksen alla.

Hyväksyntää tukivat useat it-alan yritykset ja osa valtionhallinnon edustajista. Vastustajien mielestä taas ooxml ei ollut vielä valmis.
Lopullista kantaa ei pystytty muodostamaan, joten Suomen valinnaksi jäi äänestyksestä pidättäytyminen. Vähän myöhemmin kansainvälinen kokous antoi Microsoftille lisäaikaa ooxml:n korjaamiseen.

Tämän vuoden helmikuun lopulla Genevessä järjestetään kokous, jossa arvioidaan ja hyväksytään tehdyt korjaukset. Lopullinen äänestys ISO-standardista on edessä myöhemmin keväällä.

Microsoft on nähnyt paljon vaivaa todistaakseen ooxml:n olevan yhtä avoin kuin odf. Se on esimerkiksi luvannut, ettei se tule koskaan vaatimaan maksuja ooxml-tekniikan käytöstä.

Sinänsä yhden yrityksen tuotteen standardoinnille ei ole estettä. Joulukuussa Adoben oma tuote, pdf-dokumenttiformaatti hyväksyttiin ISO-standardiksi äänin 13–1. Vain Ranska äänesti hyväksyntää vastaan. Pdf:n versio 1.7 on nyt virallinen standardi ISO 32000.

Tallennuksesta ei riitä kahdelle

Sekä odf että ooxml toteuttavat saman asian ja vieläpä lähes samalla tavalla. Niiden näkyvin ero on siinä, että ooxml:n määritys on laajuudeltaan yli 6000 sivua, kun odf-standardissa on ”vain” 738 sivua.

Kokoero selittyy Microsoftin tarpeella tukea vanhoja binaariformaattejaan: toisin kuin odf, ooxml pystyy täsmällisesti kuvaamaan kaikkien Office 97 – Office 2003 -versioiden työtiedostot. Tämän vuoksi Microsoft katsoo olleensa pakotettu kehittämään oma avoin tiedostomuoto.

Ooxml on myös teknisesti monipuolisempi, joskin ODF:n uusittu 1.2-versio on jo kehitteillä.

Jos ooxml saa ISO-hyväksynnän, sen uskotaan leviävän laajaan käyttöön ainakin yritysmaailmassa. Microsoftille ooxml on ainoa vaihtoehto, eikä se lupaa odf-tukea tuleviinkaan Office-ohjelmiinsa.

Toisaalta monien maiden julkishallinto ja käyttäjien yhteisöt pysyvät tiukasti odf:n kannalla – jos ei mistään muusta syystä, niin ainakin vanhoja kalavelkoja kuitatakseen.

Varmaa on, että vain yksi yhteinen standardi voi olla vahva. Hyvästä tarkoituksesta huolimatta kaksi päällekkäistä ja keskenään kilpailevaa standardia tekee monen asian paljon hankalammaksi. Myös vanhat suljetut tiedostomuodot säilyvät käytössä vielä vuosia, mikä sotkee tilannetta entisestään.


Lisää tiedostomuotoja Officeen

Office 2007 tallentaa suoraan ooxml-tiedostoja, Openoffice puolestaan odf-tiedostoja. Officen 2000-, XP- ja 2003-versioihin voi lisätä ooxml-tuen lataamalla Microsoftin web-sivuilta päivityspaketin nimeltä Microsoft Office Compatibility Pack for Word, Excel, and PowerPoint 2007. Tuki on toimiva, mutta se hidastaa tallennusta, sillä ooxml-muunnos joudutaan tekemään jokaisen tallennuksen yhteydessä erikseen.

Odf-tuen lisääminen Officeen on hieman mutkikkaampaa. Osoitteesta odf-converter.sourceforge.net voi ladata ilmaisen, avoimen lähdekoodin ohjelman, joka päivittää odf-tuen Office-versioihin 2000, XP, 2003 ja 2007. Tekijät kuitenkin huomauttavat, ettei muunnos ole aivan täydellinen, koska molemmissa formaateissa on ominaisuuksia, jotka puuttuvat toisesta.

Odf-muunnosohjelman takana on ranskalainen, saksalainen ja intialainen yritys. Työn on rahoittanut ehkä hieman yllättäen Microsoft itse.


Kovaa peliä Bostonissa

Syyskuussa 2005 Yhdysvaltain Massachusettsin osavaltio teki yllättävän päätöksen: julkishallinnossa on luovuttava Microsoftin Office-sovelluksista ja siirryttävä avointen tiedostomuotojen käyttöön. Niitä ei tuolloin ollut kuin yksi: vähän aiemmin valmistunut odf.

Ehkä oli pelkkää sattumaa, että juuri Massachusetts alkoi ensimmäisenä vaatia avoimiin tiedostoihin siirtymistä. Tai sitten ei; pitäähän juuri Bostonissa päämajaansa Lotus, joka pitkään kilpaili toimistosovelluksillaan Microsoftia vastaan.

Kisan hävittyään IBM:n omistama Lotus kehittää enää Notes-ryhmätyöohjelmaa, jonka mukana toimitetaan – yllätys, yllätys – räätälöity Openoffice-versio. IBM on nimennyt version Symphonyksi, joka puolestaan oli Lotuksen dos-aikakauden hittituote 1980-luvulta.

Jotain merkitystä saattoi olla myös sillä, että tunnettu tekninen yliopisto MIT sijaitsee Bostonin kupeessa.

Monet Euroopan maat ovat Massachusettsin esimerkkiä seuraten tehneet vastaavanlaisia päätöksiä. Erityisesti Norjan kanta on tiukka: julkishallinnon verkkosivuilla saa vuodesta 2009 alkaen tarjota vain html-, pdf- ja odf-tiedostoja.

Tärkein tiedostomuoto on html, joka toimii kaikkialla. Jos tarvitaan hyvin tarkkaa ulkoasun hallintaa, voidaan käyttää standardoitua pdf:ää. Odf-muoto sopii silloin, kun kansalaisten on pystyttävä muokkaamaan tiedostoja. Myös Belgia, Tanska ja Hollanti ovat päättäneet siirtyä yksinomaan avointen tiedostomuotojen käyttöön.

Päätösten takana on halu säästää ohjelmakustannuksissa sekä varmistaa, että kansalaiset pystyvät jatkossa avaamaan kaikki dokumentit omilla ohjelmillaan. Yrityksissä suhtautuvat tiedostomuotoihin pragmaattisemmin: tiedostoformaatin vaihto on iso urakka, jolla on kauaskantoisia seurauksia.

Esimerkiksi tätä artikkelia varten haastateltu suuri suomalainen yritys aikoo jatkaa Office-tuotteiden käyttöä entiseen tapaan. Yrityksellä on käytössään lukuisia Officen varaan tehtyjä sisäisiä sovelluksia, lomakkeita ja arkistoja. Lisäksi sen on pystyttävä lukemaan kaikkia yhteistyökumppaneiltaan tulevia tiedostoja. Yritys toivoo teknisesti kelvollisten avointen standardien leviämistä, mutta ei halua tässä vaiheessa liputtaa kummankaan leirin puolesta.


Monta tiedostoa tiiviissä paketissa

Sekä odf- että ooxml-tekniikassa työtiedosto puretaan eri tyyppisiin elementteihin kuten tekstiin, tyylimäärittelyihin, makroihin ja kuviin. Elementit koodataan xml-tekniikan mukaisesti ja lopputulos pakataan yhdeksi zip-tiedostoksi. Tiedoston tunniste kertoo, onko kyse tekstikäsittelyn, taulukkolaskennan vai esitysgrafiikan työtiedostosta.

Standardimäärittelyissä on jon­kin verran eroja. Esimerkiksi odf:ssä dokumentin taustaväri koskee ainoastaan kirjoitusaluetta, mutta ooxml:ssä väri ulottuu myös marginaaleihin. Odf:ssä luettelomerkin fontin voi valita erikseen joka tasolle, ooxml:ssä merkki on sama koko luettelossa. Nämä ja muut erot johtavat siihen, että samankaltaisesta arkkitehtuurista huolimatta tiedostoja ei voi täydellisesti muuntaa formaatista toiseen.

Tiedoston rakennetta on helppo tarkastella vaihtamalla esimerkiksi Openofficen tekstitiedoston .odt-tunniste tunnisteeksi .zip ja avaamalla sen jälkeen paketti Windowsin tiedostohallinnalla. Yhden lauseen sisältävästä Openoffice-dokumentista syntyy kahdeksan tiedostoa 38:aan hakemistoon. Vastaava ooxml-paketti sisältää 13 tiedostoa 23 hakemistossa.

Odf-standardi löytyy osoitteesta docs.oasis-open.org/office/v1.1/os/opendocument-v1.1.pdf ja ooxml-standardiehdotus osoitteesta www.ecma-international.org/publications/standards/ecma-376.htm

 

Tagit: -
Lähetä Tulosta Tilaa RSS-syöte
Takaisin ylös

Tietokone 5/2012 julkaisupäivä 16.5.2012

Katse näyttöön

Edessäsi ole oleva näyttö on kovin erilainen kuin ei-kovin-kauan-sitten yleisimmin käytetyt kuvaputkinäytöt. Eikä kehitys pysähdy. Toukokuun Tietokoneessa katsotaan näyttöjen tulevaisuuteen ja myös testataan terävät 27-tuumaiset näytöt. Ensituntumaa otetaan tulevan Windowsin palvelinversiosta. Vinkkejä tarjotaan muun muassa pc-hygienian ylläpitoon.

Takaisin ylös

Tietokone 2/2008

Lehden uusimmat numerot ovat vain tilaajien luettavissa. Vanhemmat numerot ovat vapaasti kaikkien luettavissa.

Voit myös ostaa Tietokoneen digilehden.

TTL ry
Pieni kirjapuoti
Takaisin ylös