TypePad -> Movable Type osa 2: sisällöt

Lupailin viikko sitten kertoa lisää siirtymisestä TypePad-alustalta Movable Typen käyttäjäksi. Tällä kertaa keskitityn reilun vuoden aikana tuotetun teksti- ja kuvamateriaalin siirtämiseen järjestelmästä toiseen. Tulossa on aika kuivaa tekniikkaa, joten tuntekaa olemaan vapaa skippaamaan loput tästä kirjoituksesta, jollei asia tunnu lainkaan kiinnostavalta.

Varsinaisten blogikirjoitusten siirtäminen oli tässä tapauksessa varsin yksikertaista, sillä molemmat järjestelmät tukevat samaa tekstipohjaista vienti- ja tuontimuotoa (Movable Type Import Format). Ainoa huolehdittava asia oli äkkösten ja muiden erikoismerkkien muuntaminen oikeaan koodausmuotoon. TypePadin export-toiminto tulostaa kaikki blogin merkinnät UTF-8 -koodatussa muodossa, joka hyvällä tuurilla menee mukisematta suoraan Movable Type:n import-toiminnolla sisään.

Omassa tapauksessani uusi webbipalvelimeni on konfiguroitu ilmoittamaan palvelemiensa html-tiedostojen koodausmuodoksi UTF-8:n sijasta ISO-8859-1 koodauksen, joten jouduin tekemään tiedostolle koodausmuunnoksen Open Office Writer -ohjelman avulla. Eli tiedosto UTF-8 -muodossa sisään ja ISO-8859-1 -muodossa takaisin tekstitiedostoon. Muuten ihan hyvä, mutta euromerkit menivät tietysti laatikoiksi, kun olisi pitänyt tulostaa euroja ymmärtävässä ISO-8859-15 -muodossa. Nyt alkoi jo näyttää muuten hyvältä, mutta Movable Type väitti yhä HTML-tiedostojen head-osiossa kirjoittelevansa UTF-8 -muodossa. Tämän sai korjattua ronkkimalla Movable Typen konfiguraatiotiedoston (mt-config.cgi) PublishCharset-optiota.

Melkein perillä oltiin jo. Palvelin kertoili edelleen HTTP-vastausten header-osassa paluuviestin tulevan ISO-8859-1 -koodattuna, jolloin euromerkit tulkittiin selaimessa väärin. Tässä tapauksesssa onnekkaasti olin jo päätynyt ihan muista syistä kierrättämään kaikki sivuston sivut php-tulkin kautta, jolloin saatoin asettaa HTTP-headerin lisäämällä kaikkien sivupohjien aivan alkuun seuraavan php-komennon:

<?php if(!headers_sent()){
header('Content-Type: text/html;charset=ISO-8859-15');
}?>

Tämä rivi pitää siis olla ennen kuin php-skriptissä tulostetaan yhtään merkkiä vastausdokumenttiin (muuten HTTP-header on jo lähetetty, eikä sitä voi muuttaa). Jep, nyt oli ääkkösongelma hoidettu. Jälkikäteen ajateltuna olisin päässyt helpommalla, kun olisin heti tajunnut muuttaa tuon enkoodauksen UTF-8-muotoon tuolla yllä esitetyllä tavalla.

Entäpä kuvat ja muut sivustolle kertyneet tiedostot sitten? TypePad ei tarjoa mitään tapaa ottaa suoraan varmuuskopio kaikesta omalla sivustolla olevasta tavarasta, mutta kaikki mihin on linkki jostain oman pääsivuun linkitetyn sivuston sivulta voidaan hakea wget-ohjelman avulla. Jos satut olemaan Windows-käyttäjä, eikä koneeltasi wget-ohjelmaa vielä löydy, niin Windows-binääri löytyy esim. osoitteesta http://xoomer.virgilio.it/hherold/. Ohjeita wgetin varmuuskopiointikäyttöön löytyy vaikkapa Jim Robertsin sivustolta. Jos haluat olla kiltti palveluntarjoajallesi, niin muista w-optio (wait). Muista myös, ettei wget mitenkään voi tietää muista kuin sellaisista tiedostoista, joihin on jostain sivultasin linkki (a href tai img src).

TypePad luo integroitujen kuvatiedostojen popup-ikkunat erityisen kuvapalvelimen avulla, jolloin kuvat ovat linkkejä muotoa:

http://oma.typepad.com/.shared/image.html?/photos/uncategorized/joku_kuva.jpg

Näiden kanssa wgetillä tulee hieman ongelmia, sillä palautettava tiedosto on html-sivu, eikä pelkkä kuvatiedosto. Ainakin itselläni tuli näiden kanssa omalle koneelleni tulokseksi vain lähinnä sotkuisia tiedostonimiä. Lopulta ladatut kuva- ja muut tiedostot täytyy jollain keinoin siirtää uudelle palvelimelle.


Tähän kirjoitukseen voi viitata TrackBack-osoitteella: http://kuvitelmaa.net/cgi-bin/mt/mt-tb.cgi/213

Jätä kommentti


Kuukausiarkistot

Syötteet (feeds)

Creative Commons License
Tämän blogin sisältöön sovelletaan Creative Commons lisenssiä.

Kiitokset

Spämmitorjunnan tarjoaa Akismet

Flickr-integrointi: phpFlickr

Jaiku-integrointi: Services_JSON

Sirkusta pyörittää Movable Type Open Source (MTOS) 4.1

Valid XHTML 1.0 Strict Valid CSS!

µblogi@Jaiku Jaiku-virran Atom-syöte

Ei Jaikuja viimeisen kahden vuorokauden aikana.

Muualta poimittua Atom-syöte

Kiinnostavia keikkoja Atom-syöte

Valinnat: Ilkka Rinne ja Anna Ruhala

    Muita musiikitapahtumia: Meteli.net/Helsinki

    Täyskokoiseen kalenteriin
    Miten kummassa Google Kalenterista saa tapahtumia tällä lailla ulos?