Conversie
Vanwege het kleine formaat van eReaders zoals die van BeBook, iRex en Sony is het belangrijk dat de lezer zelf de lettergrootte kan instellen. Om te voorkomen dat daarmee ook maar een deel van de 'pagina' zichtbaar zou zijn en er dus veel gescrolld moet worden is het nodig dat de pagina opnieuw wordt opgebouwd met de nieuwe lettergrootte. Technische term daarvoor is 'text reflow' en dat is bijvoorbeeld niet mogelijk met het PDF formaat. Voor eBooks wordt daarom het ePub formaat steeds belangrijker omdat dit wel text reflow ondersteunt. Het ePub formaat is eigenlijk een ZIP bestand waarin de te tonen tekst en afbeeldingen als XHTML files zijn opgeslagen.
Voor het maken van een ePub bestand vanuit bestaande documenten zijn er diverse mogelijkheden:
- Vanuit MS Word: Hiervoor zijn diverse tools beschikbaar; PageComm heeft ervoor gekozen om Word bestanden eerst automatisch om te zetten naar XML (afhankelijk van de gebruikte Word versie is dat simpel of loopt dat via onze eigen Word parser). Vanuit XML genereren we automatisch het ePub formaat waarbij men kan instellen welke Word stijlen als kop voor het 1e, 2e en 3e niveau van de documentstructuur gebruikt moeten worden. Ook is het type ePub formaat instelbaar (DTbook of OCS/OCF).
- Vanuit XML: Dit is meestal te doen door de documenten om te zetten naar XHTML en deze dan, samen met de vereiste navigatie en beschrijvende bestanden in een ePub bestand samen te voegen. Dat laatste kan PageComm op dezelfde wijze als bij Word automatiseren.
- Vanuit Adobe InDesign: Hiervoor heeft PageComm twee mogelijkheden: gebruiken van de export naar Digital Editions die in InDesign zit of door extractie van tekst en beeld vanuit een InDesign document naar XML. Dat laatste is nodig als de tekst en afbeeldingen in een groot aantal losstaande kaders zijn geplaatst. In beide gevallen zal vaak handmatige aanpassing nodig zijn.
- Vanuit PDF: Dit is de meest lastige situatie, omdat het niet eenvoudig is om tekst en beeld in de juiste volgorde uit een PDF te krijgen. Hiervoor zijn verschillende tools beschikbaar, maar daar is vaak ook handmatig ingrijpen bij nodig. Het is dus altijd beter om de bestanden te gebruiken die als bais voor de aanmaak van de PDF hebben gediend.
- Van een papieren document: Hiervoor is eerst scannen en OCR nodig om de tekst weer in digitale vorm beschikbaar te hebben. Men verliest vaak de structuur (hoofd- en tussenkoppen, tabellen etc.) die dus met de hand weer toegevoegd moet worden voordat de conversie naar ePub kan beginnen. Daarvoor schakelt PageComm gespecialiseerde dienstverleners in.