Das Programm - Markupforum 2012

Check-In

Veranstaltungsraum: Hörsaal 011 (Nobelstraße 10, HdM)

Begrüßung

durch Prof. Dr. Alexander Roos (Rektor der Hochschule der Medien)

Begrüßung

durch Mohamed Zergaoui (Innovimax)

Keynote: XML and the future

The World Wide Web Consortium (W3C) published the specification for the eXtensible Markup Language (XML, not an acronym) in 1998; since then, W3C has produced a wide range of specifications central to XML, including namespaces, xml:id, XLink, XPath, XPointer, Schema, XSLT, XSL-FO, XQuery, and, more recently, SML, XProc, EXI and more. Several pieces of work are coming to a close in 2010. In the future, should the XML Activity at W3C grow again, or shrink? What work should we be doing that we are not? (and what should we not be doing that we are?)

The session will explore work that W3C could consider in the future, and will ask the audience to participate with comments and suggestions. It should be understood that W3C is funded by membership fees, so that the work we can do is limited to what members (both existing and future) might support, but, within that framework, there is a lot of flexibility.

Pause

Im Foyer stehen Getränke und Häppchen zur Stärkung bereit.

Cross-Media Publishing mit XML-Datenbanken

Ein Trend im Bereich der XML-Datenbanken geht zunehmend dahin, komplette Anwendungen ausschließlich mit Hilfe von XQuery, XSLT oder XForms zu entwerfen (Stichwort: XRX-Architektur). Dies funktioniert hervorragend für das Web und wird durch verschiedene Frameworks unterstützt. Die Vorteile liegen auf der Hand: schnelle Erstellung von Prototypen, einfache Vernetzung heterogener Datenbestände, leichte Anpassung an sich ändernde Anforderungen, standardisierter Datenaustausch. Die Entwicklung erfolgt ausschließlich auf der Ebene von XML und verwandten Standards.

Lässt sich dieses Vorgehen jedoch auch auf andere Publikationsmedien übertragen? Am konkreten Beispiel kunstgeschichtlicher bzw. geisteswissenschaftlicher Projekte soll gezeigt werden, wie auf Basis der selben XML-Datenbestände gleichzeitig eine komplexe Web-Applikation und eine anspruchsvolle Printpublikation zu realisieren sind.

Als Vorraussetzung liegen sämtliche Rohdaten, z.B. Transkriptionen, Quellen, sekundäre Texte, Vermessungsdaten oder Bildmaterialien in einer XML-Datenbank, vor und sind über XQuery-Dienste anzusprechen. Web und Print stellen dann nur unterschiedliche Sichten auf die Daten dar und werden mit Hilfe der XML-Technologien (XQuery, XSLT, XSL-FO) umgesetzt. Dabei zeigt sich schnell, wo das Medium Print im Vergleich zum Web an Grenzen stößt. Zudem wirft das Layout mit XSL-FO verschiedenste Probleme auf, die es zu überwinden gilt.

XProc

XProc ist eine auf XML basierende Sprache zur Ablaufsteuerung bei der Validierung, Transformation oder Ausgabe von XML-Dokumenten. Die Sprache bedient sich mehrerer Techniken, welche dann innerhalb einer Pipeline der Reihe nach (als sogenannte "Steps") ausgeführt werden.

Der Referent zeigt die Grundlagen der Sprache sowie praxisnahe Beispiele und die daraus ableitbaren Möglichkeiten zur Optimierung von Arbeitsabläufen in XML-Workflows.

Mittagspause

NoSQL mit XML: Einsatzmöglichkeiten und Vorteile eines dokumentorientieren XML-Repositories

Alternativen zur relationalen Datenhaltung stehen derzeit hoch im Kurs. Insbesondere schemalose, dokumentorientierte Datenbanken bewähren sich mittlerweile in der Persistenz-Schicht von unternehmenskritischen Anwendungen. Neben dem Dateiformat JSON spielt hierbei auch XML eine große Rolle.

Der Referent erläutert die Grundlagen schemaloser, dokumentorientierter Datenbanken. Anhand spezifischer Anwendungsfälle werden die Architektur, Vorteile und Möglichkeiten eines unternehmensweiten XML-Repositories vorgestellt.

Wie der wisssenschaftliche Springer Verlag XML-Daten produziert, weiterverarbeitet und nutzt – Eine XML User Story

Der wissenschaftliche Springer Verlag nutzt XML sowohl zur Layout-unabhängigen Repräsentation von Zeitschriften-, Magazin- und Buchinhalten als auch zur Speicherung und Übermittlung von Produkt-Metadaten sowie zur Spezifikation von Arbeitsschritten und Aufgabenpaketen in seinen Herstellungs-Workflows.

Die Erläuterung der verschiedenen Anwendungsfälle von XML im Verlag sowie die Darstellung der Ansätze bei der Generierung, Weiterverarbeitung und Archivierung von XML-Daten ist Gegenstand des Vortrags.

Pause

Im Foyer stehen Getränke und Häppchen zur Stärkung bereit.

Designregeln im vollautomatischen Publishing

Vollautomatisierte Dokumentgeneratoren gibt es in den vielfältigsten Varianten. Vom Word-Serienbrief angefangen über Report-Generatoren hin zu XSL-FO-Formatierern ist die Bandbreite recht groß. All diese Verfahren haben jedoch einen gemeinsamen Nachteil: schwierige Design-Entscheidungen können nicht oder nur sehr aufwändig, z.B. über Templates, abgebildet werden.

Die Lösung besteht in der Integration von Satzsystem und einer XML-basierten "Layout-Programmiersprache", mit deren Regeln sich beliebig komplexe Dokumente leicht umsetzen lassen.

Die XRX (XForms Rest XQuery) Architektur in der Praxis

Die XRX-Architektur ist eine relative neue Architektur, die vollständig auf XML aufbaut. Für das Frontend kommt XForms zum Einsatz, die Verbindung zur Datenbank wird über eine ReST-Schnittstelle realisiert und XQuery dient zur Abfrage (und Manipulation) von XML-Daten. XRX-Anwendungen werden komplett in der Datenbank gespeichert. Dies erlaubt ein elegantes Deployment und Updating der gesamten Anwendung. Durch die Verzahnung von XQuery und XForms lassen sich komplexe, änderungsflexible Anwendungen komplett in XML realisieren. Da XForms sogar dynamisch mit XQuery erzeugt werden können, lassen sich selbst sehr komplexe Rollen-basierte Views realisieren.

XRX ist noch sehr jung und es existieren bisher nur begrenzte Erfahrungen. Insbesondere der Entwicklungsprozess ist noch mit einigen Problemen behaftet, da die Anwendung i.d.R. entweder relativ aufwendig deployt werden muss oder aber direkt in der Datenbank gearbeitet wird, was die Gefahr von Arbeitsverlusten birgt, wenn ein Fehler die Datenbank beschädigt.

Ende der Veranstaltung

Moderation:

Manuel Montero (data2type GmbH) und Prof. Dr. Marko Hedler (Hochschule der Medien).