Sprachgesteuerte Alltagshelfer waren früher Science-Fiction. Heute erobern Sprachassistenten den Haushalt – und den Journalismus. | Foto: complize
Sprachgesteuerte Alltagshelfer waren früher Science-Fiction. Heute erobern Sprachassistenten den Haushalt – und den Journalismus. | Foto: complize
 
THEMA | Smartspeaker

Das neue Hören

Smartspeaker eröffnen neue Möglichkeiten für Medien und Pressestellen
13. Juni 2018, Bettina Blaß

Mit der Stimme Geräte wie Licht, Heizung oder eben auch Computer steuern – das galt lange als ferne Zukunftsmusik. Dank digitaler Sprachassistenten ist inzwischen das möglich – und noch viel mehr. Auf dem Smartphone gibt es sie schon seit einigen Jahren: Siri etwa, die Sprachassistentin von Apple, schickt eine Kurznachricht per Stimmbefehl oder öffnet eine bestimmte App. Mit den sogenannten Smartspeakern, die sich ebenfalls per Sprachbefehl steuern lassen, erweitern sich die Möglichkeiten. Sie führen die intelligente Spracherkennung mit einem Lautsprecher zusammen und öffnen so neue Wege und Vertriebskanäle für den Journalismus.

Smartspeaker gibt es von verschiedenen Anbietern, unter anderem von Google, neuerdings auch von Apple – und von Amazon. Das Gerät des Onlineversandhändlers heißt Echo, ist aber besser unter dem Namen „Alexa“ bekannt. Denn der Name der Sprachassistentin aktiviert das Gerät, um eine Anfrage zu starten. Damit die Smartspeaker ihre Aufgaben erfüllen können, muss der Nutzer aber zunächst kleine Hilfsprogramme installieren – ähnlich wie beim Smartphone, das Apps benötigt, um Bilder zu bearbeiten oder im sozialen Netzwerk zu stöbern. Diese Hilfsprogramme heißen bei Alexa „Skill“, bei Google „Action“.

Gelesene Schlagzeilen

„Alexa, die Zusammenfassung“ ist beispielsweise ein Befehl für Amazon Echo, der eine tägliche Nachrichtenzusammenfassung startet. Und hier kommt der Journalismus ins Spiel: Denn in der Regel werden Schlagzeilen aus dem Internet vorgelesen. Für Journalistinnen und Journalisten ist das aus zwei Perspektiven interessant: als Nutzer und als Produzenten. Für Medienhäuser entsteht ein zusätzlicher Ausspielweg für ihre journalistischen Produkte. Allerdings erfordert der neue Kanal auch eigene Formen, ähnlich wie etwa der „Messenger Journalismus“ (vgl. JOURNAL 6/16) via WhatsApp oder Facebook Messenger.

Die Worte „Alexa, die Zusammenfassung“ entlocken dem Smartspeaker die Schlagzeilen. Die Lichtleiste oben zeigt, dass das Gerät aktiviert ist. | Foto: Bettina Blaß
Die Worte „Alexa, die Zusammenfassung“ entlocken dem Smartspeaker die Schlagzeilen. Die Lichtleiste oben zeigt, dass das Gerät aktiviert ist. | Foto: Bettina Blaß

So wie die Nutzer dabei „ihre“ Nachrichtenmarken abonnieren müssen oder wie sie Nachrichten-Apps auf ihren Mobilgeräten installieren, muss auch die Besitzerin oder der Besitzer eines Smartspeakers vorab festlegen, wer in der Nachrichtenzusammenfassung zu Wort kommen soll. Das Menu auf dem Smartphone bietet eine Auswahl unter anderem von Zeitungen, TV- und Radiosendern, von Nachrichtenseiten oder Blogs, von Unternehmen und Institutionen. Wer in den Angeboten der Kategorie „Nachrichten“ sucht, findet dort zum Beispiel BILD, Heise online oder das Handelsblatt. Mit dabei sind allerdings auch Anbieter, die man eher nicht mit dem Begriff Nachrichten assoziiert: Borussia Dortmund beispielsweise, die CDU Neuss oder die AfD. Täglich kommen neue Anbieter hinzu.

Echo und Co.

Amazons Echo ist nur einer von vielen Smartspeakern. Laut Statista Global Consumer Survey von Anfang 2018 ist er allerdings in den USA und in Deutschland am weitesten verbreitet. Alternative Anbieter sind Google, Apple oder Microsoft. Bei Google heißt der intelligente Lautsprecher Google Home, bei Apple Homepod. Letzterer ist im Frühjahr 2018 noch nicht in Deutschland erhältlich. Der günstigste Smartspeaker kostet etwa 50 Euro, der Homepod von Apple wird mehr als 300 Euro kosten. Sprachsteuerung generell wird derzeit hauptsächlich von jungen Menschen angewendet: 70 Prozent der 14- bis 29-Jährigen nutzen sie, um ihr Smartphone zu bedienen, hat eine Bitkom-Studie aus dem Jahr 2017 ergeben. Bei den 30- bis 64-Jährigen sind es rund 60 Prozent.

Nebenbei auf dem Laufenden

Damit bieten Sprachassistenten – unter anderem für Journalistinnen und Journalisten – eine Möglichkeit, sich bequem über ausgewählte Themen auf dem Laufenden zu halten, und das sogar ohne zusätzlichen Zeitaufwand. So erklärt Sebastian Matthes, Stellvertretender Chefredakteur und Head of Digital beim Handelsblatt: „Mit Audio-Inhalten können wir die Nutzer auch erreichen, wenn sie keine Bildschirme bedienen können: im Auto oder beim Kochen zum Beispiel.“ Smartspeaker sind also wie das Radio ein klassisches „Double-your-time“-Medium: Während man mit einer Sache beschäftigt ist, die das Gehirn nicht besonders fordert, kann man durch Hören gleichzeitig Informationen aufnehmen.

Wer allerdings Nachrichten-Skills zu vieler Anbieter abonniert, läuft Gefahr, in einer Informationsflut unterzugehen. Das gilt insbesondere, wenn es sich hauptsächlich um computergesprochene Schlagzeilen handelt. Hier verliert der Zuhörer leicht den Überblick, wessen Nachrichten er oder sie gerade hört, denn die eigentlich so wichtige Marke wird nur einmal kurz zu Beginn genannt, und die Computerstimme ist monoton.

Nicht fürs Hören geschrieben

Es gibt einen weiteren Grund, warum die Nachrichtenzusammenfassungen oft nicht dem entsprechen, was Zuhörer von Qualitätsmedien erwarten: Verlesen werden Schlagzeilen oder auch Teaser von der Homepage, die nicht fürs Hören geschrieben sind.

Wie wenig befriedigend das oft ist, zeigt eine kleine Auswahl an Meldungen vom 8. Mai 2018. So heißt es im Skill der Wirtschaftswoche: „Meist dauert es nach der Abgabe mehr als sechs Wochen bis zum Steuerbescheid. Welche Finanzämter das schneller schaffen und was Steuerzahler tun können, um die Bearbeitung zu beschleunigen.“ Und dann kommt die nächste Meldung. Ein typisches Beispiel dafür, wie Nachrichten auf Alexa nicht funktionieren können. Denn dieser Homepage-Teaser soll Leserinnen und Leser zum Klick auf einen weiterführenden Link verführen. Der Hörer am Smartspeaker bleibt dagegen ratlos zurück, weil das Versprechen nicht eingelöst wird und er zumindest derzeit per Sprachsteuerung keine Möglichkeit hat, an weiterführende Inhalte zu kommen.

Ähnlich lässt die FAZ den Hörer in der Luft hängen: „Deutschland fehlen 45 000 Lastwagenfahrer: Die Wirtschaft brummt, der Onlinehandel wächst. Beides erhöht die Nachfrage nach Transportkapazität. Speditionen aber fehlen die Fahrer. Was hilft …“ Genau das wird dem Zuhörer leider nicht verraten. Auch die Rheinische Post hatte an diesem Tag eine Schlagzeile in der Alexa-Zusammenfassung, die im Netz zum Weiterklicken animieren sollte: „Dramatisches Video zeigt, wie schnell sich die Lava ausbreitet“.

Solche Schlagzeilen und Teaser informieren nicht und bieten keinen Mehrwert, sie sind ein Stück verlorene Zeit. Trotz dieser offensichtlichen Nachteile lassen viele Medien in ihren Skills immer noch automatisiert solche Onlineteaser verlesen. Die erwähnten eigenen – für diesen Vertriebskanal geeigneten – Formen fangen an, sich herauszubilden. Der Prozess dauert an.

Kongruente Inhalte und neue Vertriebswege

Die alte Aufteilung in Print, Rundfunk und Online wird in Zeiten wachsender Kongruenz immer brüchiger. Zunehmend wildern alle Mediengattungen im Feld der jeweils anderen. Für TV- und Hörfunksender ist Text ein wichtiges Mittel, um das Publikum nicht-linear zu erreichen und überhaupt im Netz gefunden zu werden, denn mit ­gestreamten klassischen Rundfunkinhalten tun die Such­maschinen sich schwer. Soweit es sich um öffentlich-rechtliche Sender handelt, stufen Verlagshäuser und Privatsender diese Onlineaktivitäten als unangemessen umfangreich ein und haben wiederholt geklagt. Die Verlage wiederum setzen zunehmend auf ­Bewegtbild und Podcasts –
bis hin zur mög­li­chen Lizenzpflicht durch die ­Medienanstal­ten. Online­medien zu guter Letzt greifen sich aus allen Welten das Beste.

Dabei verlassen sich die Medienhäuser und Redaktionen aller Gattungen immer weniger darauf, dass sie auf ihrem jeweils originären Ausgabeweg gefunden werden – also als gedruckte Zeitung oder Zeitschrift, als Radio- und Fernsehsendung beziehungsweise als Internetseite. Statt dessen wächst die Zahl der Vertriebswege stetig, vor allem seit dem Siegeszug der mobilen End­geräte: Zu Social-Media-Kanälen wie ­Facebook, Twitter, Snapchat, Instagram, Pinterest und Co. sind Newsletter und Morning Briefings hinzugekommen, personalisierte Nachrichten-Bots, WhatsApp und andere Messenger (siehe JOURNAL 6/16). Und aktuell testen experimentierfreudige Redaktionen eben gerade mit Smartspeakern. /cbl

Eigenes Format entwickelt

Etwa beim Handelsblatt: Auch die Wirtschaftszeitung hatte 2017 mit einem einfachen Skill bei Amazon Echo begonnen, aber die Redaktion hat aus den Erfahrungen gelernt: „Einfach nur Teaser vorzulesen wird dauerhaft keinen Nutzer begeistern“, sagt Sebastian Matthes. Darum erstellt die Wirtschaftszeitung jetzt für den Smartspeaker ein eigenes Morning Briefing, das die Hörer kurz und knapp informiert. Ähnlich wie im Radio sind die Nachrichten in sich geschlossen und bieten echten Informationswert. Damit das Morning Briefing die Zuhörer schon am frühen Morgen erreicht, wird es nachts eingesprochen – von Menschen, so dass die eintönige Computerstimme von Alexa entfällt. Bald schon soll es außerdem erweiterte Funktionen geben: Nutzer sollen künftig ihr Handelsblatt-Konto mit dem Skill koppeln können, um beispielsweise Inhalte zu speichern oder sie sich per Sprachbefehl als Mail schicken zu lassen.

Sind bei den Skills vorne mit dabei: Sebastian Matthes vom Handelsblatt (l.), Daniel Fiene von der Rheinischen Post und Schiwa Schlei von WDR Cosmo. | Fotos: Marc-Steffen Unger für Handelsblatt, privat, WDR/Linda Meiers
Sind bei den Skills vorne mit dabei: Sebastian Matthes vom Handelsblatt (l.), Daniel Fiene von der Rheinischen Post und Schiwa Schlei von WDR Cosmo. | Fotos: Marc-Steffen Unger für Handelsblatt, privat, WDR/Linda Meiers

Sehr früh am Morgen beginnt auch die Arbeit bei der Rheinischen Post (RP) in Düsseldorf: Ab 5 Uhr morgens produziert die Redaktion ihren Aufwacher-Podcast als Audio fürs Netz und für Smartphones. Der ist kurze Zeit später auch auf Alexa in der Zusammenfassung verfügbar, im Anschluss an die eher rätselhaften Schlagzeilen. „Wir waren das erste Regionalmedium auf Amazon Echo“, erzählt Daniel Fiene, Redakteur mit dem Schwerpunkt Digitales bei der RP. „Künftig werden wir auch bei Google Home und später auf dem Apple Homepod sein.“

Das Beispiel RP zeigt, dass neue Vertriebswege im Journalismus nicht immer eine endlose Vorlaufzeit und fremde Dienstleister brauchen: Fiene hatte mit einem Entwickler der RP einen Blick auf die Amazon-Echo-Plattform geworfen, die beiden haben ein Skript geschrieben, und fertig war das etwas schlichte Flash Briefing, in dem Alexas Computerstimme die ersten drei Schlagzeilen vorliest. Allerdings findet Daniel Fiene diese Stimme „auf Dauer langweilig“. Und weil man als Printredaktion nicht jede Stunde aktuelle Nachrichten einsprechen kann, hat man sich entschlossen, den jeweils tagesaktuell produzierten Podcast an die automatisierten Schlagzeilen dranzuhängen. Das soll jedoch wie beim Handelsblatt nicht das Ende der Möglichkeiten sein: „Irgendwann in der Zukunft werden wir einen RP-Newsbot haben, der dem Zuhörer genau die Informationen gibt, nach denen er fragt“, ist Daniel Fiene überzeugt.

Glossar

Alexa: Sprachassistentin auf Amazon Echo.
Content Management System (CMS): Wird genutzt, um eine Homepage zu betreiben.
Echo: Smartspeaker von Amazon.
Flash Briefing: Kurznachrichten. So werden die Schlagzeilen genannt, die in der ­Zusammenfassung bei Alexa abgerufen werden können.
Newsbot: Personalisierte Nachrichten­such­maschine.
On demand: Auf Nachfrage. Der Nutzer stellt sein eigenes Programm zusammen und ist nicht mehr an einen vom Sender ­erstellten Zeitplan gebunden.
Podcast: Eine Folge von Audiobeiträgen zu einem Thema, die im Internet veröffentlicht werden. Der Nutzer kann sie in der Regel kostenlos abonnieren – etwa über eine entsprechende App auf dem Smartphone.
RSS-Feed: Steht für Really Simple Syndication, eine Technik, um Internetseiten zu abonnieren. Wurde dort ein neuer Beitrag veröffentlicht, wird er automatisch in einem Programm angezeigt, das man RSS-Reader nennt. Solche RSS-Reader sind in alle gängigen Browser integriert.
Text-to-Speech-Software: Ein Programm, das Text automatisch in gesprochene Inhalte umwandelt.
Skill: Hilfsprogramm auf Amazon Echo, analog zur App auf dem Smartphone. Heißt bei Google Home „Action“.
Smartspeaker: Ungefähr: intelligenter Laut­sprecher. Ein Gerät, das häufig wie eine Dose aussieht, Musik abspielen kann und auf Sprachbefehle reagiert.
Sprachassistent: Eine Software, die Sprache erkennt und analysiert. Sie führt Befehle aus und beantwortet Fragen. Sprachassistenten sind auf Smartphones oder in Smartspeakern installiert.
Teaser: Anreißer auf einer Onlineseite.
Voice Enabled Device: Gerät, das sich mit der Stimme aktivieren lässt.

Vorteil Audio-Know-how

Grundsätzlich leichter als Printhäuser haben es natürlich Radiosender mit ihrem Know-how in Sachen Audio, aber auch Fernsehsender. So erklärt Julia Wegeler, Abteilungsleiterin Digital Products bei n-tv: „Wir haben regelmäßig aktuelle Nachrichten-Videos, aus denen wir die Audiospuren nutzen können. Zudem verfügen wir über gute Stimmen und Vertonungsexpertise.“ Der Nachrichtensender mit Sitz in Köln bietet Audioinhalte nicht nur bei Amazon Echo an, sondern auch bei Google Home sowie auf den fahrzeugbasierten Systemen BMW Connected Drive und Ford Sync. Noch verdient n-tv damit allerdings kein Geld. „Langfristig sollten aber natürlich alle unsere Produkte einen vermarktungsrelevanten Nutzen haben.“

Der neue Vertriebskanal ist auch für den Loklfunk wichtig, findet Wiebke Breuckmann, Chefredakteurin von Radio Berg. | Foto: privat

Da den Sendern in der Regel bereits gesprochene und gespeicherte Nachrichten vorliegen, entfällt für sie der Mehraufwand des Einsprechens. Zumindest in der Theorie sollten sie darum auch nicht auf Computerstimmen zurückgreifen müssen. Trotzdem passiert genau das bei Radio Berg. Der Radiosender stellt wie einige andere Lokalradios ein Angebot für die Nachrichtenzusammenfassung auf Alexa zur Verfügung. Aber: „Solange unsere Nachrichten nicht als Podcast gespeichert werden, können wir nur die Schlagzeilen von der Homepage mit Computerstimme vorlesen lassen“, erklärt Chefredakteurin Wiebke Breuckmann.

Die Computerstimme ist für die Redaktion jedoch nur eine Notlösung, denn Alexa kennt zum Beispiel viele Abkürzungen nicht und spricht Ortsnamen falsch aus. So liest Alexa zum Beispiel statt der „IS“ für „islamischer Staat“ regelmäßig „is“ wie das englische Wort für „ist“. Und „DSGVO“, das Kürzel für die Datenschutzgrundverordnung, klingt wie „dschgewo“.

Derzeit arbeitet Radio Berg an einer technisch besseren Homepage. Wenn sie fertig ist, sollen die Audio-Nachrichten gespeichert und später bei Alexa ausgespielt werden. Auch wenn das Angebot jetzt noch nicht perfekt ist, ist das „trotzdem der richtige Weg“, bestätigt Radioexperte Christian Schalt: „Lieber als Lokalradio jetzt mit Computerstimme auf dem Smartspeaker dabei sein und die Marke sichern, als den Anschluss zu verpassen.“ (Siehe auch Interview „Smartspeaker: Chance oder Risiko für den Lokalfunk?“)

„Angst hilft uns nicht weiter“

Wiebke Breuckmann sieht das ganz ähnlich – und empfindet Smartspeaker nicht als die manchmal beschworene Gefahr für die Existenz des Radios: „Angst hilft uns allen nicht weiter“, sagt die Radiofrau. „Mir ist egal, ob die Nutzer uns über Alexa oder ein herkömmliches Radiogerät hören, wichtig ist nur, dass sie Radio Berg einschalten.“ Darum denkt sie auch schon darüber nach, was die Redaktion künftig an zusätzlichen Angeboten liefern kann: „Lokale Blitzermeldungen zum Beispiel. Damit haben wir ein Alleinstellungsmerkmal.“

Auch ein anderer kleiner Sender in NRW möchte die Chancen des neuen Mediums nutzen: Das Domradio ist ein „katholischer Multimediasender mit Special-Interest-Angebot, der nur über eine begrenzte terrestische UKW-Frequenz in Köln verfügt, aber ein Programm für eine Hörerschaft im ganzen deutschsprachigen Raum ansprechen möchte“, erlärt Ralf Walter, Leiter der Onlineredaktion. „Deswegen sind wir immer auf der Suche nach weiteren Ausspielkanälen.“

Natürlich biete man auch einen Livestream über das Nachrichtenportal und sei auf den sozialen Kanälen aktiv, aber: „Nachdem wir mit Reichweiteneinbußen bei Facebook zu kämpfen haben, war es neben anderen Überlegungen ein logischer Schritt, möglichst zeitnah unsere Inhalte auch über Sprachassistenten anzubieten.“ Mit den News aus Kirche und Gesellschaft schließe man eine Marktlücke und hoffe, eine neue Hörerschaft zu erreichen. Im April ist übrigens der zweite Skill des Domradios veröffentlicht worden: „Das Evangelium“ ist eine tägliche Bibellesung mit zugehörigem Gespräch.

Künftig, so Walter, möchte das Domradio auch auf den Geräten von Google und Apple vertreten sein. „Wir haben aber nur begrenzte Mittel und sind werbefrei, darum konzentrieren wir uns zunächst auf den Marktführer.“ Der tägliche Zeitaufwand für die Ausstrahlung auf Alexa ist auch hier überschaubar: „Wir passen die Lautstärke der Audiodatei an und legen das mp3-Dokument in unserem Content-Management-System an. Der Alexa-Skill greift dann auf einen RSS-Feed zu, der automatisch die neuesten Beiträge anzeigt“, erklärt Ralf Walter. „Unterm Strich ist das pro Skill eine Viertelstunde Mehraufwand am Tag.“ Damit erreiche man zurzeit geschätzt etwa 200 Hörer. Geplant ist für die Zukunft auch eine Live-Gottesdienst-Übertragung aus dem Kölner Dom.

Natürlich sind die Großen dabei

Auf dem Smartphone oder dem Tablet können User auswählen, welche Skills der Smartspeaker auf Sprachbefehl abspielen soll. | screenshot
Auf dem Smartphone oder dem Tablet können User auswählen, welche Skills der Smartspeaker auf Sprachbefehl abspielen soll. | screenshot

Neben solchen kleinen Anbietern sind auch viele der ganz Großen mit dabei: die „Tagesschau in 100 Sekunden“ zum Beispiel von Anfang an. Sie ist auch auf Google Home vertreten und wird künftig auf dem angekündigten Sprachassistenten der Telekom verfügbar sein. „‚Die Tagesschau in 100 Sekunden‘ hören sich jeden Tag bis zu 100 000 Menschen an – besonders morgens zwischen sechs und sieben Uhr“, sagt Andreas Lützkendorf, leitender Redakteur ARD-aktuell. „Neuerdings gibt es für Alexa auch die ‚Tagesschau um 20 Uhr‘, die Tagesthemen oder die ‚Tagesschau vor 20 Jahren‘.“

Wie bei den meisten Anbietern war das so genannte Flash Briefing schnell gemacht: „Beim ersten Mal war einer unserer Webmaster etwa drei Stunden damit beschäftigt“, so Lützkendorf. Der neue Skill sei etwas aufwändiger gewesen: „Daran hat ein Team von vier Kollegen mehrere Wochen gearbeitet.“

Öffentlich-rechtliche Sender wie der WDR experimentieren ebenfalls mit Vertriebskanälen (siehe Markierung). Hinweise auf Alexa-Skills sind auf Webseiten bisher aber nicht zu finden. | screenshot
Öffentlich-rechtliche Sender wie der WDR experimentieren ebenfalls mit Vertriebskanälen (siehe Markierung). Hinweise auf Alexa-Skills sind auf Webseiten bisher aber nicht zu finden. | screenshot

Auch der WDR ist mit mehreren Skills auf Alexa vertreten: etwa „WDR aktuell“, „WDR Verkehr“ oder „WDR 2 Stichtag“. „Man kann die Smartspeaker nicht einfach ignorieren“, sagt Schiwa Schlei, stellvertretende Leiterin Digitale Programm- und Produktentwicklung und Leiterin der Arbeitsgruppe Sprachsteuerungssysteme beim WDR. „Sie sind eine Möglichkeit, neue Zielgruppen zu erschließen.“ Künftig wolle man noch mehr anbieten: „Schließlich sollen wir als öffentlich-rechtlicher Rundfunk zu Information, Bildung, Beratung, Kultur und Unterhaltung einen Beitrag zur Sicherung der Meinungsvielfalt leisten. Die Bürger zahlen Rundfunkgebühr und haben somit das Recht, unsere Inhalte auf allen Kanälen abrufen zu können.“

Darum will der WDR künftig auch auf mehreren Geräten verfügbar sein: „Auf Google Home sind wir zum Beispiel mit dem KiRaKa-Klicker, den Nachrichten für Kinder“, erzählt Schlei. „Dort waren wir das erste Angebot dieser Art.“ Auch mit Apple stehe man bereits im Gespräch, um bei der Einführung des Homepod von Anfang an Inhalte dort ausspielen zu können. Derzeit arbeite man außerdem an einem Skill-Konzept für die Umsetzung der Radio-Hörspiele.

Sprachassistenten im PR-Einsatz

Neben den Medienhäusern und Rundfunkanstalten experimentieren auch PR-Kollegen mit Smartspeakern. So hat zum Beispiel Bitkom, der Bundesverband Informationswirtschaft, Telekommunikation und neue Medien in Berlin, zwei Skills bei Alexa im Angebot. „Wir sind überzeugt, dass Sprachassistenten eine neue Schnittstelle zwischen Mensch und Internet darstellen, deren Bedeutung in den kommenden Jahren deutlich zunehmen wird“, sagt Pressesprecher Andreas Streim, bei Bitkom für die Verbandsnachrichten auf Alexa verantwortlich.

In einem der beiden Bitkom-Skills verliest die Computerstimme die jeweils aktuelle Pressemitteilung. Ein solcher Beitrag ist natürlich deutlich länger als die Schlagzeilen der Medien. Wer den Text zu lang findet, kann mit dem Befehl „Alexa, weiter“ zur nächsten Meldung springen.

Verbände wie Bitkom machen ihre Pressearbeit über verschiedene Kanäle für jederman zugänglich. | screenshot
Verbände wie Bitkom machen ihre Pressearbeit über verschiedene Kanäle für jederman zugänglich. | screenshot
Smartspeaker: Chance oder Risiko für den Lokalfunk?

Christian Schalt berät mit seiner Firma Next Level Audio Radiosender und ist unter anderem mit dem Lokalfunk NRW vertraut.

JOURNAL: Warum sollten Lokalradios auf Alexa und Co. vertreten sein?
Christian Schalt: Die Smartspeaker verbreiten sich mit ungeheurer Geschwindigkeit, und es zeigt sich, dass dort vor allem Nachrichten und Musik konsumiert werden. Wer von Anfang an dabei ist, kann seine Marke sichern. Dafür ist allerdings wichtig, dass Lokalradios ihre Stärke, nämlich die lokalen Nachrichten, weiter in den Fokus rücken, um unverwechselbar und unverzichtbar auch auf den Smartspeakern zu sein.

JOURNAL: Wie aufwändig ist das?
Schalt: Zu Beginn kaum: Die Technik ist nicht teuer, eine Agentur wird vermutlich für den Skill ein Honorar im unteren vierstelligen Bereich verlangen. Außerdem funktioniert das Geschäftsmodell Werbung für die Lokalsender – zumindest so lange, bis Amazon und Co. es vielleicht irgendwann einschränken werden. Lokalradiosender, die mehr erreichen wollen, müssen allerdings etwas höheren Aufwand betreiben: Sie müssen sich mit dem Nutzerverhalten aus-einandersetzen, um zu erfahren, was die Hörer an den Smartspeakern tatsächlich wollen, und für diese dann zielgruppengenau Inhalte anbieten.

JOURNAL: Sind Smartspeaker eine Chance für Radiosender?
Schalt: Sie sind eine Riesenchance, weil Radio selten in den vergangenen Jahren das Glück hatte, dass ein neues Gerät in die Haushalte einzieht, mit dem man ganz einfach sehr viele Radiosender aus der ganzen Welt empfangen kann. Aktuelle Statistiken zeigen überdies, dass mehr Radio gehört wird, seit es diese Geräte gibt. Aber sie sind auch ein großes Risiko, weil Radiosender längst nicht mehr die einzigen sind, die Hörbeiträge anbieten: Auch Printmedien machen Audio, Blogs, PR-Abteilungen – und Amazon oder Apple sind zusätzliche Konkurrenz geworden. Die Torte wird also deutlich größer, die einzelnen Stücke aber kleiner. Wer sich jetzt allerdings nicht auf die neuen Kanäle einlässt, wird am Ende von der Torte überhaupt nichts abbekommen./bb

Texte fürs Hören anpassen

Ähnlich wie die RP hat Bitkom den Alexa-Skill ohne Agentur erstellt, denn Andreas Streim programmiert seit vielen Jahren selbst: „Dadurch hatten wir keine Entwicklungskosten.“ Presseinformationen erstelle man sowieso nahezu täglich, so dass sich der zusätzliche Aufwand in Grenzen hält. „Darum nutzen wir übrigens auch die Spracherzeugung von Alexa und sprechen die Infos nicht selbst ein“, erklärt Streim. „Die Presseinformation wird allerdings gekürzt. Außerdem ersetzen wir bestimmte Formulierungen für das Vorlesen: In unseren Presseinformationen schreiben wir zum Beispiel ‚rund ein Drittel der Deutschen (31 Prozent)’, für den Skill wird die Klammer mit den Prozentangaben entfernt.“ Der Grund: Es klingt nicht gut, wenn es genau so wiedergegeben wird, wie es fürs Lesen geschrieben wurde.

Dieser Hinweis ist übrigens auch von Bedeutung, wenn es um Rechtschreibfehler oder Buchstabendreher geht: Die digitalen Sprachassistenten lesen genau das, was man vorgibt. Während der Leser einen Tippfehler schnell erkennt und im Geist oft korrigiert, ist es für den Hörer viel schwieriger, ein ihm unbekanntes Wort im Kontext des Gehörten zu interpretieren.

Die Presseinformationen von Bitkom werden übrigens schon lange nicht mehr nur für Journalisten geschrieben, auch wenn der Name das vermuten lässt. So wie jeder die Social-Media-Aktivitäten des Verbands verfolgen kann, ist jetzt auch der entsprechende Skill für Alexa zum allgemeinen Download verfügbar.

Ähnlich ist es mit den Informationen von Parteien und Unternehmen: Sie sind längst nicht mehr darauf angewiesen, dass Journalisten darüber entscheiden, was zu einer Nachricht wird und was nicht. Mit den digitalen Sprachassistenten rücken sie jetzt noch ein Stück näher an den Medienkonsumenten und werden damit durchaus zur Konkurrenz für Verlagshäuser und Rundfunksender (siehe Interview mit Christian Schalt, „Smartspeaker: Chance oder Risiko für den Lokalfunk?“). Zudem können sie ihre Sichtweise direkt an die Menschen bringen – ohne den zwischengeschalteten Filter der Medien, die Aussagen im besten Fall kritisch bewerten und analysieren.

Bitkom hatte im ersten Quartal 2018 pro Tag immerhin fast 250 Besucher („unique user“) – und das, ohne je für das Angebot geworben zu haben. „Für die Zukunft denken wir über zusätzliche Inhalte jenseits der Pressemitteilungen nach“, sagt Streim. „Das kann unsere ‚Zahl der Woche‘ sein oder ein kurzer O-Ton zu einem aktuellen Ereignis.“ Der zweite Skill des Verbands heißt übrigens „Die Digitalexperten“. „Dort kann der Nutzer Fragen stellen wie ‚Was denken Lehrer über Startups?‘ Er bekommt dann ausgewählte Informationen aus unseren Studien zum Thema“, erklärt Andreas Streim. „Bisher ist das aber eher eine experimentelle Spielerei.“

Ein Plus an Barrierefreiheit

Auch die Daimler AG ist auf Alexa vertreten, und zwar mit dem Daimler-Blog, einem Skill für das Blog der Mercedes-Benz-Bank und einem Skill für Mercedes-Benz selbst. Uwe Knaus aus der Kommunikationsabteilung des Konzerns begleitet das Daimler-Blog seit dem Start im Oktober 2007: „Von Anfang an hat Barrierefreiheit dabei eine große Rolle für uns gespielt“, sagt er. „Smartspeaker wie Amazon Echo sind eine gute Erfindung für alle die Menschen, die Leseschwierigkeiten haben. Sie können sich jetzt unsere Blogbeiträge vorlesen lassen“, so Knaus.

Daimler lässt unter anderem Blogbeiträge verlesen – und bietet so Barrierefreiheit. | screenshot
Daimler lässt unter anderem Blogbeiträge verlesen – und bietet so Barrierefreiheit. | screenshot

Die Anregung dazu kam von Narando, der Vorleseplattform, mit der Daimler zusammenarbeitet. Dort hatte man die Kommentare der Kunden ausgewertet und war auf die Idee gekommen, die Audiostücke auch auf Amazon Echo anzubieten. Sie werden schon seit Frühjahr 2016 von echten Menschen eingesprochen. Keine Computerstimme zu nehmen sei dem Unternehmen wichtig, sagt Knaus, „denn die menschliche Stimme löst Emotionen aus und bietet einen Wiedererkennungswert“.

Chance für kleinere Blogs

Auch erste kleinere Blogs setzen auf den zusätzlichen Vertriebskanal, so etwa Udo Vetter mit seinem Law Blog, einem bekannten juristischen Weblog, unter anderem zu den Rechtsgebieten IT-Recht und Geistiges Eigentum. Oder Georg Watzlawek mit seinem lokaljournalistischen Bürgerportal Bergisch Gladbach, das überall dort sein will, „wo die Menschen sind“. Neu sei lediglich, dass das Ausgabemedium gesprochene Sprache und nicht Text sei. Doch wer sich die Jugend anschaue, sehe, wie sich das Nutzungsverhalten verändert. „Darum müssen Informationen auf Smartspeakern ein Teil unseres Gesamtangebots sein“, sagt Watzlawek. Bisher ist das Bürgerportal noch in einer Art Betaphase auf Amazon Echo: „Uns kann man dort erst seit etwa drei Monaten hören“, erzählt Georg Watzlawek. „Wir wollen demnächst eine Umfrage starten, um herauszufinden, was genau die eigene Zielgruppe über die Smartspeaker hören möchte – und vor allem auch zu welcher Uhrzeit.“ Wesentliche Informationen, um zielgruppengenaue Angebote zu liefern.

Auf dem Smartspeaker abrufbar: das Lawblog von Udo Vetter. | screenshot
Auf dem Smartspeaker abrufbar: das Lawblog von Udo Vetter. | screenshot

Watzlawek und sein Team legen großen Wert auf die Aktualität ihres Angebots: „Unser CvD achtet darauf, dass abends keine Schlagzeilen mehr ausgespielt werden, die längst überholt sind und auch auf anderen Kanälen waren“, sagt er. „Es sind die lokalen Inhalte, die das Bürgerportal Bergisch Gladbach von anderen Anbietern unterscheidet. Unsere Nachrichten bekommt man auf keiner anderen Webseite.“

Zum Wochenende bietet die Redaktion übrigens schon längere Stücke auf Alexa an und denkt darüber nach, das auch unter der Woche regelmäßig zu machen – so, wie es der Daimler Blog und Bitkom heute schon praktizieren.

„Automatisiert produzierte Alexa-Skills werden nicht erfolgreich sein“

Alexander Trommen ist CEO von APPSfactory, Leipzig, einer Spezialagentur für die Konzeption und Entwicklung von Applikationen für Smartphones, Tablets, Smart Watches und Smart TV.

JOURNAL: Viele Tageszeitungen bieten Skills für Alexa an. Ist das sinnvoll?
Alexander Trommen: Sprache ist die natürlichste Kommunikationsform und wird die Tastatur und die Maus zum Teil ersetzen. Geht es um Alexa als Ausgabemedium für Audioinhalte, haben Lokalredaktionen zunächst das Problem, dass sie Meldungstexte, aber keine professionell gesprochenen Audiobeiträge haben. Allerdings werden Audiobeiträge genutzt, wie man beispielsweise an der Renaissance der Podcasts sieht. Fraglich ist für mich aber, ob sich Lokalzeitungen, die oft nicht einmal genügend Videocontent erstellen, um als lokale Newsquelle mithalten zu können, jetzt zusätzlich in die Produktion von Audioinhalten investieren sollten. Dagegen spricht zum Beispiel, dass sie bei Videos hervorragende Monetarisierungsmöglichkeiten haben, bei Alexa bisher nicht. Davon abgesehen sollte man in neue Technologien wie Alexa nur investieren, wenn man eine Strategie hat. Außerdem braucht man die Bereitschaft, zwei bis drei Jahre so viel zu investieren, dass sich der so genannte Early-Mover-Vorteil auch auszahlt. Lokalzeitungen, die ohne Budget und Strategie bei Alexa dabei sein wollen, erinnern mich an App-Projekte vieler Buchverlage, bei denen ohne übergreifende Strategie bestehende Inhalte in neue Kanäle gefüllt wurden. Die Verlage wunderten sich darüber, dass das keinen kommerziellen Erfolg brachte. Mich wundert das nicht.

JOURNAL: Wenn Lokalzeitungen dabei sein wollen, lohnt es sich dann, auf einen professionellen Sprecher zu setzen?
Trommen: Ja, auf jeden Fall. Kein erfolgreicher Hörbuchverlag würde auf die Idee kommen, ein Buch durch eine Text-to-Speech-Software laufen zu lassen und das Ergebnis als Hörbuch zu verkaufen. Warum? Weil jedes Medium eine eigene, speziell angepasste Darstellung oder Dramaturgie braucht. Ohne verschiedene Sprache und Betonung sowie Geräusche wäre ein Hörbuch nur halb so unterhaltsam. Ein automatisiert produzierter Alexa Skill wird genau so wenig erfolgreich sein wie ein automatisiert produziertes Hörbuch.

JOURNAL: Brauchen wir noch Text, wenn wir alle Inhalte vorgelesen bekommen? Und benötigen wir noch Radio, wenn alle Medien jetzt auf Sprache setzen?
Trommen: Seit wir das Internet haben, verändert sich die Mediennutzung wie wahrscheinlich nie zuvor. Bisher hat aber noch kein neues Medium ein anderes ersetzt. Fernsehen hat zum Beispiel das Radio nicht ersetzt, weil es eine andere Nutzungssituation erfordert. Auch wird Audio Text nicht ersetzen, denn Text kann man in der U-Bahn oder im Büro lautlos konsumieren. Viel entscheidender für Fernsehen und Radio ist der Wandel von linearer Unterhaltung zu On-Demand-Medienkonsum. Über 50 Prozent aller Deutschen nutzen bereits heute Video-on-Demand-Services./bb

In Text- und in Voice-Inhalten denken

Neue Medien haben immer auch einen Einfluss auf das Nutzerverhalten. Wer hätte vor einigen Jahren gedacht, dass es normal sein würde, in der Bahn oder im Bus Nachrichten aus dem Internet zu konsumieren? So werden auch die Smartspeaker Einfluss darauf nehmen, wie Hörer Medien rezipieren: „Die neuen Assistenten werden verändern, wie Nutzer mit Informationen interagieren.“ Davon ist Sebastian Matthes vom Handelsblatt überzeugt. „Wir Journalisten müssen verstehen, welche Inhalte sich die Nutzer auf diesen Plattformen wünschen. Es ist ein bisschen so wie am Beginn das mobilen Zeitalters, als Medien ihre Websites völlig neu gestalten mussten. Bei vielen Medien werden Journalisten künftig in Text- und in Voice-Inhalten denken müssen.“

Auch die Redaktionen, die schon Sprachinhalte produzieren, müssen sich auf andere Zeiten einstellen: „Natürlich wird unser Live-Radiovollprogramm die Menschen weiterhin zu jeder Tageszeit begleiten“, sagt Ralf Walter vom Domradio. „Ich bin aber überzeugt, dass Sender heute die Menschen da abholen müssen, wo sie sind. Das heißt, wir müssen vor allem mobile Angebote und Angebote on demand machen: Die Menschen möchten Nachrichten hören, wenn sie Zeit dafür haben, nicht unbedingt, wenn wir sie ausstrahlen. Ihre Bedürfnisse können dabei sehr individuell sein.“

Um die Menschen abzuholen, wo sie sind, setzt das Domradio auf zahlreiche Vertriebskanäle, auch auf den Smartspeaker. | screenshot
Um die Menschen abzuholen, wo sie sind, setzt das Domradio auf zahlreiche Vertriebskanäle, auch auf den Smartspeaker. | screenshot

Individualität ist auch das Stichwort von ARD-aktuell-Redakteur Andreas Lützkendorf: „Die Voice Enabled Devices werden so verbreitet sein wie Smartphones und clever genug, ihren Nutzer an der Stimme zu erkennen. Der Nutzer wird kontextbezogene, auf ihn zugeschnittene Informationen erwarten. Also runtergebrochen auf die Tagesschau: Nicht mehr eine ganze Sendung, sondern einzelne Themen, vielleicht sogar einzelne neue Aspekte eines Themas“, prognostiziert Lützkendorf. „Es ist Aufgabe der Medienanbieter, auch der Radio- und Fernsehsender, ihre Inhalte zusätzlich für Sprachassistenten nutzbar und vor allem auffindbar zu machen. Viele Anbieter werden jedoch professionellere Audios produzieren müssen, als das bisher der Fall ist.“

Audio ist nicht gleich Audio

Schiwa Schlei vom WDR geht noch einen Schritt weiter: „Wir müssen davon abkommen, Radio, Podcast und jetzt die Smartspeaker als identisches Medium zu begreifen, nur weil dort überall Audio zu hören ist“, sagt sie. Vielmehr sei es so, dass längst nicht jedes Radiostück als Podcast tauge und nicht jeder Podcast für die Smartspeaker geeignet sei. „Deshalb haben wir beim WDR ein Smartspeaker-Expertenteam gegründet: Wir überlegen einerseits, welchen Content wir mit den Redaktionen anbieten können, andererseits versuchen wir herauszufinden, was die Smartspeaker-Nutzer von uns dort hören wollen.“

Abonnieren kann man die Skills auch über die Amazon-Seite (hier am Beispiel des Bürgerportals Bergisch Gladbach). | screenshot
Abonnieren kann man die Skills auch über die Amazon-Seite (hier am Beispiel des Bürgerportals Bergisch Gladbach). | screenshot

Daimler-Mann Uwe Knaus und Georg Watzlawek vom Bürgerportal Bergisch Gladbach sind sich in einem anderen Punkt einig: Die Homepage verliert immer mehr an Bedeutung. „Wir sollten wegkommen von diesem Schubladendenken: Radio oder Online“, sagt Watzlawek. Für sein Bürgerportal Bergisch Gladbach sind der Newsletter und WhatsApp zunehmend wichtig, „digitale Kanäle, die es früher nicht gab, und für die man jetzt die passenden Inhalte produzieren muss“.

Ähnlich sieht es auch Daniel Fiene von der Rheinischen Post. Deren Podcast geht jeden Morgen an 15 000 Nutzer, 8 000 hören ihn über WhatsApp. „Soweit sind wir mit Amazon Echo noch nicht“, sagt er. „Aber ganz klar ist, dass Audio mobil eine immer größere Rolle spielt.“ Ob als Flash Briefing oder Podcast, zählt dabei aus seiner Sicht erstmal weniger. „Wichtig ist nur, die eigenen Inhalte da anzubieten, wo die Hörer sie haben wollen.“||

 

Ein Beitrag aus JOURNAL 3/18, dem Medien- und Mitgliedermagazin des DJV-NRW, erschienen im Juni 2018.