Diskurse – digital
eBook - ePub

Diskurse – digital

Theorien, Methoden, Anwendungen

  1. 318 Seiten
  2. German
  3. ePUB (handyfreundlich)
  4. Über iOS und Android verfügbar
eBook - ePub

Diskurse – digital

Theorien, Methoden, Anwendungen

Über dieses Buch

Die Diskurslinguistik als relativ neue Teildisziplin der germanistischen Linguistik beschäftigt sich mit der Frage, wie soziale Wirklichkeiten in transtextuell organisierten Einheiten konstruiert werden. Bisher finden dabei noch kaum Texte aus digitalen Medien (z.B. aus Twitter) Berücksichtigung. Ziel ist es, das Programm und das Methodeninventar der Diskurslinguistik in zwei Richtungen zu erweitern: Zum einen sollen die spezifischen Beschreibungskategorien und Analysewerkzeuge für Diskurse in digitalen Medien systematisiert werden. Zum anderen sollen Methoden und Instrumente der Korpuslinguistik und Digital Methods im Hinblick auf die Anforderungen der Diskurslinguistik evaluiert und ausgebaut werden. Die Publikation thematisiert Spezifika digitaler Medien und Plattformen aus diskurslinguistischer Sicht und beschreibt, welche charakteristischen Muster sich aus diesen Spezifika in digitalen Diskursen ergeben. Zudem werden ethische und rechtliche Aspekte bei der Analyse digitaler Diskurse (z.B. Anonymisierung digitaler (Sprach-)Daten) thematisiert. In einem umfassenden Methodenkapitel geben die Autor/-innen zudem einen Überblick über relevante Methoden für digitale Diskursanalysen, deren Einsatz an Fallbeispielen illustriert wird.

Häufig gestellte Fragen

Ja, du kannst dein Abo jederzeit über den Tab Abo in deinen Kontoeinstellungen auf der Perlego-Website kündigen. Dein Abo bleibt bis zum Ende deines aktuellen Abrechnungszeitraums aktiv. Erfahre, wie du dein Abo kündigen kannst.
Derzeit stehen all unsere auf mobile Endgeräte reagierenden ePub-Bücher zum Download über die App zur Verfügung. Die meisten unserer PDFs stehen ebenfalls zum Download bereit; wir arbeiten daran, auch die übrigen PDFs zum Download anzubieten, bei denen dies aktuell noch nicht möglich ist. Weitere Informationen hier.
Perlego bietet zwei Pläne an: Elementar and Erweitert
  • Elementar ist ideal für Lernende und Interessierte, die gerne eine Vielzahl von Themen erkunden. Greife auf die Elementar-Bibliothek mit über 800.000 professionellen Titeln und Bestsellern aus den Bereichen Wirtschaft, Persönlichkeitsentwicklung und Geisteswissenschaften zu. Mit unbegrenzter Lesezeit und Standard-Vorlesefunktion.
  • Erweitert: Perfekt für Fortgeschrittene Studenten und Akademiker, die uneingeschränkten Zugriff benötigen. Schalte über 1,4 Mio. Bücher in Hunderten von Fachgebieten frei. Der Erweitert-Plan enthält außerdem fortgeschrittene Funktionen wie Premium Read Aloud und Research Assistant.
Beide Pläne können monatlich, alle 4 Monate oder jährlich abgerechnet werden.
Wir sind ein Online-Abodienst für Lehrbücher, bei dem du für weniger als den Preis eines einzelnen Buches pro Monat Zugang zu einer ganzen Online-Bibliothek erhältst. Mit über 1 Million Büchern zu über 1.000 verschiedenen Themen haben wir bestimmt alles, was du brauchst! Weitere Informationen hier.
Achte auf das Symbol zum Vorlesen in deinem nächsten Buch, um zu sehen, ob du es dir auch anhören kannst. Bei diesem Tool wird dir Text laut vorgelesen, wobei der Text beim Vorlesen auch grafisch hervorgehoben wird. Du kannst das Vorlesen jederzeit anhalten, beschleunigen und verlangsamen. Weitere Informationen hier.
Ja! Du kannst die Perlego-App sowohl auf iOS- als auch auf Android-Geräten verwenden, um jederzeit und überall zu lesen – sogar offline. Perfekt für den Weg zur Arbeit oder wenn du unterwegs bist.
Bitte beachte, dass wir keine Geräte unterstützen können, die mit iOS 13 oder Android 7 oder früheren Versionen laufen. Lerne mehr über die Nutzung der App.
Ja, du hast Zugang zu Diskurse – digital von Eva Gredel im PDF- und/oder ePub-Format sowie zu anderen beliebten Büchern aus Filología & Lingüística. Aus unserem Katalog stehen dir über 1 Million Bücher zur Verfügung.

Information

Jahr
2022
ISBN drucken
9783111356570
eBook-ISBN:
9783110721515
Auflage
1

Teil III: Methoden, Verdatung und Anwendungen

Techniken und Praktiken der Verdatung

Michael Bender
Noah Bubenhofer
Philipp Dreesen
Christopher Georgi
Jan Oliver Rüdiger
Friedemann Vogel

1 Einleitung

Fragen der Verdatung sind Bestandteil der digitalen Diskursanalyse und keine Vorarbeiten. Die Analyse digital(isiert)er Diskurse setzt im Unterschied zur Auswertung nicht-digital repräsentierter Sprache und Kommunikation notwendig technische Verfahren und Praktiken, Algorithmen und Software voraus, die den Untersuchungsgegenstand als digitales Datum konstituieren. Die nachfolgenden Abschnitte beschreiben kurz und knapp wiederkehrende Aspekte dieser Verdatungstechniken und -praktiken, insbesondere mit Blick auf Erhebung und Transformation (Abschnitt 2), Korpuskompilierung (Abschnitt 3), Annotation (Abschnitt 4) und Wege der analytischen Datenerschließung (Abschnitt 5). Im Fazit wird die Relevanz der Verdatungsarbeit für den Analyseprozess zusammengefasst (6).

2 Datenerhebung und Datentransformation

Datenerhebung und -transformation sind wichtige Grundlagen bzw. Voraussetzungen für digitale Diskursanalysen. Digitale Daten ermöglichen im Vergleich zu analogen oder noch zu digitalisierenden Untersuchungsgegenständen automatisierte Verfahren der Datenerhebung, bringen aber auch spezifische Herausforderungen mit sich. Am Anfang jeder Datenerhebung steht dabei zunächst ein Projektplan, der die Forschungsfrage(n) sowie die für das Projekt datenseitig relevanten Aspekte hinreichend, d. h. verfahrensanleitend konkretisiert. Im Folgenden wird zu Anschauungszwecken an drei verschiedenen Projekttypen illustriert, wie eine solche Vorplanung aussehen kann und welche Entscheidungsmöglichkeiten zu berücksichtigen sind.
Drei exemplarische Untersuchungssettings (Projekte):
  • Projekt 1. Forschungsfrage: Ermöglicht die Analyse des Briefwechsels zwischen A und B Rückschlüsse auf Werke/Werkentscheidungen von A und B? – Material: In verschiedenen Bibliotheken wurden mehrere hundert historische Briefe von A und B gefunden (ca. 500 Seiten). Der überwiegende Teil ist mit einer Schreibmaschine verfasst – es gibt händische Anmerkungen (z. B. A macht Anmerkungen in Briefen von B). Zu vergleichbaren Untersuchungssettings siehe Neuber, Bernauer & Miller 2020, Neumann & Fauck 2008 und Rettinghaus 2021.
  • Projekt 2. Forschungsfragen: Wie wird das Thema T in einem Diskurs D semantisch besetzt oder (um-)gedeutet? Wie reagieren die Diskursakteure A und B auf ein Ereignis E? – Material: Mit Hilfe eines Web-Crawlers (siehe Weisser 2019, Suchomel & Pomikálek 2012 und Barbaresi 2021) werden massenhaft Zeitungsartikel zum Diskurs D gesammelt, die insbesondere (gefiltert) das Thema T und das Ereignis E repräsentieren. Zu vergleichbaren Untersuchungssettings siehe Schabus, Skowron & Trapp 2017, Korpus Berliner Zeitung 2014 und ZEIT-Korpus (ZEIT & ZEIT online) 2014.
  • Projekt 3. Forschungsfragen: Im Sozialen Netzwerk N findet die Skandalisierung eines Ereignisses E statt. Im Zentrum der allgemeinen Empörung stehen die Nutzerkonten A, B, C und D. Da das Soziale Netzwerk N nur eine begrenzte Anzahl an Zeichen pro Nachricht zulässt, greifen A, B, C und D auch auf eingebettete Grafiken, Videos und Verlinkungen zurück (zu anderen Netzwerken, Blogs, etc.). Analysiert werden soll der multimodale Diskurs zum Ereignis E – primär zwischen den Nutzerkonten A, B, C und D – aber auch anderen Konten, die besonders aktiv sind (Netzwerkanalyse). Zu vergleichbaren Untersuchungssettings siehe Beißwenger et al. 2021, Stark et al. 2018 und Kissling 2020.
Allen drei Projekten und auch im Wesentlichen allen Projekten mit diskurslinguistischem Fokus ist gemein, dass zunächst ein Korpus zu entwickeln ist. Unter einem Korpus versteht man „[…] eine Sammlung [authentischer] schriftlicher oder gesprochener Äußerungen in einer oder mehreren Sprachen“ (Lemnitzer & Zinsmeister 2010: 40). Prinzipiell kann ein Korpus auch analog (gedruckt) vorliegen und manuell ausgewertet werden. In der empirischen Linguistik ist ein Korpus aber in der Regel ein digitales (maschinenlesbares) Korpus, das automatisiert oder teilautomatisiert (mittels Software) ausgewertet wird. Daher ist es in einem ersten Schritt notwendig, die Äußerungen in ein digitales, maschinenlesbares Format zu überführen.

Planspiel – Die erste Hürde der Datenerhebung: Die Digitalisierung

Projekt 2 hat es in diesem Fall besonders leicht, da der Web-Crawler die Zeitungsartikel direkt über die Webseiten der jeweiligen Verlage erfasst – damit liegen alle relevanten Daten vollständig digitalisiert vor. Projekt 3 profitiert ebenfalls von originär digitalen Daten. Die Daten werden über die jeweiligen sozialen Netzwerke ausgelesen –, aber (und dies gilt auch für alle anderen Projekte, die auf Audio-/Bild-/Video-Material basieren): Sollen Audio-, Bild- oder Video-Dateien ausgewertet werden, so muss ein Weg gefunden werden, der die Auswertung dieser Daten erlaubt (Bsp.: Schmidt et al. 2017 und Klessa 2020). Es muss darüber hinaus entschieden werden, wieviel Zeit und Sorgfalt für diese Prozessschritte aufgewendet werden muss und ob dieser Aufwand im Verhältnis zum erhofften Ertrag bzw. anvisierten Erkenntnisinteresse steht. Das oben angesprochene Planspiel hilft hier weiter. Wenn klar ist, dass z. B. Bilder und Videos vollständig gesammelt werden, aber die spätere Analyse nur Videos ausgewählter Beiträge betrachtet, dann kann der Aufwand vermieden werden, Videos vollständig zu transkribieren (vgl. Curtain 2021, VERBI GmbH 2021 und Provalis Research Corp. 2021). Projekt 1 schließlich erfordert eine vollständige Digitalisierung des Materials (oftmals auch als Retrokonversion bezeichnet). Hier haben sich zwei Verfahren etabliert. Beide beginnen damit, dass zunächst mittels Dokumenten-Scannern digitale Kopien (im Wesentlichen: Fotos der einzelnen Seiten) angefertigt werden. Bei beschränkten zeitlichen und finanziellen Ressourcen bietet sich der Einsatz von sogenannter Optical Character Recognition (kurz OCR) Software für die Retrokonversion an (etwa mit Hilfe von: ABBYY 2021, tesseract-Team 2021 und READ-COOP 2018). Die OCR-Software sorgt für eine automatische Konvertierung der Bild-Dateien in Text. Bevor aber mit der Umwandlung eines ganzen Korpus begonnen wird, sollte unbedingt die Ergebnis-Qualität geprüft und auch ggf. in Abstimmung mit dem Software-Handbuch optimiert werden (z. B. kann die Bild-Auflösung und Farbdarstellung bessere oder schlechtere Ergebnisse produzieren, dies ist in der Regel im Handbuch dokumentiert – ein Test unterschiedlicher Einstellungen kann sich lohnen). Manche OCR-Software eignet sich nur für bestimmte Zwecke – gedruckte Texte mit modernen Schriften werden besser erkannt als Handschriften oder Fraktur-Schriftsätze. Handschriften können ggf. mit einem Sample trainiert werden (dazu müssen 1–2 Seiten Text per Hand digitalisiert werden). Daher lohnt es sich in so einem Fall, verschiedene Software-Programme am konkreten Material zu testen, um dann fundiert zu entscheiden, welche Software am besten geeignet ist. Beim Einsatz von OCR-Software treten immer Erkennungsfehler auf – z. B. kann die gedruckte Zeichenfolge „ri“ auf einem vergilbten Blatt als „n“ fehlinterpretiert werden. Daher sollte ggf. auch Zeit für eine Nachkorrektur eingeplant werden. Alternativ zum OCR-Einsatz besteht die Möglichkeit, die Digitalisate an einen Dienstleister zu schicken, der dies nach Gold-Standard digitalisiert. Im sogenannten Double-Keying-Verfahren wird der Text von zwei getrennten Personen abgetippt, Unterschiede im abgetippten Dokument werden mittels spezieller Software verglichen und nachkorrigiert. Dadurch ist der Prozess aufwendig und kostenintensiv – produziert aber hochwertige Ergebnisse.

Planspiel – Wichtige Punkte für Spaß an den Daten

Wurden die Daten erfolgreich digitalisiert, stellen sich für die Datenerhebung zwei weitere wichtige Fragen: (1) Welche Daten könnten von sekundärem Interesse sein? (2) Wie werden Daten gespeichert, so dass alle folgenden (Analyse-)Prozesse darauf zugreifen können?

Primäre und sekundäre Daten

Korpora bestehen nicht nur aus Texten (den sogenannten Primärdaten), sie umfassen auch eine ganze Reihe weiterer Sekundärdaten. Im Wesentlichen handelt es sich dabei um Metadaten und Annotationen (vgl. hierzu Perkuhn, Keibel & Kupietz 2012). Metadaten sind Zusatzinformationen zu einzelnen Texten (z. B. der Titel, Autor*in, Datum, Textsorte etc.). Diese Metadaten können in der späteren Analyse genutzt werden, um etwa Akteursgruppen, Zeitfenster oder Textsorten miteinander zu vergleichen bzw. sie zueinander in Beziehung zu setzen (z. B. Vergleich von Sprachgebrauchsmustern bestimmter Autor*innen; unterschiedlicher Sprachgebrauch in zwei oder mehr definierten Zeitfenstern – vergl. hier auch Korpuskompilierung). Annotationen sind Sekundärdaten, die direkt mit dem Text verknüpft sind (vgl. auch den Abschnitt zu Annotationen unten). Annotationen können manuell erstellt oder automatisch erzeugt werden. Elektronische Korpora werden in der Regel mehrstufig automatisch annotiert. Zusätzliche manuelle Annotationen oder Nachkorrekturen der automatischen Annotation sind je nach Forschungsinteresse notwendig. Folgende automatische Prozessschritte sind weit verbreitet:
  • Zerteilung der Texte in einzelne Sätze und Token,
  • automatische Lemmatisierung der Token (Token: Häuser > Lemma: Haus),
  • automatische Zuordnung der Wortart (Token: Berge > Wortart: Nomen),
  • Annotation von Phrasen (Token: Das wundersame Fest > Phrase: Nominalphrase).
Ei...

Inhaltsverzeichnis

  1. Title Page
  2. Copyright
  3. Contents
  4. Einleitung
  5. Teil I: Grundbegriffe und Grundlagen
  6. Teil II: Ethische und rechtliche Aspekte
  7. Teil III: Methoden, Verdatung und Anwendungen
  8. Sachregister