Was ist der unterschied zwischen token und typen

'eat' and 'eaten' as two types or one

That depends on what you're trying to do. Are you interested in word-forms (inflected words), or lemmas (words abstracting infections, as in dictionaries)? Do you want "eaten" to count as an instance of "eat", or not?

For example, suppose you're trying to measure how often the suffix -en occurs relatively to -ed. Then you want to count things like "eaten" and "devoured" as independent. But suppose you're interested in measuring how often the verb "eat" occurs relatively to the verb "devour". Then you'll want to increment the "eat" counter—let's call it EAT—whenever you see "eaten", "eats", even "ate"; while DEVOUR will count "devoured", "devours"... To do that, whenever you see a word-form like "eats", you'll want your code to convert it to EAT. This is called lemmatization.

Note that this is orthogonal to the type/token distinction. You can count types or tokens of word-forms or lemmas, in all combinations.

How many words are there in the sentence "I eat apples because she eats apples?"

  • In a sense, 7 words (word-form tokens: I, eat, apples, because, she, eats, apples)
  • In another sense, 6 words (word-form types: I, eat, apples, because, she, eats)
  • In another sense, 7 words again (lemma tokens: I, EAT, APPLE, BECAUSE, SHE, EAT, APPLE); but here we can measure things like "EAT occurs twice"
  • And in yet another, 5 words (lemma types: I, EAT, APPLE, BECAUSE, SHE).

Which ones you want depends on what you're trying to do.

Token (eng. „Vorkommnis, Ereignis, Zeichen“) und Type (eng. „Typ, Typus, Gattung, Urbild“) ist ein 1906 von Charles Sanders Peirce (1839-1914) eingeführtes Begriffspaar, um zwischen einer Vielzahl einzelner Vorkommnissen eines Zeichens und den allgemeinen Zeichen-Typen eines gegebenen Zeichensatzes zu unterscheiden. So besteht etwa der auf dieser Seite stehende Text aus zahlreichen Buchstaben (Token), die aber alle dem Zeichensatz des modernen lateinischen Alphabets entnommen sind, dass 26 verschiedene Buchstaben-Typen umfasst. Jeder Buchstabe auf dieser Seite (Token) ist eine Instanz einer der 26 Buchstaben-Typen (Type). Ein Token ist also ein konkretes Exemplar eines bestimmten Typs, während ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token) umfasst, die alle ganz bestimmte Eigenschaften besitzen. Grundsätzlich geht es also um die Unterscheidung von Realien (Token) und Universalien (Typen).

Das Konzept von Token und Type wird insbesondere in der Linguistik, Musiktheorie und Philosophie verwendet, namentlich in der analytischen Sprachphilosophie, der Logik, der Ontologie und auch in der Philosophie des Geistes.

Charles Sanders Peirce gab dazu folgende Definition:

„Ein allgemeines Verfahren zur Abschätzung des Umfangs eines Textes oder eines gedruckten Buches ist das Zählen der Wörter. Es mag etwa zwanzig ‚the’ auf einer Seite geben und natürlich werden sie als zwanzig Wörter gezählt. In einem anderen Sinn des Wortes ‚Wort’ gibt es aber nur ein Wort ‚the’ in der englischen Sprache; und es ist unmöglich, dass diese Art Wort sich sichtbar auf einer Seite befindet oder gehört werden kann, da es kein einzelnes Ding oder Ereignis ist. Es existiert nicht, sondern bestimmt nur Dinge, die existieren. Eine solche definiert kennzeichnende Form möchte ich Type nennen. Für einzelne Ereignisse, die einmalig geschehen und deren Identität auf das eine Geschehen begrenzt ist, oder ein einzelnes Objekt oder Ding an einem bestimmten Ort und zu einer bestimmten Zeit, solch ein Ereignis oder Ding, das nur dort, wo und wann es erscheint, signifikant ist, so wie dieses oder jenes Wort in einer einzelnen Zeile einer einzelnen Seite eines einzelnen Exemplars eines Buches, möchte ich die Bezeichnung Token einführen. Ein undefiniert bestimmtes Zeichen wie den Ton einer Stimme kann man weder Type noch Token nennen. Ich schlage als Benennung eines solchen Zeichens Tone vor. Wenn man einen ‚Type’ nutzen möchte, so muss es als ‚Token’ verkörpert werden, der ein Zeichen des Types sein soll und dadurch des Objektes, das durch den Type gekennzeichnet wird.“

Charles S. Peirce: Prolegomena to an Apology for Pragmaticism, 1906, (CP 4.537)[1]

In der Philosophie des Geistes identifizieren die klassischen Identitätstheorien bestimmte Typen mentaler Zustände mit bestimmten Typen neuronaler Zustände. Demgegenüber behauptet Donald Davidson (1917-2003) in dem von ihm entwickelten anomalen Monismus nur die Identität der entsprechenden Token. So mag etwa ein einzelnes Schmerzereignis mit einem bestimmten physischen Ereignis identisch sein; dem allgemeinen mentalen Typ „Schmerz“ entspricht hingegen keineswegs ein allgemeiner Typ bestimmter physischer Zustände.

Einzelnachweise

  1. „A common mode of estimating the amount of matter in a MS. or printed book is to count the number of words. There will ordinarily be about twenty the’s on a page, and of course they count as twenty words. In another sense of the word “word,” however, there is but one word “the” in the English language; and it is impossible that this word should lie visibly on a page or be heard in any voice, for the reason that it is not a Single thing or Single event. It does not exist; it only determines things that do exist. Such a definitely significant Form, I propose to term a Type. A Single event which happens once and whose identity is limited to that one happening or a Single object or thing which is in some single place at any one instant of time, such event or thing being significant only as occurring just when and where it does, such as this or that word on a single line of a single page of a single copy of a book, I will venture to call a Token. An indefinite significant character such as a tone of voice can neither be called a Type nor a Token. I propose to call such a Sign a Tone. In order that a Type may be used, it has to be embodied in a Token which shall be a sign of the Type, and thereby of the object the Type signifies. I propose to call such a Token of a Type an Instance of the Type.“
    (‘Token’. Term in M. Bergman & S. Paavola (Eds.): The Commens Dictionary: Peirce's Terms in His Own Words. New Edition. Retrieved from http://www.commens.org/dictionary/term/token, 01.07.2018

Mit dem Begriffspaar Token und Type werden in der analytischen Sprachphilosophie Elemente der Sprache wie Wörter und Sätze sowie Äußerungen gekennzeichnet. Die Unterscheidung zwischen Vorkommnis und Typ (auf Englisch Token und Type) wird in der Ontologie vorgenommen, um zwischen einem einzelnen Vorkommnis und dem allgemeinen Vorkommnistyp zu unterscheiden.

Ein Beispiel: Auf die Frage, wie viele Ziffern sich in der Reihe 2200999 befinden, gibt es zwei korrekte Antworten. Zählt man die Token (die Vorkommnisse), so befinden sich sieben Ziffern in der Reihe. Zählt man hingegen die Typen, so sind es nur drei: „2“, „0“ und „9“.

Definition

Das Begriffspaar wurde von Charles S. Peirce 1906 eingeführt:

„Ein allgemeines Verfahren zur Abschätzung des Umfangs eines Textes oder eines gedruckten Buches ist das Zählen der Wörter. Es mag etwa zwanzig ‚the’ auf einer Seite geben und natürlich werden sie als zwanzig Wörter gezählt. In einem anderen Sinn des Wortes ‚Wort’ gibt es aber nur ein Wort ‚the’ in der englischen Sprache; und es ist unmöglich, dass diese Art Wort sich sichtbar auf einer Seite befindet oder gehört werden kann, da es kein einzelnes Ding oder Ereignis ist. Es existiert nicht, sondern bestimmt nur Dinge, die existieren. Eine solche definiert kennzeichnende Form möchte ich ‚Type’ nennen. Für einzelne Ereignisse, die einmalig geschehen und deren Identität auf das eine Geschehen begrenzt ist, oder ein einzelnes Objekt oder Ding an einem bestimmten Ort und zu einer bestimmten Zeit, solch ein Ereignis oder Ding, das nur dort, wo und wann es erscheint, signifikant ist, so wie dieses oder jenes Wort in einer einzelnen Zeile einer einzelnen Seite eines einzelnen Exemplars eines Buches, möchte ich die Bezeichnung ‚Token’ einführen. Ein undefiniert bestimmtes Zeichen wie den Ton einer Stimme kann man weder Type noch Token nennen. Ich schlage als Benennung eines solchen Zeichens ‚Tone’ vor. Wenn man einen ‚Type’ nutzen möchte, so muss es als ‚Token’ verkörpert werden, der ein Zeichen des Types sein soll und dadurch des Objektes, das durch den Type gekennzeichnet wird.“

Charles S. Peirce: Prolegomena to an Apology for Pragmaticism, 1906, (CP 4.537) siehe auch Token, Type)

Philosophie

Die Unterscheidung zwischen Token und Typen ist in verschiedenen Bereichen der Philosophie von Bedeutung, insbesondere in der Sprachphilosophie, der Logik und der Ontologie.

Auch in der Philosophie des Geistes spielt sie eine Rolle. Die Frage, was ein mentaler Zustand sei, kann zum einen als Frage nach dem Zustandstoken, aber auch als Frage nach dem Zustandstypen verstanden werden. Während etwa die klassische Identitätstheorie Typen von mentalen Zuständen mit Typen von neuronalen Zuständen identifiziert, behauptet der anomale Monismus Donald Davidsons nur eine Identität der entsprechenden Token.

Linguistik

In der strukturalen Linguistik dienen die Begriffe zur Unterscheidung zwischen konkreten sprachlichen Äußerungen (Token) und abstrakten Einheiten der Metaebene (Types), die sie repräsentieren.

So enthält der Satz „Ein Affe bleibt ein Affe, auch in Seide gekleidet“ zwei Token Affe, aber nur einen Type Affe.

Das Begriffspaar dient also auf Wortebene zur Unterscheidung zwischen emischer und etischer Perspektive, bzw. zwischen langue und parole. Auf Ebene der Laute spricht man dagegen von Phonen vs. Phonemen, in der Morphologie von Morphen vs. Morphemen usw. Mitunter wird das Begriffspaar fälschlich auch gleichbedeutend mit dem Paar Lexem – Wortform gebraucht.

In der quantitativen Linguistik und in der quantitativen Stilistik spielt vor allem die Type-Token-Relation eine große Rolle, da sie der Charakterisierung von Texten hinsichtlich ihres Wortschatzreichtums dient.

Musikwissenschaft

Entsprechende Anwendungen gibt es auch im Bereich der Musiktheorie.

Typografie

Beim Drucken mit beweglichen Lettern dient die Übereinstimmung zwischen Type und Token als positives Kriterium zur Bestimmung eines typografischen Textes:

„Das entscheidende Kriterium, das ein typographisch hergestellter Druck erfüllen muß, ist jenes der Typidentität der jeweils im gedruckten Text erscheinenden Buchstabenformen. Mit anderen Worten: alle im Text auftauchenden Buchstabenformen müssen sich jeweils als Exemplare (‚tokens‘) ein und desselben Buchstabentyps, eben der Type oder Letter, die ein seitenverkehrtes Bild des gedruckten Buchstabens zeigt, erweisen.“[1]

Siehe auch

  • Token (Übersetzerbau) ((kleinste) sinngebende Einheit in formalen Sprachen)

Einzelnachweise

  1. Herbert E. Brekle: Die Prüfeninger Weiheinschrift von 1119. Eine paläographisch-typographische Untersuchung [kurze Zusammenfassung], Scriptorium Verlag für Kultur und Wissenschaft, Regensburg 2005, ISBN 3-937527-06-0.

Literatur

  • Herbert E. Brekle: „Das typographische Prinzip. Versuch einer Begriffsklärung“, in: Gutenberg-Jahrbuch, Bd. 72 (1997), S. 58–63 (PDF)
  • N. Harrison: Types, tokens and identity of the musical work, in: British Journal of Aesthetics, 15 (1975), 336–346 doi:10.1093/bjaesthetics/15.4.336
  • Th. Jantschek: Artikel Type and Token, in: Historisches Wörterbuch der Philosophie, Band 10, Basel 1998, Sp. 1581–1582
  • Wolfgang Künne: Abstrakte Gegenstände, Klostermann, Frankfurt 2007, Kapitel 5 (Verstehen und Evidenz), 180–224, ISBN 978-3-465-04032-3

Weblinks

  • Lorenzo Passerini-Glazel: Institutional Ontology as an Ontology of Types (PDF; 266 kB)
  • Linda Wetzel: Types and Tokens. In: Edward N. Zalta (Hrsg.): Stanford Encyclopedia of Philosophy.

Abgerufen von „https://de.wikipedia.org/w/index.php?title=Token_und_Type&oldid=224897619“