That depends on what you're trying to do. Are you interested in word-forms (inflected words), or lemmas (words abstracting infections, as in dictionaries)? Do you want "eaten" to count as an instance of "eat", or not? For example, suppose you're trying to measure how often the suffix -en occurs relatively to -ed. Then you want to count things like "eaten" and "devoured" as independent. But suppose you're interested in measuring how often the verb "eat" occurs relatively to the verb "devour". Then you'll want to increment the "eat" counter—let's call it EAT—whenever you see "eaten", "eats", even "ate"; while DEVOUR will count "devoured", "devours"... To do that, whenever you see a word-form like "eats", you'll want your code to convert it to EAT. This is called lemmatization. Note that this is orthogonal to the type/token distinction. You can count types or tokens of word-forms or lemmas, in all combinations. How many words are there in the sentence "I eat apples because she eats apples?"
Which ones you want depends on what you're trying to do. Token (eng. „Vorkommnis, Ereignis, Zeichen“) und Type (eng. „Typ, Typus, Gattung, Urbild“) ist ein 1906 von Charles Sanders Peirce (1839-1914) eingeführtes Begriffspaar, um zwischen einer Vielzahl einzelner Vorkommnissen eines Zeichens und den allgemeinen Zeichen-Typen eines gegebenen Zeichensatzes zu unterscheiden. So besteht etwa der auf dieser Seite stehende Text aus zahlreichen Buchstaben (Token), die aber alle dem Zeichensatz des modernen lateinischen Alphabets entnommen sind, dass 26 verschiedene Buchstaben-Typen umfasst. Jeder Buchstabe auf dieser Seite (Token) ist eine Instanz einer der 26 Buchstaben-Typen (Type). Ein Token ist also ein konkretes Exemplar eines bestimmten Typs, während ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token) umfasst, die alle ganz bestimmte Eigenschaften besitzen. Grundsätzlich geht es also um die Unterscheidung von Realien (Token) und Universalien (Typen). Das Konzept von Token und Type wird insbesondere in der Linguistik, Musiktheorie und Philosophie verwendet, namentlich in der analytischen Sprachphilosophie, der Logik, der Ontologie und auch in der Philosophie des Geistes. Charles Sanders Peirce gab dazu folgende Definition:
– Charles S. Peirce: Prolegomena to an Apology for Pragmaticism, 1906, (CP 4.537)[1] In der Philosophie des Geistes identifizieren die klassischen Identitätstheorien bestimmte Typen mentaler Zustände mit bestimmten Typen neuronaler Zustände. Demgegenüber behauptet Donald Davidson (1917-2003) in dem von ihm entwickelten anomalen Monismus nur die Identität der entsprechenden Token. So mag etwa ein einzelnes Schmerzereignis mit einem bestimmten physischen Ereignis identisch sein; dem allgemeinen mentalen Typ „Schmerz“ entspricht hingegen keineswegs ein allgemeiner Typ bestimmter physischer Zustände. Einzelnachweise
Mit dem Begriffspaar Token und Type werden in der analytischen Sprachphilosophie Elemente der Sprache wie Wörter und Sätze sowie Äußerungen gekennzeichnet. Die Unterscheidung zwischen Vorkommnis und Typ (auf Englisch Token und Type) wird in der Ontologie vorgenommen, um zwischen einem einzelnen Vorkommnis und dem allgemeinen Vorkommnistyp zu unterscheiden. Ein Beispiel: Auf die Frage, wie viele Ziffern sich in der Reihe 2200999 befinden, gibt es zwei korrekte Antworten. Zählt man die Token (die Vorkommnisse), so befinden sich sieben Ziffern in der Reihe. Zählt man hingegen die Typen, so sind es nur drei: „2“, „0“ und „9“. DefinitionDas Begriffspaar wurde von Charles S. Peirce 1906 eingeführt:
– Charles S. Peirce: Prolegomena to an Apology for Pragmaticism, 1906, (CP 4.537) siehe auch Token, Type) PhilosophieDie Unterscheidung zwischen Token und Typen ist in verschiedenen Bereichen der Philosophie von Bedeutung, insbesondere in der Sprachphilosophie, der Logik und der Ontologie. Auch in der Philosophie des Geistes spielt sie eine Rolle. Die Frage, was ein mentaler Zustand sei, kann zum einen als Frage nach dem Zustandstoken, aber auch als Frage nach dem Zustandstypen verstanden werden. Während etwa die klassische Identitätstheorie Typen von mentalen Zuständen mit Typen von neuronalen Zuständen identifiziert, behauptet der anomale Monismus Donald Davidsons nur eine Identität der entsprechenden Token. LinguistikIn der strukturalen Linguistik dienen die Begriffe zur Unterscheidung zwischen konkreten sprachlichen Äußerungen (Token) und abstrakten Einheiten der Metaebene (Types), die sie repräsentieren. So enthält der Satz „Ein Affe bleibt ein Affe, auch in Seide gekleidet“ zwei Token Affe, aber nur einen Type Affe. Das Begriffspaar dient also auf Wortebene zur Unterscheidung zwischen emischer und etischer Perspektive, bzw. zwischen langue und parole. Auf Ebene der Laute spricht man dagegen von Phonen vs. Phonemen, in der Morphologie von Morphen vs. Morphemen usw. Mitunter wird das Begriffspaar fälschlich auch gleichbedeutend mit dem Paar Lexem – Wortform gebraucht. In der quantitativen Linguistik und in der quantitativen Stilistik spielt vor allem die Type-Token-Relation eine große Rolle, da sie der Charakterisierung von Texten hinsichtlich ihres Wortschatzreichtums dient. MusikwissenschaftEntsprechende Anwendungen gibt es auch im Bereich der Musiktheorie. TypografieBeim Drucken mit beweglichen Lettern dient die Übereinstimmung zwischen Type und Token als positives Kriterium zur Bestimmung eines typografischen Textes:
Siehe auch
Einzelnachweise
Literatur
Weblinks
|