Notice

This page show a previous version of the article

zurück zu Erweiterte Suche auf tatoeba

Suchoptionen im Textfeld

Einführung

Auf Tatoeba gibt es zwei Möglichkeiten, nach Wörtern und Ausdrücken zu suchen:

  • am einfachsten ist es über die Suchzeile ganz oben auf jeder Seite
  • mit der Erweiterten Suche stehen dir, du ahnst es sicher schon, mehr Optionen zur Verfügung. Den Link dorthin findest du immer direkt über dem Eingabefeld der Suchzeile.

Bei beiden Suchen sind folgende drei Felder gleich:

  • Mit dem Eingabefeld beschäftigen wir uns in diesem Artikel.

  • Das Feld Von: Hier kann festgelgt werden, welche Sprache nach dem Suchbegriff vom Eingabefeld durchgekämmt werden soll. Wenn du "Beliebige Sprache" auswählst, wird der Begriff in allen Sprachen gesucht.

  • Das Feld Nach: in diesem Feld kann festgelegt werden, mit welcher Sprache die Suchergebnisse direkt oder indirekt verknüpft sein sollen (auch dieses Feld bietet die Option "Beliebige Sprache"). Die Sätze, die direkt mit dem Suchergebnis verknüpft sind, findest du unter der Überschrift "Übersetzungen". Wenn sie nur indirekt mit ihm verknüpft sind, steht "Übersetzungen zweiten Grades" darüber. Um eine Übersetzung zweiten Grades handelt es sich, wenn es zwischen ihren zwar eine Verbindung über eine andere Übersetzung gibt, aber niemand die beiden Sätze direkt miteinander verknüpft hat. Das heisst, du kannst in dem Fall nicht sicher sein, dass sie tatsächlich als gegenseitige Übersetzungen gelten können.

Das Eingabefeld für den Suchtext

Bleibt das Eingabefeld leer, wird die Suche nur durch die Kriterien, die in den Feldern Von und Nach ausgewählt wurden, eingeschränkt. Wird im Eingabefeld Text eingegeben, wird nach den Sätzen gesucht, die diesen Text enthalten.

Die Suchmaschine, die Tatoeba benutzt (Manticore, vormals Sphinx), unterscheidet sich ein wenig von anderen Suchmaschinen, die du sonst vielleicht (z.B. bei Google) benutzt. Folgendes gilt es daher zu beachten:

(1) Lass die Satzzeichen in deinem Suchbegrif weg. Die meisten davon werden ignoriert, aber einige beeinflussen die Suche, dazu gleich mehr.

(2) In Arabisch, Baskisch, Katalanisch, Dänisch, Niederländisch, Englisch, Finnisch, Französisch, Deutsch, Griechisch, Indisch, Ungarisch, Indonesisch, Irisch, Italienisch, Litauisch, Nepalesisch, Norwegisch (Bokmål), Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch, Tamilisch und Türkisch wird die Suche mit stemming unterstützt. Das heißt die Suche nach einem Wort wie live liefert auch ähnliche Wörter wie lived und living. Falls die Suche nur exakte Treffer liefern soll, kannst du ein Gleichheitszeichen voranstellen: =live

(3) Wenn Ausdrücke in Sprachen gesucht werden sollen, die keine Leerzeichen zwischen den Wörtern benutzen (wie Japanisch oder Chinesisch), wirf einen Blick auf den Absatz dazu weiter unten.

Beispiele für englische Sätze

  • Um englische Sätze zu finden, die das Wort "live", "lives", "living" oder "lived" enthalten, such mit "live". Dies wird auch Treffer mit "Live", "Living" etc. liefern, da die Groß- und Kleinschreibung ignoriert wird.

  • Für exakte Treffer (inklusive Großbuchstaben), setz ein Gleichheitszeichen (=) davor.

  • Zwei Satzzeichen, nach denen du in Sätzen suchen lassen kannst, sind $ und _ . Du kannst sie aufstöbern, wenn du ihnen einen Schrägstrich voranstellst.

  • Wird ein $ hinter ein Wort gesetzt, werden nur Sätze angezeigt, die mit diesem Wort enden. Das folgende Beispiel liefert englische Sätze, die auf "Tom" enden.

  • Wird ein ^ vor ein Wort gesetzt, werden Sätze herausgesucht, die mit diesem Wort beginnen. Das folgende Beispiel liefert Sätze, die mit "Tom" beginnen.

    • ^Tom

    • Das nächste Beispiel liefert Sätze, die mit "Tom" beginnen und auf "Mary" enden.

    • ^Tom Mary$

  • Der senkrechte Strich funktioniert als ODER (und die Klammern drumherum nicht vergessen).

    • Hier werden Sätze herausgesucht, die entweder mit "Tom" oder mit "He" beginnen.
    • (^Tom|^He)

    • Als nächstes kommen Sätze, die eines der folgenden Wörter beinhalten: "fasting", "fasted", "fasts". Die Gleichheitszeichen sorgen dafür, dass nur exakt diese Treffer angezeigt werden, damit werden "faster" und "fastest" ausgeschlossen.

    • (=fasting|=fasted|=fasts)
  • Um nach Wortgruppen zu suchen, können Anführungszeichen verwendet werden. Das hat den Vorteil, dass nur Sätze berücksichtigt werden, in denen die Wörter in dieser Reihenfolge vorkommen.

    • Die folgende Suche kann verschiedene Ausdücke liefern, wie "live in Boston", "living in Boston", oder "lives in Boston":
    • "live in boston"

    • Wenn dabei noch ein Gleichheitszeichen vor jedes Wort gesetzt wird, werden sie nur in genau dieser Variante herausgesucht. Oder setz ein Gleichheitszeichen direkt vor das erste Anführungszeichen, um nur genau diesen Ausdruck zu finden. Hier für: "live in Boston"

    • "=live =in =boston"
    • ="live in boston"

    • Die nächste Suche liefert Treffer nur zu dem Satz, der sich aus exakt diesen Wörtern "I live in Boston" zusammensetzt, ohne irgendein zusätzliches Wort.

    • "^I =live =in =Boston$"
  • Mit dem Minuszeichen (-) kann man Wörter ausschließen.

    • Das folgende Beispiel liefert Sätze, in denen "Tom" vorkommt, die aber nicht mit "Tom" beginnen.
    • -^Tom Tom

    • Das nächste Beispiel liefert Sätze mit "Tom", aber weder beginnen sie noch enden sie mit "Tom".

    • -^Tom Tom -Tom$
  • Ein Fragezeichen (?) in einem Wort gilt als Joker für einen Buchstaben.

    • Hiermit können sowohl "whenever" als auch "wherever" gefunden werden.
    • whe?ever

    • Im Folgenden wird nach Wörtern mit 6 Buchstaben gesucht, die mit zwei beliebigen Buchstaben beginnen, dann soll "eve" und danach noch ein Buchstabe kommen, wie z.B. "clever" "eleven", "peeves", und "uneven".

    • ??eve?
  • Ein Sternchen (*) wiederum steht als Joker für eine Buchstabenfolge oder ein ganzes Wort.

    • Mit diesem Beispiel werden Sätze gefunden, in denen nach "Tom" zwei beliebige Wörter stehen, dann kommt das Wort "Mary", danach ein weiteres Wort und dann "John".
    • "Tom * * Mary * John"

    • Hiermit werden englische Sätze gefunden, die mit "Tom" beginnen, mit "Mary" enden und dazwischen stehen drei beliebige Wörter.

    • "^Tom * * * Mary$"

    • Das nächste Beispiel findet Sätze, in denen ein Wort vorkommt, das mit "red" beginnt, inclusive dem Wort "red".

    • red*

    • Dieses Beispiel findet Sätze, in denen ein Wort vorkommt, das auf "red" endet, inclusive dem Wort "red".

    • *red

    • Und hiermit werden Sätze gefunden, die Wörter enthalten, in denen die Buchstaben "red" an irgendeiner Stelle im Wort vorkommen. Auch hier ist "red" selbst auch ein Treffer.

    • *red*
  • Mit dem Minuszeichen (-) lassen sich Wörter ausschließen. Es muss aber nach mindestens einem Wort gesucht werden.

    • Das nächste Beispiel findet englische Sätze, in denen das Wort "French" vorkommt, aber nicht das Wort "Tom".
    • French -Tom

    • Dieses Beispiel liefert Sätze, in denen "cheek" in jeglicher Variante (cheeks, etc.) vorkommt, aber keines der Wörter hinter einem der Minuszeichen.

    • cheek -tear -slap -burn -red -hollow
  • Mit dem doppelten << bringt man die gesuchten Wörter in eine grobe Reihenfolge.

    • Hier soll "cat" im Satz vor "dog" erscheinen

    • cat << dog

  • Und hier kommt ein Beispiel für eine Quorum-Suche: Die Sätze werden mindestens zwei der drei zur Auswahl stehenden Wörter "cat", "dog" und "fish" enthalten.

Noch ein paar spezielle Suchen

  • für Sätze, die mit "I can" beginnen, aber Sätze mit "I can't" auslassen

    • Hiermit werden die Sätze mit "I can't" gefunden:

    • "^I =can't"

    • Dies zeigt beide Satzvarianten "I can" und "I can't":

    • "^I =can"

    • Um wirklich nur "I can" Sätze zu bekommen, ohne die "I can't" Sätze, mach es so (achte unbedingt auf die Anführungszeichen):

    • "^I =can" -"can't"

  • für englische Sätze ohne "the", "a" oder "an"

    • Die Folgende Suche würde eine Fehlermeldung verursachen, da nach mindestes einem Wort gesucht werden muss. Es ist nicht möglich, nur Wörter auszuschließen:

    • -the -a -an

    • Solltest du fest entschlossen sein, so viele Treffer wie möglich bekommen zu wollen, könntest du nach allen Wörtern suchen, die mit jedem Buchstaben des Alphabets beginnen und vorher ein Minus vor jedes Wort setzen, das nicht dabei sein soll (allerdings wird das ziemlich mühselig beim Eintippen):

    • -the -a -an a*|b*|c*|d*|e*|f*|g*|h*|i*|j*|k*|l*|m*|n*|o*|p*|q*|r*|s*|t*|u*|v*|w*|x*|y*|z*

  • für Sätze in denen das Wort "of" direkt vor einem Wort, das auf "ing" endet, steht

  • of NEAR/1 *ing -"*ing of"

    • Der -"ing of" Teil verhindert, das auch Sätze angezeigt werden, in denen "-ing" vor "of" steht
    • Bei den Suchergebnissen werden Sätze, mit mehreren *ing-Wörtern bevorzugt. Wenn du das nicht möchtest, kannst du "Reihenfolge umkehren" in der erweiteren Suche ankreuzen.

Sprachen ohne Leerzeichen zwischen den Wörtern

Bei Sprachen, die nicht das Leerzeichen benutzen, um Wörter voneinander zu trennen (wie Japanisch, Chinesisch etc.), interpretiert die Suchmaschine jedes Zeichen als ein einzelnes Wort. So wird die Suche nach 逆に die gleichen Ergebnisse liefern wie 逆 に. D.h. es werden alle Sätze herausgesucht, die diese Zeichen enthalten, ungeachtet ihrer Reihenfolge oder ob sie direkt hintereinander stehen. Daher solltest du sie mit Anführungszeichen umschließen:

"逆に".

More details

The search ignores capitalization and punctuation (unless the punctuation happens to match one of the special characters described elsewhere on the page).

If you want to find an exact match for a word in a language (like English) that supports stemming, you must precede it with an equals sign, as in =live. This may come as a surprise to users who are accustomed to Google Search, where wrapping a word or phrase in double quotes forces an exact match. In Manticore, double quotes have a different function, which only affects multiword (phrase) searches: wrapping a phrase in double quotes requires matching sentences to contain words in the specified continuous sequence. Simply placing a phrase in quotes does not suppress stemming of its individual words. To do that, you will need to place an equals sign before each word in the phrase for which you want to suppress stemming, or directly before the first quotation mark to suppress stemming for each word. If you want to put both an equals sign and a caret before the same word, the equals sign should precede the caret. For instance, to find sentences that begin with the exact word Noise, search for =^noise, not ^=noise.

As an example, take the search like thing. This will find like things, likely things, and even things like. Adding quotes, as in "like thing", will prevent a match against things like (where the words appear in the wrong order), but it will continue to match like things, likely things, and so on. By contrast, "=like =thing" will only match like thing (which does not occur in the Tatoeba corpus). Removing the double quotes, =like =thing, will match What made you do a silly thing like that? Removing one of the equals signs, as in like =thing, will find Such a strange thing is not likely to happen.

Note that a star (*) can be placed at the beginning, middle, or end of a string representing a word, but a string beginning with a star must be at least three characters long, or it will be ignored.

Limit matches to transcriptions or alternative scripts or sentence text

Some languages can be written in different scripts (such as traditional/simplified Chinese, or Latin/Cyrillic Uzbek). Others also have transcriptions (such as Pinyin Chinese or Japanese furigana).

By default, keywords will be searched everywhere: sentence text, alternative script and transcription. This means a sentence might come up in the results just because the transcription is matching.

You can control exactly what is searched by using the @text and @transcription prefixes, respectively targeting the sentence text and what’s under the sentence text.

Other search operators

  • A vertical bar (|, representing "or") finds examples where either of the words appears:

    • hate | detest will match sentences with either hate or detest (or both).
  • If you want to combine an or-expression with other terms, you need to put the or-expression in parentheses:

    • (red|blue) house will match sentences in which the word "house" appears together with either "red" or "blue" (or both)
  • A dash (-) before a word prevents matches with sentences where the word appears: like -thing (or like !thing) will match I like ice cream but not I like that red thing. An exclamation mark (!) works the same way.

  • Putting a caret (^) before a word will match only sentences that begin with that word: ^great will match Great people are not always wise. but not You are the great love of my life.

  • Putting a dollar sign ($) after a word will match only sentences that end with that word: life$ will match This is the best day of my life. but not Life means nothing without friends.

  • If you want to search for sentences that contain nothing other than the specified words, use double quotes, a caret, and a dollar sign in combination: "^i love you$" will find I love you. and I love you! but not I love you more than you love me. (However, it will find I loved you. To prevent this match, use "^i =love you$".)

  • The strict order operator (<<) between two words will find sentences where the first word occurs before the second but not where the second word comes before the first. Thus dog << cat will find examples where dog precedes cat, but not vice versa. This operator is also useful for searching for multiple instances of a string. For instance, these << these << these will find sentences with three instances of the word "these".

  • The proximity operator(~N, where N is a positive number) following a phrase will limit the number of words that can separate the specified words to fewer than N. Thus "you are *ble"~1 will find You are irresistible. but not You are partially responsible.

  • The quorum operator (/N, where N is a positive number) following a phrase will match sentences that have up to N matching words. Thus "I wish you would stop"/4 will find both I wish you would stop. and I wish you would reconsider.

  • The MAYBE keyword will make the part of the sentence to the right optional. However, sentences that do contain the optional words will be listed first in a default search (that is, one sorted by "Relevance"). For instance, "perhaps i can MAYBE help" will find both Perhaps I can help. and Perhaps I can answer that., but Perhaps I can help. will be listed first. By contrast, "perhaps i can MAYBE answer" will find the same sentences, but listed in the reverse order. MAYBE must be written in all capitals; "maybe" will match the word maybe.

See the Manticore documentation for other functionality.


Related Articles

Advanced Search (englisch)


zurück zur Schnellstartanleitung zurück zu tatoeba