Drüben bei Crowdin haben wir mittlerweile eine große Anzahl von Leuten, die uns bei der Übersetzung der App helfen. Vielen Dank dafür!

Doch, wie einige bereits festgestellt haben, ist es mit der reinen Übersetzung der Oberfläche noch nicht getan. Die Suche funktioniert weiterhin nicht in allen Sprachen. Das liegt daran, dass die Texte für die Suche unabhängig von den Oberflächentexten ist. Die Suchtexte werden von uns manuell eingepflegt. Es wird überlegt, welche Begriffe ein Nutzer eventuell verwenden könnte, um genau diese spezielle Funktion oder Symboltabelle zu finden. Diese Begriffe müssen nicht zwangsläufig irgendwo in der eigentlichen Funktion auftauchen, sondern können völlig losgelöst sein.

Beispiele:

  • Morse: Samuel Morse, Punkte, Striche, kurz, lang, dit, dah, dat, …
  • Symboltabelle „Elbisch“: Der Herr der Ringe, J.R.R. Tolkien, Der Hobbit, …

Deswegen werden die Suchtexte in einer separaten Datei gespeichert. Natürlich finden sich in den Suchtexten auch Begriffe, die bereits in den normalen Übersetzungsdateien zu finden sind, wie beispielsweise der Titel der Funktion. Insofern gibt es immer ein paar Doppelungen.

Aktuell werden folgende Suchtexte in der App verwendet:

  • Die Suchtexte der ausgewählten Sprache, sofern schon vorhanden
  • Die Suchtexte der englischen Version
  • Darüber hinaus gibt es noch eine Datei mit Suchtexten, die für alle Sprachen gleich sind. So ist „J.R.R. Tolkien“ aus dem obigen Beispiel dort zu finden, weil dieser Suchbegriff vermutlich in jeder Sprache gleich ist und man ihn somit nicht wiederholt aufschreiben muss.

Inhalt der Suchtexte

Abgesehen von den reinen Schreibweisen, die gleich genauer betrachtet wird, ist es natürlich wichtig, sich genau zu überlegen, mit welchen Suchbegriffen der Nutzer zu der Funktion gelangen können soll. Man sollte immer überlegen, dass der Nutzer im Zweifel vor einem Mystery-Rätsel sitzt und nur vage oder gar keine Informationen besitzt. Ihm wird eine Geschichte zu Elben erzählt, weiß aber nicht, dass die Sprache „Tengwar“ genannt wird. Also sollte für die Symboltabelle „Tengwar“ auch mit den Begriffen „elben“ oder „elbisch“ gefunden werden können.

  • Natürlich darf der korrekte Titel des Tools in der ausgewählten Sprache nicht fehlen.
  • Was ist es inhaltlich? Ein Telegrafen-Code? Dann bietet sich der Suchtext „telegrafen“ an.
  • Wie sehen die Symbole aus, haben sie Striche? Dann bietet sich als Suchtext „striche linien“, vllt. sogar „barcodes“ an. Oder der Text besteht nur aus bestimmten Zeichen („Kenny’s Code“: „mpf mmm fpf“). Man kann sich also die Suchtexte am Aussehen ableiten.
  • Man kann die Begriffe auch vom historischen oder popkulturellen Kontext ableiten („Enigma“: „zweiterweltkrieg“, „Klingonisch“: „startrek klingonen enterprise“).

Aufbau der Suchtexte

Die interne Suchfunktion bekommt den eingegebenen Text. Dieser Text wird dann formatiert:

  • Groß- und Kleinschreibung ist egal
  • Sonderbuchstaben werden umgewandelt: Ä zu AE, ß zu SS, É zu E, Ç zu C, …

Danach wird geschaut, ob es einen Suchbegriff gibt, der den eingegebenen Text enthält. Bspw. enthält der Suchtext „abcd“ den Text „BC“. Ein realistischeres Beispiel wäre der Suchtext „weihnachtsmannes“. Dieser Suchtext deckt folgende Eingaben in jeglicher Groß-/Kleinschreibung ab:

  • Weihnacht
  • Weihnachts
  • Mann
  • Mannes
  • Weihnachtsmann
  • Weihnachtsmannes

Wenn der Nutzer also einen dieser Begriffe eingibt, wird die entsprechende Funktion angezeigt. Was nicht funktioneren würde, wäre „Weihnachtsmänner“. Dafür muss ein neuer Suchtext hinzugefügt werden. Aufgrund der oben genannten Formatierung, wäre der Suchtext hier „weihnachtsmaenner“. Man beachte das „ae“ statt „ä“. Diese Schreibweise unterstützt durch die oben genannte Formatierung die Suche nach:

  • Weihnachtsmaenner
  • Weihnachtsmänner

Es ist also nicht notwendig, den Suchtext „weihnachtsmänner“ hinzuzufügen, um beide Varianten abzudecken.

Es ergibt also Sinn, seine Suchbegriffe so zu konstruieren, dass viele Varianten abgedeckt sind. Dazu zählen in den meisten Fällen:

  • Verwendung der Pluralform
  • Bei Adjektiven eine möglichst lange Form („schnellster“ deckt „schnell“, „schnellste“, „schnellster“ ab)

Wenn die Funktion mehrere Wörter benötigt, um gefunden zu werden, kann es sein, dass Nutzer auf unterschiedliche Art und Weise sucht. Nehmen wir das „J.R.R. Tolkien“-Beispiel. Hier können mehrere verschiedene Suchtexte verw, weil man nie weiß, was der Nutzer genau eingeben wird:

  • Mit und ohne Leerzeichen: „JRR Tolkien“ und „JRRTolkien“
  • Mit und ohne Punkte: „J.R.R. Tolkien“, „J. R. R. Tolkien“ und „J.R.R.Tolkien“
  • Vollständiger Name: „John Ronald Reuel Tolkien“

Die ersten beiden Punkte können mit „jrrtolkien“ erfasst werden, da das Tool Sonderzeichen sowie Groß-/Kleinschreibung ignoriert. Der fertige Suchtext wäre also „jrrtolkien johnronaldreueltolkien“. Auch kann man über unterschiedliche Schreibweisen („grey“ vs. „gray“, „color“ vs. „colour“, „philipp“ vs. „fillip“, „geographie“ vs. „geografie“, „5“ vs. „fuenf“, …) oder sogar häufig gemachte Rechtschreibfehler nachdenken, um den Nutzer noch besser zu unterstützen. Möglich wären auch Varianten mit und ohne Bindestrich („ost-indisches ostindisches“) oder Apostroph („kenny’s kennys“). Man sollte auch darüber nachdenken, Abkürzungen und Langformen hinzuzufügen („BWW“ vs. „Buchstabenwortwerte“).

Am Ende werden alle gefundenen Begriffe in einen String abgelegt, getrennt durch Leerzeichen: „alle meine gefundenen suchtexte“. Crowdin wird am Ende häufig Rechtschreibfehler in den Suchtexten anmerken, was völlig normal ist. Das kann gern ignoriert werden.