Internationalisierung, Lokalisierung, Codierung, Island und Übersetzung einer japanischen Katzenfoto-Website

Internationalisierungsübersetzung

InternationalisierungEs gibt viele Informationen zur Internationalisierung, Lokalisierung und Codierung in Webanwendungen. Es gibt auch viele Missverständnisse darüber, was jede für eine Webanwendung bereitstellt. Hier ist meine Einstellung ...

Wenn ein Webbrowser eine Verbindung zu einem Webserver herstellt, übergibt er einige Variablen und stellt zusätzliche Anforderungen. Hier ein Beispiel:

GET / HTTP / 1.1
Gastgeber: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Akzeptieren: HTTP Akzeptieren = Text / XML, Anwendung / XML, Anwendung / XHTML + XML, Text / HTML; q = 0.9, Text / Klartext; q = 0.8, Bild / PNG, * / *; q = 0.5
Akzeptiere-Sprache: en-us, en; q = 0.5
Accept-Encoding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internationalisierung

Internationalisierung setzt sich aus vielen Dingen zusammen:

  1. Lokalisierung: Die Fähigkeit zu identifizieren, aus welcher Sprache und an welchem ​​Ort ein Besucher besucht. Dies erfolgt über HTTP-Anforderungen, bei denen der Besucher durch ein Gebietsschema identifiziert wird. In meinem Fall ist das en-US. "En" ist Englisch und "US" sind die Vereinigten Staaten. Dies ist eine Einstellung in meinem Betriebssystem.
  2. Zeitzonen: Die Möglichkeit zur Anpassung an Zeitzonen. Dies wird normalerweise erreicht, indem Sie Ihren Server auf eine Greenwich Mean Time (GMT) einstellen und den Benutzern dann erlauben, ihren lokalen Offset von GMT einzustellen.
  3. Zeichenkodierung: Dies ist die Fähigkeit, Sprachzeichensätze richtig anzuzeigen. Es unterscheidet sich von der Lokalisierung, da die Lokalisierung mir die Sprache und Region des Computers mitteilen kann, von dem aus die Anfrage gestellt wird, aber nicht sagt, in welcher Sprache die Leser bittet ... das liegt beim Leser!

Beachten Sie in meinem HTTP-Header, dass der Browser, als er die Anforderung stellte, dem Server mitteilte, dass er mein Gebietsschema angefordert hat (Accept-Language: en-us). Es muss dem Server jedoch auch mitgeteilt werden, welcher Zeichensatz angefordert wird (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7). ISO-8859-1 und utf -8 sind beide zulässige Zeichensätze.

Lokalisierung

In dieser fantastischen durcheinandergebrachten Welt diktiert die Lokalisierung nie mehr die Sprache. Obwohl ich in den USA bin, kann ich mit einem anderen Zeichensatz absolut eine andere Sprache lesen. Das passiert, wenn ich sie benutze Google Hindi (Ich benutze Google Hindi nicht wirklich). Meine Anfrage nach Gebietsschema und Zeichensatz ist identisch mit der Anfrage nach Google Englisch Seite, aber ich habe tatsächlich eine Seite gefüttert, die ich nicht lesen kann, weil ich den Zeichensatz nicht habe. Es kommt alles auf ???????????… Ich kann diesen Zeichensatz jedoch in Firefox laden (Firefox> Einstellungen> Erweitert> Sprachen):

Firefox-Ladesprache

Wenn ich diese Sprache lade, kann ich die Seite in ihrem nativen Zeichensatz anfordern und auf meinem Computer anzeigen, obwohl mein Standardgebietsschema en-US ist!

Also ... wenn ich ein Hindi-Student bin, Englisch in Purdue lerne und über verbunden bin VPN Auf dem Server der Schule, im Urlaub in Australien ... gibt es drei verschiedene Einstellungen, die auf die Anwendung angewendet werden müssen, um wirklich internationalisiert zu werden - und keine hängen vom anderen ab.

Mein Gebietsschema würde als en-US angezeigt, aber meine Zeitzone ist Australien, aber die Sprache, die ich von der Website anfordere, ist möglicherweise Hindi. Wenn ich meine Bewerbung programmieren würde, um zu machen Annahmen Aufgrund des Gebietsschemas meines Computers würde ich mich völlig irren - wenn ich die Person Englisch in einer östlichen Zeitzone füttere. Idealerweise würde ich meine Bewerbung so programmieren, dass sie angeboten wird beide Sprach- und Zeitzoneneinstellungen… aber ich würde sie nicht basierend auf dem Gebietsschema annehmen.

Island - das ultimative Beispiel

Wir kennen keine mehrsprachigen und mehrsprachigen Herausforderungen in den USA, in denen wir tätig sind Alle Englisch sprechen [Sarkasmus impliziert]. In einigen Ländern wie Island, obwohl die Muttersprache Isländisch ist, lernen die unglaublichen Isländer 3 Sprachen! Da Island ein Land in der Mitte Europas und Nordamerikas ist, arbeiten ihre Unternehmen von ihrem Desktop aus auf mehreren Kontinenten, Sprachen, Dialekten von Sprachen und mehreren Zeitzonen!

Viele isländische Websites sind in US-Englisch, UK-Englisch, Isländisch, Spanisch, Spanisch, Französisch und Deutsch erstellt! Stellen Sie sich vor, wie schwierig es wäre, zu bauen Icelandair's Website-Anwendungen und Ticketingsysteme… wow!

HAFTUNGSAUSSCHLUSS: Ich hatte das absolute Vergnügen, mit den feinen Leuten von Icelandair zusammenzuarbeiten, und kann Ihnen sagen, dass sie zu den talentiertesten und freundlichsten Fachleuten gehören, mit denen ich das Vergnügen hatte, zusammenzuarbeiten. Es ist einfach ein erstaunliches Land und Leute! Besuchen Sie ... nehmen Sie Icelandair und besuchen Sie die Blaue Lagune!

Sprache versus Kodierung

Es gibt sogar verschiedene Zeichenkodierungen in einer Sprache, die nicht gut miteinander spielen! Beispiel: Eine in Shift-JIS geschriebene japanische E-Mail kann auf dem Computer einer japanischen Person mit der Lokalisierung auf ja-JP unlesbar werden, da ihr Mailserver nur EUC-JP erkennt. Im Idealfall sollte ein Kunde in der Lage sein, festzulegen, welche Codierung er möchte und welche Sprache - und einfach sicherstellen, dass die Codierung und Sprache mit den Anforderungen des Kunden kompatibel sind.

Wenn ich Japanisch lesen möchte, muss ich möglicherweise sowohl Japanisch als meine Sprache als auch Shift-JIS für die Codierung auswählen, um diese Sprache richtig anzuzeigen. Hier ist noch etwas Verwirrung, die der Mischung hinzugefügt werden muss. Einige Codierungstypen unterstützen mehrere Sprachen. UNICODE / UTF8 unterstützt Dutzende. Das Gegenteil ist auch der Fall. Einige Sprachen können in vielen Codierungsarten gelesen werden. Wenn das keinen Sinn ergibt ... Ich entschuldige mich, es ist ein sehr komplexes Thema.

Eines Tages glaube ich (hoffe), dass sich dies alles ändern wird. Ich denke, die ursprünglichen Designer von Lokalisierungscodes hofften, dass die Kombination aus Sprache und Land alles sein würde, was benötigt wird… aber wir sind weitaus ausgefeilter geworden. Denken Sie daran, dass vieles davon entwickelt wurde, bevor es ein Internet gab. Mit dem Beginn von GISVielleicht kann eine Person ihre Codierung auswählen und GIS würde Zeitzonen- und Gebietsschemainformationen verarbeiten.

Internationalisierung

Zurück zur Internationalisierungsunterstützung. Wenn Sie eine internationalisierte Anwendung bereitstellen möchten, müssen Sie:

  1. Unterstützt mehrere Codierungstypen, Sprachen und verfügt über Übersetzungsdateien, um diese Übersetzungen anzuzeigen.
  2. Ermöglichen Sie dem Client, seine Sprache und gegebenenfalls sogar seinen Codierungstyp festzulegen.
  3. Unterstützen Sie Zeitzonen, indem Sie Benutzern erlauben, ihre Zeitzone im Vergleich zu GMT zu referenzieren.
  4. Verwenden Sie Lokalisierungscodes mit Vorsicht. Sie geben NICHT genau wieder, was Ihr Benutzer tatsächlich anfordert oder was er lesen kann.

Übersetzung

Die maschinelle Übersetzung steckt noch in den Kinderschuhen. Es gibt eine Reihe von Websites (und WordPress Plugins), die eine maschinelle Übersetzung Ihrer Website anbieten. Seien Sie nicht versucht, dies zu tun. Es gibt zwei Gründe dafür:

  1. Wenn die maschinelle Übersetzung funktioniert, hat der Benutzer, der Ihre Site auscheckt, bereits einen Übersetzer, mit dem er arbeiten kann.
  2. Maschinelle Übersetzung ist scheiße.

Glaubst du mir nicht? Hier ist eine japanische Übersetzung für Sie:
Eingefügt von Masatsu-Datei - Ein Typ mit einer Menge Bilder von Katzen:

Japanischer Blogeintrag

???
- 00:29:35 von masatsu

??????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
????????????????????????????????

??????????????????????????????????? (?)

?????????????????

??????????????
???
???

???????????????????????????????????????

???????????????????????????????

?????????????????????????????????????
??????????????????????????????????
?????????? Ag ???????????????

???????????????????????????????????????

Maschinenübersetzung:

?? Hanne ??????
-00: 29: 35 von masatsu

Der Name des Faustheiligen eines / des Elefanten, der gestern auf der „A / the Beast Fist Flotte ?? Ranger “„ ?? Hann ???? ” mit einem / dem Radioschauspieler Yutaka Mizushima….

? (?) das macht Tintenfische leicht.

Weil sogar der Radioschauspieler des ersten Heiligen, Meister ????? von einer / der Katze sind die chinesische Quitte eines Nagai Ichiro = Drachenball der Stab eines / der ?? Ranger sieht aus wie die Leute, die witzige Bemerkungen leicht kennen.

?????? (Der Schweiß), den ich dieses Jahr völlig vergessen habe "das Geheimnis des Namens der Superflotte", der üblichen Praxis jedes Jahr?,

?????? Wenn ich dieses Jahr verspätet schreibe,

??????? Schrein ??? (kann wie?)? Vorgewende cullion (?? nicht schneiden) Fukami ?? (? oder beobachten können?) ein / das ist es, was tut

?????? Mit wird es "eine Dose /? /?", Mit anderen Worten "Kung Fu", wenn Sie den Kopf eines / des Namens ausrichten und ändern.

?????? Obwohl gesagt wird, dass es angeblich zwei weitere erhöht, kann es zu welcher Art von Namen werden.

Die Wahrheit soll "Alter" sein, weil das Silberelementsymbol Ag? Ist, obwohl der Name "das ????" Silber “der Takaoka? Techniker von ??????? dachte, dass der Charakter "?" wurde mit der Assoziation eines Silver-Screen-Films verwendet, wenn er mit einem zusätzlichen Mitglied aufgerufen wird.

?????? Ich denke jedoch egoistisch, dass meine Theorie nicht unabhängig davon ist, dass "?" ist in einem / dem chinesischen Schriftzeichen enthalten.

Ich bin sicher, dass das Umkehren der Polarität dieser Übersetzung eine ebenso lesbare englische Diktion liefern würde. Du hast den Eintrag verstanden, oder?

2 Kommentare

  1. 1

Was denken Sie?

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden.