Was ' ist der praktische Unterschied zwischen einem ' Glyphen ' und einem ' Zeichen '?

Ich habe diese Frage auf dem Typografie-Site-Vorschlag gesehen und es hat mich gestört, dass ich dies nicht getan habe Ich kenne „Glyphe“ und „Zeichen“ immer als austauschbar.


Nach dem Lesen einer Erklärung zum Unicode Auf der Seite Modell des Zeichenkodierungsmodells verstehe ich ungefähr Folgendes:

  • Zeichen werden durch ihre Bedeutung in der Sprache, Glyphen, durch ihr Erscheinungsbild . Die Ligatur für die ästhetische Kombination von fi ist also eine Glyphe, aber zwei Zeichen.

Mein Glaube ist also (bitte korrigieren Sie mich, wenn ich “ m falsch), dass der praktische Unterschied wäre:

  • Textparser, die nicht an der Ästhetik von Text interessiert sind, lesen Glyphen als ihre jeweiligen Zeichen. Also:
    • Wenn Sie Text mit Glyphen in einen Nur-Text-Editor kopieren und einfügen, werden die Glyphen in ihre jeweiligen Zeichen konvertiert (a Ligaturzeichen wird zu f und i )
    • Jedes gut gemachte automatisierte System, das auf Textanalyse basiert (z. B. Suchmaschinen-Crawler, Bildschirmleser, Rechtschreibprüfung), würde die Glyphen als ihre jeweiligen Zeichen interpretieren.
    • Ein Zeichen kann viele haben Glyphen oder Glyphensätze. Ich möchte sagen, dass eine Glyphe nur ein Zeichen haben kann, aber dies ist eindeutig nicht richtig, da es ein Beispiel für den verknüpften Artikel von 3 Glyphen und Glyphensätzen gibt, die jeweils einem Zeichen und einer Gruppe von Zeichen entsprechen. Ich sehe nicht ganz ein, wie das funktionieren könnte: Das bedeutet sicherlich, dass es Inkonsistenzen oder Unklarheiten bei der Interpretation dieser Glyphen gibt, die je nach Interpret variieren? (Oder variiert sie je nach Sprache oder Schriftart?)
    • Während Glyphenbrowser (z. B. der in Illustrator) den vollständigen Glyphensatz einer Schriftart enthalten, enthalten Zeichentabellen (z. B. die Windows-Zeichentabelle) nur Zeichen, keine Glyphen, die mehrere Zeichen wie Ligaturen sind (etwas, das ich vorher nicht bemerkt hatte)

Ich habe das Gefühl, fast da zu sein, aber ich habe irgendwo auf der Linie eindeutig etwas falsch verstanden: nicht nur die Sache „Ein Glyphe mehrere Zeichen“, Aber auch das Kopieren und Einfügen von Verhalten mit Ligaturen ist nicht ganz das, was ich erwartet hatte:

  • Kopieren Sie die Ligatur von Illustrator in dieses Eingabefeld: Fügt wie erwartet fi (zwei Zeichen) ein
  • Fügen Sie den HTML-Code dafür ein () – wird als Ligatur angezeigt, wenn Sie sich nicht in einem Codeblock befinden (fi – was in dieser Schriftart nicht wie eine Ligatur aussieht, aber Sie“ ll Siehe ist eine, wenn Sie versuchen, nur die Hälfte davon auszuwählen, und der Code in einem Codeblock (fi) wie erwartet.
  • Kopieren und Einfügen Die gerenderte Nicht-Codeblock-Ligatur wird wieder in das Eingabefeld eingefügt: Wird als Ligaturzeichen eingefügt und als Ligatur gerendert, unabhängig davon, ob sie sich in einem Codeblock befindet oder nicht (fi und ). Ebenso Wörter, die es enthalten: fi t mis fi ts (fit misfits) wird eingefügt, wenn nicht passt (fit misfits). Vielleicht hängt es davon ab, ob der Ort, an dem es eingefügt wird, die verwendete Codierung versteht?

Wie weit ist mein Verständnis davon falsch? Kann mich jemand korrigieren: ein klares Definition des Unterschieds zwischen Glyphen und Zeichen (wenn meine falsch ist oder verbessert werden kann), und geben Sie klarere / genauere Beispiele als meine, was das in der Praxis bedeutet ?

Kommentare

  • Es wird viel komplizierter, wenn Sie Skripte wie Arabisch haben, in denen Sie Zeichen kombinieren.
  • @MartinSchr ö der +1 Klingt wie der Anfangssatz einer ausgezeichneten Antwort … 🙂

Antwort

Glyphen beziehen sich darauf, wie Text gerendert wird, Zeichen darauf, wie er interpretiert wird. Wenn Sie & einfügen, bietet die Quellanwendung normalerweise eine Auswahl verschiedener Formate. Klartext zerlegt die Fi ligatur in f und i. Das HTML-Format übersetzt sie möglicherweise in die von Ihnen angegebene Zeichenentität oder zerlegt sie auch in f und i.

Im Allgemeinen ist die Beziehung zwischen Zeichen und Glyphen n: m. In indischen Sprachen teilen sich einige Zeichen in zwei Glyphen, die an verschiedenen Stellen des Wortes platziert sind. Im Lateinischen wäre es am nächsten, wenn é als zwei Glyphen (e und ´) dargestellt würde.Auf Arabisch hat jedes Zeichen je nach Position innerhalb eines Wortes unterschiedliche Glyphen: Anfang, Mitte, Ende oder isoliert.

Die Übersetzung von Zeichen in Glyphen ist für jede Anwendung und die von ihr unterstützten typografischen Funktionen spezifisch. Für lateinischen Text war diese Übersetzung früher unkompliziert, aber OpenType-Schriftarten führten zusätzliche Funktionen wie Ligaturen, Schrägstriche, alternative Formen, Kapitälchen usw. ein.

Aus praktischen Gründen beschäftigen Sie sich bei der Implementierung einer Anwendung nur mit Glyphen rendert Text oder wenn Sie eine Schriftart entwerfen oder wenn Sie eine OpenType-Funktion anwenden möchten, die einige Glyphen durch andere ersetzt (z. B. Ligaturen). Ansonsten sind Unicode-Codepunkte Ihr Freund.

Kommentare

  • Hallo Benutzer322483, willkommen bei GDSE und vielen Dank für Ihre Antwort. Wenn Sie Fragen haben, wenden Sie sich bitte an die -Hilfezentrale oder rufen Sie einen von uns im Grafikdesign-Chat an. a> sobald Ihr Ruf ausreicht (20). Tragen Sie weiter bei und genießen Sie die Website!
  • Sie schreiben “ Auf Arabisch hat jedes Zeichen je nach Position innerhalb eines Wortes unterschiedliche Glyphen: Anfang, Mitte, Ende oder isoliert . “ < — Würden ‚ nicht unterschiedliche Zeichen sein. Englisch hat A und a, aber im Computergespräch sind A und a unterschiedliche Zeichen. Jedes Symbol wird einem anderen Code zugeordnet. Hebräisch hat chaf und final chaf (der Buchstabe chaf am Ende eines Wortes sieht anders aus) und ich ‚ bin sicher, dass es ‚ s ist wird im Computer als ein anderes Zeichen bezeichnet.

Antwort

Ich glaube nicht, dass Ihr Verständnis falsch ist, Sie “ Ich sehe nur Systeme, die versuchen, dem Benutzer zu helfen, indem sie das einfügen, was er für wünschenswert hält. Da einige Ligaturen („fi“, „fl“) außerhalb von Satzsystemen ziemlich häufig sind, erkennt die Software, dass der Benutzer diese Glyphe wahrscheinlich nicht eingegeben hat, sondern dass eine andere App ihre eingegebenen Zeichen transformiert hat.

Kurz gesagt : Das Zeichen bezieht sich auf eine Spracheinheit. Glyphe bezieht sich auf eine entworfene Instanz dieser Einheit, egal ob es sich um eine Groß-, Klein-, Kleinbuchstaben-, historische oder stilistische Variante handelt.

Kommentare

  • Beim Rechnen sind A und a unterschiedliche Zeichen. ASCII hat 128 Zeichen und der Begriff Zeichen enthält A und a als unterschiedliche Zeichen.
  • Ingenieure verwenden viele Wörter, die nicht ‚ stimmt nicht mit Präzedenzfällen in anderen Branchen überein. Ihr Beispiel ist ein gutes Beispiel.
  • der den Begriff “ Zeichen “ und “ Glyphe “ f zuerst? Grafikdesigner oder Computeringenieure? Ich ‚ hätte gedacht, dass die Computer vor dem Grafikdesign kamen. Aber es kann eine Druckindustrie geben, die dem Grafikdesign vorausging und in gewisser Weise vor Computern stand oder vor modernen Computern. Ich denke, die Leute, die am besten für das, was jetzt Grafikdesign ist, antworten könnten, sind die Druckindustrie, aber ‚ gibt es keinen Stapelaustausch in der Druckindustrie. Aber ‚ wäre interessant zu wissen, wer von wem geliehen hat und auf welche Weise der Begriff Charakter.
  • Typografie kam lange vor Softwareentwicklung. Bitte posten Sie hier, wenn Sie die Forschung durchführen und die Ursprünge finden. Ich vermute, dass es irgendwann im 17. Jahrhundert sein wird. Möglicherweise schon bei den ersten Typografen Mitte des 16. Jahrhunderts.

Antwort

Hier gibt es einige Antworten das gibt gute Informationen über Glyphen gegen Zeichen, aber sie sprechen nicht wirklich die Quelle Ihrer Verwirrung in Bezug auf das Kopieren und Einfügen an.

Zunächst einmal ist Ihr Verständnis grundsätzlich korrekt:

Zeichen werden durch ihre Bedeutung in der Sprache, Glyphen, durch ihr Aussehen definiert. Die Ligatur für die ästhetische Kombination fi ist eine Glyphe, aber zwei Zeichen.

Hervorzuheben ist, dass die Liste der Zeichen vom Unicode definiert wird Standard, der vom Unicode-Konsortium veröffentlicht wird, da sie die Autorität für die Codierung von Text in einem maschinenlesbaren Format haben. Die obige Definition ist im Wesentlichen die primäre Richtlinie, anhand derer die Mitglieder des Unicode-Konsortiums bestimmen, ob einige vorgeschlagen werden oder nicht addit Ion to Unicode ist ein Zeichen und daher einschlusswürdig oder ein Glyphe und sollte von Schrift-Renderern verarbeitet werden.

Ich erwähne dies wegen der Verwirrung Sie haben oben erfahren, dass es in Unicode mehrere Ligatur- -Zeichen (keine Glyphen ) gibt.Zum Beispiel ist U+FB01 das Zeichen für die Ligatur: http://unicode.org/charts/PDF/UFB00.pdf

Ligaturzeichen in Unicode zu haben, entspricht nicht wirklich der obigen Definition, welche Arten von Dingen als Zeichen in den Unicode-Standard aufgenommen werden sollen, da Ligaturen keine wirklich unabhängige Bedeutung haben die Zusammensetzung von zwei anderen Zeichen. Die Unicode-Leute sind sich dessen natürlich bewusst, und die Unicode-FAQ zu Ligaturen gibt Folgendes zu:

Die vorhandenen Ligaturen dienen im Wesentlichen der Kompatibilität und dem Roundtripping mit Nicht-Unicode-Zeichensätzen. Von ihrer Verwendung wird abgeraten.

Die Existenz dieses Zeichens ist letztendlich die Quelle Ihrer Verwirrung.

In korrekt implementierter Software wird kopiert Text sollte immer die angegebenen Zeichen kopieren, nicht die Glyphen , und genau das ist in Ihren drei Beispielen der Fall.

1) Im ersten Beispiel haben Sie f und i in Illustrator eingegeben, wodurch eine einzelne Ligatur glyph gerendert wurde . Wenn Sie diese gerenderte Glyphe ausgewählt und kopiert haben, hat Illustrator die f (U+0066) und i (U+0069) Zeichen in Ihre Zwischenablage.

2) Im zweiten Beispiel haben Sie den HTML-Code für das Ligaturzeichen (&#64257) in das Eingabefeld und eingegeben Die Ligatur Glyphe , die das Ligaturzeichen darstellt (. Da das zugrunde liegende Zeichen tatsächlich das obskure und relativ sinnlose Ligaturzeichen ist, das ich oben erwähnt habe, wurde korrekt ausgewählt Diese Glyphe kopiert ein einzelnes Zeichen U+FB01.

3) Im dritten Beispiel kopieren Sie das gerenderte Ligaturzeichen U+FB01, das in Teil 2 gerendert wurde und immer als dieses Zeichen eingefügt wird. Ihre Hauptverwirrung scheint in Bezug auf den Unterschied zwischen HTML-Entitätscodes und Zeichen zu liegen, insbesondere in Bezug auf die Art und Weise, wie sie gerendert werden innerhalb und außerhalb von Codeblöcken.

Der HTML-Entitätscode &#64257; ist eine Zeichenfolge mit 8 verschiedenen Zeichen. Der HTML-Renderer Ihres Webbrowsers ersetzt diese 8 Zeichen U+0026 U+0023 U+0036 U+0032 U+0035 U+0037 U+0023 mit dem einzelnen Unicode-Zeichen U+FB01, das dann entsprechend gerendert wird. Das <code> -Tag in HTML deaktiviert dieses Verhalten jedoch und lässt diese 8 Zeichen unverändert.

Wenn Sie gerenderten HTML-Code kopieren, kopieren Sie das gerenderte Zeichen (die sich von den gerenderten Glyphen unterscheiden). Wenn Sie also Ihre gerenderte HTML-Entität kopieren, wird das einzelne Zeichen U+FB01 in Ihre Zwischenablage kopiert.

Wenn Sie die U+FB01 Zeichen zurück in den HTML-Code, es muss keine Ersetzung stattfinden, dh das Zeichen wird als Ligatur gerendert, unabhängig davon, ob es in ein <code> Block.

Antwort

Zeichen werden in Textdateien gespeichert, von Anwendungen verarbeitet und bewegt, während Glyphen ihre visuelle Darstellung sind.

Um ein klares Bild zu erhalten, sehen wir, was passiert, wenn eine Anwendung versucht, eine Textzeichenfolge auf dem Bildschirm zu rendern (etwas vereinfacht):

  • Die Anwendung hat zuerst die Textzeichenfolge gelesen, dh die Zeichenfolge, die auf der Festplatte oder im Speicher gespeichert ist.
  • Anschließend wird sie unter anderem an eine Textlayout-Engine gesendet andere Eigenschaften wie die gewünschte Schriftart, Textsprache usw.:
    • T. Die Textlayout-Engine öffnet im Grunde die Schriftartdatei, fragt sie nach den Glyphen, die den einzelnen Zeichen entsprechen, und ersetzt sie durch Glyphen (z. B. Ersetzen der Glyphen für f und i mit dem Ligaturzeichen von fi) und Positionierung (wie Kerning).
    • Am Ende hat die Layout-Engine eine Folge von Glyphen, ihre Positionen relativ zueinander und eine Zuordnung zwischen Eingabezeichen und Ausgabeglyphen. Die Zuordnung von Zeichen zu Glyphen ist so, dass bekannt ist, dass die ersten beiden Zeichen im Wort file zwei der ersten Glyphe entsprechen (die fi -Ligatur ), das 3. Zeichen zum 2. Glyphen und das 4. Zeichen zum 3. Glyphen.
  • Eine Grafik-Rendering-Bibliothek wird dann verwendet, um diese Glyphen auf dem Bildschirm mit zu „zeichnen“ Formen aus der Schriftart.
  • Wenn der Benutzer auf dem Bildschirm „Glyphen“ auswählt, konsultiert die Anwendung die von der Layout-Engine bereitgestellte Zuordnung von Glyphen zu Text, um herauszufinden, welcher Teil des Eingabetextes dem entspricht Der Benutzer wählt diesen Text aus und sendet ihn an die Zwischenablage, wenn er ihn kopiert.
  • Dasselbe passiert, wenn der Benutzer den Cursor in die Mitte des Textes einfügt und mit der Eingabe beginnt, die Zuordnung bestimmt, wo im Eingabetext die neuen Zeichen eingefügt werden sollen, und der Aktualisierungstext an die Layout-Engine an gesendet wird verarbeiten und neu zeichnen und so weiter.
  • Schreibe einen Kommentar

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.