Qual è ' la differenza pratica tra un ' glifo ' e un ' carattere '?

Ho visto questa domanda sulla proposta del sito Typography e mi ha infastidito di non averlo fatto “Non conosco la risposta. Ho sempre trattato” glifo “e” carattere “come intercambiabili.


Dopo aver letto una spiegazione sullUnicode Pagina del modello di codifica dei caratteri , la mia comprensione è più o meno questa:

  • I caratteri sono definiti dal loro significato nel linguaggio, i glifi, dal loro aspetto . Quindi, la legatura per combinare esteticamente fi è un glifo, ma due caratteri.

Quindi, la mia convinzione è (per favore correggimi se io ” Sbaglio) che la differenza pratica sarebbe:

  • I parser di testo che non sono interessati allestetica del testo leggeranno i glifi come i rispettivi caratteri. Quindi:
    • Se dovessi copiare e incollare testo contenente glifi in un semplice editor di testo, i glifi verrebbero convertiti nei rispettivi caratteri (a glifo legatura diventerebbe f e i )
    • Qualsiasi sistema automatizzato ben fatto basato sullanalisi del testo (ad esempio crawler dei motori di ricerca, screen reader, correttori ortografici) interpreterà i glifi come i rispettivi caratteri.
    • Un carattere può avere molti glifi o set di glifi. Voglio dire che un glifo può avere un solo carattere, ma chiaramente questo non è corretto in quanto vi è un esempio nellarticolo collegato di 3 glifi e gruppi di glifi che sembrano corrispondere ciascuno a un carattere e a un insieme di caratteri. Non vedo bene come potrebbe funzionare: sicuramente questo significa che ci sarà incoerenza o ambiguità nel modo in cui quei glifi vengono interpretati, variando dallinterprete? (O varia in base alla lingua o al carattere?)
    • Mentre i browser di glifi (ad esempio quello in Illustrator) contengono il set completo di glifi di un font, le mappe dei caratteri (ad esempio la mappa dei caratteri di Windows) contengono solo caratteri, non glifi che sono più caratteri come le legature (qualcosa che non avevo notato prima)

Mi sembra di essere quasi arrivato, ma ho chiaramente frainteso qualcosa da qualche parte lungo la linea: non solo la cosa “Un glifo con più caratteri”, ma anche il comportamento di copia e incolla con le legature non è “t proprio quello che mi aspettavo:

  • Copia la legatura da Illustrator a questa casella di input: incolla come fi (due caratteri) come previsto .
  • Incolla il relativo codice HTML () – viene visualizzato come legatura quando non è in un blocco di codice (fi – che in questo carattere non assomiglia molto a una legatura, ma tu” vedi è uno se provi a selezionarne solo la metà) e il codice in un blocco di codice (fi), come previsto.
  • Copia e incolla la legatura renderizzata non a blocchi di codice torna nella casella di input: incolla come carattere di legatura e viene visualizzata come legatura indipendentemente dal fatto che sia in un blocco di codice o meno (fi e ). Allo stesso modo le parole che lo contengono: fi t mis fi ts (fit misfits) incolla come fit misfts (fit misfits). Forse dipende dal fatto che il punto in cui viene incollato comprenda la codifica utilizzata?

Quanto è sbagliata la mia comprensione di questo? Qualcuno può correggermi: affermando un chiaro definizione della differenza tra glifi e caratteri (se il mio è sbagliato o può essere migliorato), e fornire esempi più chiari / più accurati del mio di ciò che significa in pratica ?

Commenti

  • Diventa molto più complicato quando hai script come larabo in cui combini i caratteri.
  • @MartinSchr ö der +1 Suona come la frase di apertura di una risposta eccellente … 🙂

Risposta

I glifi si riferiscono a come il testo viene reso, i caratteri a come viene interpretato. Quando copi & incolla, lapplicazione sorgente di solito offre una scelta di diversi formati. Il testo normale scomporrà la legatura in f e i, il formato HTML potrebbe tradurla nellentità char che hai citato o anche scomporla in f e i.

In generale la relazione tra caratteri e glifi è n: m. Nelle lingue indiane alcuni caratteri si dividono in due glifi che sono collocati in punti diversi della parola. In latino il più vicino a quella situazione sarebbe rendere é come due glifi (e e ´).In arabo ogni carattere ha diversi glifi a seconda della sua posizione allinterno di una parola: iniziale, centrale, finale o isolata.

La traduzione da caratteri a glifi è specifica per ciascuna applicazione e per le caratteristiche tipografiche che supporta. Per il testo latino questa traduzione era semplice, ma i caratteri OpenType hanno introdotto funzionalità aggiuntive come legature, ornati, forme alternative, maiuscoletto ecc.

Per motivi pratici ti preoccupi solo dei glifi quando implementi come unapplicazione esegue il rendering del testo o quando si progetta un carattere o quando si desidera applicare una funzionalità OpenType che sostituisce alcuni glifi con altri (ad esempio le legature). Altrimenti i punti di codice Unicode sono tuoi amici.

Commenti

  • Ciao user322483, benvenuto in GDSE e grazie per la tua risposta. In caso di domande, visita il Centro assistenza o invia un ping a uno di noi in Graphic Design Chat una volta che la tua reputazione è sufficiente (20). Continua a contribuire e divertiti con il sito!
  • Scrivi ” In arabo ogni carattere ha diversi glifi a seconda della sua posizione allinterno di una parola: iniziale, centrale, finale o isolato . ” < — ‘ non sarebbero caratteri diversi. Linglese ha A e a, ma nel linguaggio informatico, A e a sono caratteri diversi. ogni glifo è mappato a un codice diverso. Lebraico ha chaf e chaf finale (la lettera chaf alla fine di una parola, sembra diversa) e i ‘ sono sicuro che ‘ s definito come un carattere diverso nellinformatica.

Risposta

Non credo che la tua comprensione sia sbagliata tu ” vedi solo sistemi che cercano di aiutare lutente incollando ciò che pensa di volere. Poiché alcune legature (“fi”, “fl”) sono abbastanza comuni al di fuori dei sistemi di composizione tipografica, il software riconosce che lutente probabilmente non ha inserito quel glifo, piuttosto unaltra app ha trasformato i caratteri digitati.

In breve : Il carattere si riferisce a ununità linguistica. Glifo si riferisce a unistanza progettata di tale unità, sia essa maiuscola, minuscola, maiuscola, variante storica o stilistica.

Commenti

  • In informatica, A e a sono caratteri diversi. ASCII ha 128 caratteri e il termine carattere include A e a come caratteri distinti.
  • Gli ingegneri usano molte parole che non ‘ t essere in linea con i precedenti in altri settori. Il tuo è un buon esempio.
  • che ha inventato il termine ” carattere ” e ” glyph ” f prima? grafici o ingegneri informatici? ‘ pensavo che i computer venissero prima del design grafico. Ma potrebbe esserci unindustria della stampa che ha preceduto la progettazione grafica e discutibile ha preceduto i computer in qualche modo o ha preceduto i computer moderni. Immagino che però le persone che potrebbero rispondere meglio per quello che ora è il design grafico siano lindustria della stampa, ma ‘ non cè nessuno scambio di stack nel settore della stampa. Ma ‘ sarebbe interessante sapere chi ha preso in prestito da chi e in che modo è il termine Carattere.
  • La tipografia è arrivata molto prima Ingegneria software. Per favore scrivi qui se intraprendi la ricerca e trovi le origini. La mia ipotesi è che accadrà nel XVII secolo. Forse già i primi tipografi a metà del XVI secolo.

Risposta

Ci sono un paio di risposte qui che forniscono buone informazioni sui glifi e sui personaggi, ma non affrontano realmente la fonte della tua confusione riguardo a copiare e incollare.

Prima di tutto, la tua comprensione è fondamentalmente corretta:

I caratteri sono definiti dal loro significato nella lingua, i glifi, dal loro aspetto . Quindi, la legatura per combinare esteticamente fi è un glifo, ma due caratteri.

Vale la pena sottolineare che lelenco di caratteri è definito dallUnicode standard, che è pubblicato dallUnicode Consortium, in quanto “sono lautorità per la codifica del testo in un formato leggibile dalla macchina. La definizione di cui sopra è essenzialmente la linea guida primaria che i membri del consorzio Unicode utilizzano per determinare se alcuni proposti addit ione in Unicode è un carattere e quindi degno di essere incluso, o un glifo e dovrebbe essere gestito dai renderer di font.

Lo menziono perché la confusione hai sperimentato sopra era dovuto al fatto che esistono diversi caratteri di legatura (non glifi ) in Unicode.Ad esempio, U+FB01 è il carattere della fi legatura: http://unicode.org/charts/PDF/UFB00.pdf

Avere caratteri di legatura in Unicode non è proprio nello spirito della definizione di cui sopra per quali tipi di cose dovrebbero essere inclusi nello standard Unicode come caratteri, poiché le legature non hanno realmente un significato indipendente da la composizione di altri due personaggi. Le persone Unicode ne sono naturalmente consapevoli e le FAQ Unicode sulle legature lo ammettono:

Le legature esistenti esistono fondamentalmente per compatibilità e round trip con set di caratteri non Unicode. Il loro uso è sconsigliato.

Lesistenza di questo personaggio è in ultima analisi la fonte della tua confusione.

In un software correttamente implementato, la copia il testo dovrebbe sempre copiare i caratteri specificati, non i glifi , e questo è esattamente quello che sta succedendo nei tuoi tre esempi.

1) Nel primo esempio, hai digitato f e i in Illustrator, che ha reso un unico glifo legatura . Quando hai selezionato e copiato il glifo renderizzato, Illustrator ha copiato correttamente f (U+0066) e i (U+0069) negli appunti.

2) Nel secondo esempio, hai digitato il codice HTML per la legatura carattere (&#64257) nella casella di immissione e ha ottenuto correttamente il glifo della legatura che rappresenta il carattere della legatura (. Poiché il carattere sottostante è in realtà il carattere oscuro e relativamente inutile della legatura che ho citato sopra, selezionando quel glifo copierà un singolo carattere U+FB01.

3) Nel terzo esempio, stai “copiando la legatura renderizzata carattere U+FB01 visualizzato nella parte 2, che verrà sempre incollato come quel carattere. La tua confusione principale sembra riguardare la differenza tra i codici di entità HTML e i caratteri, in particolare per quanto riguarda il modo in cui vengono visualizzati allinterno e allesterno dei blocchi di codice.

Il codice dellentità HTML &#64257; è una stringa di 8 caratteri distinti. Il renderer HTML del tuo browser web sostituisce questi 8 caratteri U+0026 U+0023 U+0036 U+0032 U+0035 U+0037 U+0023 con il singolo carattere Unicode U+FB01, che viene quindi visualizzato in modo appropriato. Tuttavia, il tag <code> in HTML disabilita questo comportamento, lasciando quegli 8 caratteri così come sono.

Quando si copia dallHTML renderizzato, si copia il caratteri (che sono diversi dai glifi resi). Pertanto, quando copi lentità HTML sottoposta a rendering, il singolo carattere U+FB01 viene copiato negli appunti.

Quando incolli U+FB01 carattere di nuovo nellHTML, non è necessaria alcuna sostituzione, il che significa che il carattere viene visualizzato come una legatura indipendentemente dal fatto che rientri o meno in un <code> blocco.

Risposta

I caratteri sono ciò che è memorizzato nei file di testo, elaborato dalle applicazioni e spostati, mentre i glifi sono la loro rappresentazione visiva.

Per avere unimmagine chiara, vediamo cosa succede quando unapplicazione cerca di rendere una stringa di testo sullo schermo (in modo un po semplificato):

  • Lapplicazione legge prima la stringa di testo, ovvero la stringa di caratteri archiviata sul disco o in memoria.
  • La invia quindi a un motore di layout di testo, tra alcuni altre proprietà come il carattere desiderato, la lingua del testo e così via:
    • T Il motore di layout del testo fondamentalmente apre il file del font, gli chiede il / i glifo / i corrispondente / i a ciascun carattere e fa qualche sostituzione del glifo (come sostituire il glifo per f e i con il glifo della legatura di fi) e posizionamento (come la crenatura).
    • Alla fine il motore di layout ha una sequenza di glifi, le loro posizioni luna rispetto allaltra e una mappatura tra i caratteri di input e i glifi di output. La mappatura da carattere a glifo è in modo che sappia che i primi due caratteri nella parola file corrispondono a due il primo glifo (la legatura fi ), il 3 ° carattere al 2 ° glifo e il 4 ° carattere al 3 ° glifo.
  • Viene quindi utilizzata una libreria di rendering grafico per “disegnare” quei glifi sullo schermo utilizzando forme dal carattere.
  • Quando lutente seleziona “glifi” sullo schermo, lapplicazione consulta la mappatura da glifo a testo fornita dal motore di layout per trovare quale parte del testo di input corrisponde a ciò che il lutente sta selezionando e invia quel testo agli appunti quando lutente lo copia.
  • Lo stesso accade quando lutente inserisce il cursore al centro del testo e inizia a digitare, la mappatura determina dove nel testo di input inserire i nuovi caratteri e il testo di aggiornamento viene inviato al motore di layout a elaborare e ridisegnare e così via.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *