Mikä ' s on käytännön ero ' -kuvamuodon ' ja ' merkki '?

Näin tämän kysymyksen typografiasivusto-ehdotuksessa ja se vikasi, että en ”En tiedä vastausta. Minä” käsittelin ”glyf” ja ”merkki” aina vaihdettavina.


Luettuani -selityksen Unicodesta Merkkikoodaavan mallin sivu , ymmärrykseni on suunnilleen tämä:

  • Hahmot määritellään niiden merkityksellä kielellä, kuviot, niiden ulkonäöllä . Joten fi esteettisen yhdistämisen liitos on yksi kuviot, mutta kaksi merkkiä.

Joten uskon, että (korjaa, jos minä ” väärin), että käytännön ero olisi:

  • Tekstin jäsentimet, joita ei kiinnosta tekstin estetiikka, lukevat kuviot merkkeinä. Joten:
    • Jos kopioit ja liität kuvioita sisältävän tekstin pelkkään tekstieditoriin, kuviot muunnetaan vastaaviksi merkeiksi (a ligatuuriglyfistä tulee f ja i )
    • Mikä tahansa hyvin tehty automaattinen järjestelmä, joka perustuu tekstin jäsentämiseen (esim. hakukoneiden indeksointirobotit, näytönlukijat, oikeinkirjoituksen tarkistimet), tulkitsee kuviot merkkeinä.
    • Yhdellä merkillä voi olla monia kuviot tai kuvasarjat. Haluan sanoa, että yhdellä kuviossa voi olla vain yksi merkki, mutta tämä ei selvästikään ole ”oikein”, koska linkitetyssä artikkelissa on esimerkki kolmesta kuviosta ja glyfijoukosta, jotka näyttävät vastaavan kutakin merkkiä ja merkistöä. En ymmärrä miten tämä voisi toimia: varmasti se tarkoittaa, että näiden kuvioiden tulkinnassa on epäjohdonmukaisuutta tai epäselvyyttä, vaihtelevatko tulkit? (Vai vaihteleeko se kielen tai fontin mukaan?)
    • Vaikka glyf-selaimet (esim. Illustratorissa olevat) sisältävät koko fontin glyf-sarjan, merkkikartat (esim. Windows-merkkikartta) sisältävät vain merkkejä, ei kuvioita, jotka ovat useita merkkejä, kuten ligatuurit (mitä en ole ennen huomannut)

Minusta tuntuu siltä, että olen melkein siellä, mutta olen selvästi ymmärtänyt väärin jotain jossakin linjassa: ei vain ”Yksi glyph useita merkkejä” -asia, mutta myös käyttäytymisen kopioiminen ja liittäminen ligatureilla ei ole ”odotuksiani”:

  • kopioi ligatuuri Illustratorista tähän syöttölaatikkoon: liittää fi (kaksi merkkiä) odotetulla tavalla .
  • Liitä sen HTML-koodi () – näkyy ligatuurina, kun se ei ole koodilohkossa (fi – joka tässä kirjasimessa ei näytä paljolti ligatuurilta, mutta sinä” katso on yksi, jos yrität valita vain puolet siitä), ja koodi, kun olet koodilohkossa (fi) odotetusti.
  • Kopioi ja liitä renderoitu ei-koodilohkoinen ligatuuri takaisin syöttölaatikkoon: liitetään ligatuurimerkkinä ja renderoidaan ligatuurina riippumatta siitä, onko se koodilohkossa vai ei (fi ja ). Samoin sitä sisältävät sanat: fi t mis fi ts (fit misfits) liitetään muodossa virheellisiä virheitä (fit misfits). Ehkä se riippuu siitä, ymmärräkö paikka, johon se liitetään, käytetyn koodauksen?

Kuinka väärin ymmärrän tämän? Voiko joku korjata minut: ilmoittamalla selvä määritelmä kuvioiden ja merkkien välisestä erosta (jos omani on väärässä tai sitä voidaan parantaa), ja anna selkeämpiä / tarkempia esimerkkejä kuin minun, mitä tämä tarkoittaa käytännössä ?

Kommentit

  • Se muuttuu paljon monimutkaisemmaksi, kun sinulla on arabiankielisiä komentosarjoja, joissa yhdistät merkkejä.
  • @MartinSchr ö der +1 Kuulostaa erinomaisen vastauksen alkulauseesta … 🙂

Vastaa

Kuviot liittyvät tekstin renderointiin ja merkit tulkintaan. Kun kopioit & -liitettä, lähdesovellus antaa yleensä valita useista muodoista. Pelkkä teksti hajottaa liitoksen f: ksi ja i: ksi, HTML-muoto voi kääntää sen mainitsemallesi char-kokonaisuudelle tai hajottaa sen myös f: ssä ja i: ssä.

Yleensä merkkien ja kuvioiden suhde on n: m. Intialaisilla kielillä jotkut merkit jakautuvat kahteen kuvioon, jotka sijoitetaan sanan eri paikkoihin. Latinaksi lähinnä tilannetta olisi renderöinti é kahtena kuviona (e ja ´).Arabiaksi jokaisella merkillä on erilaiset kuviot riippuen sen sijainnista sanassa: alku-, keski-, lopullinen tai eristetty.

Käännös merkeistä merkkeihin on ominaista jokaiselle sovellukselle ja sen tukemille typografisille ominaisuuksille. Latinalaisen tekstin kohdalla tämä käännös oli aiemmin suoraviivainen, mutta OpenType-kirjasimet esittivät lisäominaisuuksia, kuten ligatuurit, pyyhkäisyt, vaihtoehtoiset muodot, pienet korkit jne.

Käytännöllisistä syistä huolehdit itseäsi vain kuvioista, kun otat käyttöön sovelluksen renderöi tekstiä, tai kun suunnittelet kirjasinta, tai kun haluat käyttää OpenType-ominaisuutta, joka korvaa jotkut kuviot toisilla (esim. ligatuurit). Muuten Unicode-koodipisteet ovat ystäväsi.

Kommentit

  • Hei käyttäjä322483, tervetuloa GDSE: hen ja kiitos vastauksestasi. Jos sinulla on kysyttävää, käy ohjekeskuksessa tai pingaa yhtä meistä graafisen suunnittelun keskustelussa kun maineesi on riittävä (20). Jatka osallistumista ja nauti sivustosta!
  • Kirjoitat ” Arabiaksi jokaisella merkillä on erilaiset kuviot riippuen sen sijainnista sanassa: alku-, keski-, lopullinen tai eristetty . ” < — Eivätkö ne olisikaan erilaisia merkkejä. Englannilla on A ja a, mutta puhetta laskettaessa A ja a ovat eri merkkejä. kukin kuviot on kartoitettu eri koodiin. Heprean kielellä on chaf ja viimeinen chaf (kirjaimen chaf sanan lopussa, näyttää erilaiselta) ja olen varma, että ’ s kutsutaan eri merkiksi laskennassa.

Vastaus

En usko, että ymmärryksesi on väärä sinä ” näemme vain järjestelmiä, jotka yrittävät auttaa käyttäjää liittämällä siihen, mitä hän ajattelee haluavansa. Koska jotkut ligatuurit (”fi”, ”fl”) ovat melko yleisiä kirjoitusjärjestelmien ulkopuolella, ohjelmisto tunnistaa, että käyttäjä ei todennäköisesti kirjoittanut tuota kuviota, pikemminkin toinen sovellus muutti kirjoitetut merkit.

Lyhyesti sanottuna : Merkki viittaa kielelliseen yksikköön. Glyph viittaa kyseisen yksikön suunniteltuun esiintymään, olipa se sitten isoja, pieniä, pienikokoisia, historiallisia tai tyylivaihtoehtoja.

Kommentit

  • Laskennassa A ja a ovat eri merkkejä. ASCII: ssa on 128 merkkiä ja termissä merkki sisältää A ja A erillisinä merkeinä.
  • Insinöörit käyttävät paljon sanoja, jotka eivät ’ ei sovi yhteen muiden teollisuudenalojen ennakkotapausten kanssa. Sinun on yksi hyvä esimerkki.
  • kuka keksi termin ” merkki ” ja ” glyph ” f irst? graafiset suunnittelijat tai tietokoneinsinöörit? Olen ’ ajatellut tietokoneiden olevan ennen graafista suunnittelua. Mutta voi olla painotalo, joka edelsi graafista suunnittelua ja kiistelty edisti tietokoneita jollain tavalla tai edeltää nykyaikaisia tietokoneita. Luulen, että ihmiset, jotka pystyvät vastaamaan parhaiten nykyiseen graafiseen suunnitteluun, ovat painoteollisuus, mutta ’ ei ole painoteollisuuden pinonvaihtoa. Mutta ’ on mielenkiintoista tietää, kuka lainasi keneltä ja millä tavoin käyttää termiä hahmo.
  • typografiaa tuli kauan ennen ohjelmistotuotanto. Ole hyvä ja kirjoita tähän, jos aloitat tutkimuksen ja löydät alkuperän. Oletan, että se tapahtuu joskus 1600-luvulla. Mahdollisesti jo ensimmäisillä kirjoittajilla 16. puolivälissä.

Vastaa

Tässä on pari vastausta jotka antavat hyvää tietoa kuviot vs. merkit, mutta ne eivät todellakaan käsittele kopiointiin ja liittämiseen liittyvää hämmennystäsi.

Ensinnäkin ymmärryksesi on periaatteessa oikea:

Hahmot määritellään niiden merkityksellä kielellä, kuviot ja niiden ulkonäöllä . Joten, liitos esteettisesti yhdistettäväksi fi on yksi kuviot, mutta kaksi merkkiä.

On syytä korostaa, että Unicode määrittelee merkkien luettelon standardin, jonka Unicode-konsortio on julkaissut, koska he ”ovat viranomaisia koodaamaan tekstiä koneellisesti luettavassa muodossa. Yllä oleva määritelmä on ensisijaisesti ensisijainen ohje, jota Unicode-konsortion jäsenet käyttävät selvittääkseen, ehdottavatko jotkut ehdotuksia vai eivät. addit ioni Unicodelle on merkki ja siten sisällyttämisen arvoinen tai glyph ja sen pitäisi käsitellä fonttien hahmonninten kautta.

Mainitsen tämän, koska sekavuus edellä kokenut johtui siitä, että Unicodessa on useita ligature merkkejä (ei kuvioita ).Esimerkiksi U+FB01 on merkin tunnus: http://unicode.org/charts/PDF/UFB00.pdf

Ligatuurimerkkien käyttäminen Unicodessa ei ole oikeastaan yllä olevan määritelmän hengessä, minkä tyyppiset asiat tulisi sisällyttää Unicode-standardiin merkkeinä, koska ligatuureilla ei todellakaan ole riippumatonta merkitystä kahden muun merkin kokoonpano. Unicode-ihmiset ovat luonnollisesti tietoisia tästä, ja Unicode-linkkejä koskevista usein kysytyistä kysymyksistä myönnetään niin paljon:

Olemassa olevat ligatuurit ovat periaatteessa yhteensopivuuden ja pyöristämisen kanssa muiden kuin Unicode-merkistöjen kanssa. Niiden käyttöä ei suositella.

Tämän merkin olemassaolo aiheuttaa viime kädessä hämmennystäsi.

Oikein toteutetuissa ohjelmistoissa kopiointi tekstin tulee aina kopioida määritetyt merkit , ei kuviot , ja se on juuri sitä, mitä tapahtuu kolmessa esimerkissä.

1) Ensimmäisessä esimerkissä kirjoitit f ja i Illustratoriin, joka teki yhden ligatuurin glyph . Kun valitsit ja kopioit renderoidun kuvion, Illustrator kopioi f (U+0066) ja i (U+0069) merkkiä leikepöydälle.

2) Toisessa esimerkissä kirjoitit ligatuurin merkki (&#64257) HTML-koodin syöttökenttään ja sai oikein ligatuurin merkin edustavan ligatuurin glyph (. Koska taustalla oleva merkki on itse asiassa edellä mainittu hämärä ja suhteellisen hyödytön ligatuurimerkki, valitsemalla kyseinen kuvio kopioi yhden merkin U+FB01.

3) Kolmannessa esimerkissä kopioit renderoidun ligatuurin merkin U+FB01 joka renderöitiin osassa 2, joka liitetään aina kyseisenä merkkinä. Suurin hämmennyksesi näyttää olevan HTML-entiteettikoodien ja merkkien välinen ero, etenkin niiden renderointitapa. koodilohkoissa ja niiden ulkopuolella.

HTML-yksikön koodi &#64257; on 8 erillisen merkin merkkijono. Web-selaimesi HTML-renderöijä korvaa nämä 8 merkkiä U+0026 U+0023 U+0036 U+0032 U+0035 U+0037 U+0023 single Unicode-merkin U+FB01 kanssa, jonka se sitten renderöi asianmukaisesti. HTML-koodissa oleva <code> -tunniste kuitenkin poistaa tämän toiminnan ja jättää nämä 8 merkkiä sellaisiksi kuin ne ovat.

Kun kopioit renderoidusta HTML-koodista, kopioit renderoidun merkit (jotka poikkeavat renderoiduista kuviot ). Kun kopioit renderoidun HTML-entiteettisi, yksi U+FB01 -merkki kopioidaan leikepöydälle.

Kun liität U+FB01 -merkki takaisin HTML-koodiin, korvaamista ei tarvitse tapahtua, mikä tarkoittaa, että merkki renderoidaan ligatuurina riippumatta siitä, kuuluuko se <code> -lohko.

Vastaus

Merkit ovat tekstitiedostoihin tallennettuja, sovellusten käsittelemiä ja liikkui, kun taas kuviot ovat heidän visuaalinen esityksensä.

Saadaksesi selkeän kuvan, voimme nähdä, mitä tapahtuu, kun sovellus yrittää renderoida tekstijonon näytöllä (hieman yksinkertaistetulla tavalla):

  • Sovellus luki ensin tekstimerkkijonon, että se merkitsi levylle tai muistiin tallennetun merkkijonon.
  • Sitten se lähettäisi sen tekstiasettelukoneeseen joidenkin joukossa. muut ominaisuudet, kuten haluttu fontti, tekstikieli ja niin edelleen:
    • T tekstiasettelukone avaa pohjimmiltaan fonttitiedoston, pyytää sitä kutakin merkkiä vastaavia kuvioita ja tekee jonkin verran glyph-korvauksia (kuten korvaa glyph f ja i fi) sidontakuvion ja paikannuksen (kuten kerning) kanssa.
    • Lopussa layout-moottorilla on sarja kuviot, niiden sijainnit suhteessa toisiinsa, sekä syöttömerkkien ja tulostettujen kuvioiden kartoitus. Hahmojen ja kuvioiden yhdistäminen on niin, että se tietää, että sanan file kaksi ensimmäistä merkkiä vastaavat kahta ensimmäistä merkkiä (fi -liitäntä ), kolmas merkki 2. kuvioon ja 4. merkki 3. kuvioon.
  • Sen jälkeen grafiikan renderointikirjastoa käytetään ”piirtämään” nämä kuviot näytölle käyttämällä muodot kirjasimesta.
  • Kun käyttäjä valitsee kuviot kuvaruudusta, sovellus etsii sitten asetteluohjelman tarjoaman glyf-teksti-kartoituksen selvittääksesi, mikä osa syötetystä tekstistä vastaa mitä käyttäjä valitsee ja lähettää tekstin leikepöydälle, kun käyttäjä kopioi sen.
  • Sama tapahtuu, kun käyttäjä lisää kohdistimen tekstin keskelle ja alkaa kirjoittaa, kartoitus määrittää, mihin syötetyssä tekstissä uudet merkit lisätään, ja päivitettävä teksti lähetetään asettelukoneelle prosessoida ja piirtää uudelleen ja niin edelleen.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *