Funktioner, der returnerer strenge, god stil?

Question

I mine C-programmer har jeg ofte brug for en måde at lave en streng repræsentation af mine ADTer. Selvom jeg ikke behøver at udskrive strengen til skærmen på nogen måde, er det pænt at have en sådan metode til fejlfinding. Så denne form for funktion kommer ofte op.

char * mytype_to_string( const mytype_t *t );

Jeg er faktisk klar over, at jeg her (i det mindste) har tre muligheder for at håndtere hukommelsen, som strengen skal returnere.

Alternativ 1: Lagring af returstrengen i en statisk char-array i funktionen … Jeg har ikke brug for meget overvejelser, bortset fra at strengen overskrives ved hvert opkald. Hvilket kan være et problem i nogle tilfælde.

Alternativ 2: Tildel strengen på bunken med malloc inde i funktionen. Virkelig pænt, da jeg da ikke behøver at tænke på størrelsen på en buffer eller overskrivningen. Dog er jeg nødt til at huske at frigøre () strengen, når det er gjort, og så skal jeg også tildele en midlertidig variabel, så Jeg kan frigøre. Og så er bunktildeling virkelig meget langsommere end stakallokering, vær derfor en flaskehals, hvis dette gentages i en løkke.

Alternativ 3: Send markør til en buffer, og lad den, der ringer op, allokere som bufferen. Som:

char * mytype_to_string( const mytype_t *mt, char *buf, size_t buflen );

Dette bringer mere indsats for den, der ringer op. Jeg bemærker også, at dette alternativ giver mig en anden mulighed i rækkefølgen af argumenterne. Hvilket argument skal jeg have første og sidste? (Faktisk seks muligheder)

Så hvad skal jeg foretrække? Enhver hvorfor? Er der en slags uskrevet standard blandt C-udviklere?

Kommentarer

Bare en observationsnote, de fleste operativsystemer bruger mulighed 3 – opkald tildeler alligevel buffer; fortæller bufferpointer og kapacitet; callee fylder buff er og returnerer også den aktuelle længde på strengen hvis bufferen er utilstrækkelig. Eksempel: sysctlbyname i OS X og iOS

Answer 1

De metoder, jeg har set mest, er 2 og 3.

Den brugerforsynede buffer er faktisk ret enkel at bruge:

char[128] buffer; mytype_to_string(mt, buffer, 128);

Selvom de fleste implementeringer returnerer den anvendte buffermængde.

Valgmulighed 2 vil være langsommere og er farlig, når du bruger dynamisk sammenkædede biblioteker, hvor de kan bruge forskellige driftstider (og forskellige dynger). Så du kan ikke frigøre, hvad der er blevet malokeret i et andet bibliotek. Dette kræver derefter en free_string(char*) -funktion for at håndtere den.

Kommentarer

Tak! Jeg synes også, jeg kan lide Alternativ 3 bedst. Jeg vil dog være i stand til at gøre ting som: printf("MyType: %s\n", mytype_to_string( mt, buf, sizeof(buf)); og derfor vinder jeg ‘ ikke som at returnere den anvendte længde, men snarere markøren til strengen. Den dynamiske bibliotekskommentar er virkelig vigtig.
Skal ‘ t dette være sizeof(buffer) - 1 for at tilfredsstille \0 terminator?
@ Michael-O nej null-udtrykket er inkluderet i bufferstørrelsen, hvilket betyder, at den maksimale streng, der kan sættes i, er 1 mindre end den beståede størrelse. Dette er det mønster, som den sikre streng fungerer i standardbiblioteket som snprintf brug.
@ratchetfreak Tak for afklaring. Ville være rart at udvide svaret med den visdom.

Answer 2

Yderligere designidee til # 3

Når det er muligt, skal du også angive den maksimale størrelse, der er nødvendig for mytype i samme .h-fil som mytype_to_string().

#define MYTYPE_TO_STRING_SIZE 256

Nu kan brugeren kode i overensstemmelse hermed.

char buf[MYTYPE_TO_STRING_SIZE]; puts(mytype_to_string(mt, buf, sizeof buf));

Bestil

Størrelsen af arrays tillader VLA-typer, når de først er.

char * mytype_to_string( const mytype_t *mt, size_t bufsize, char *buf[bufsize]);

Ikke så vigtigt med en enkelt dimension, men alligevel nyttigt med 2 eller flere.

void matrix(size_t row, size_t col, double matrix[row][col]);

Jeg kan huske at læse at have størrelsen først er et foretrukket udtryk i næste C. Behov for at finde den reference ….

Answer 3

Som en tilføjelse til @ratchetfreaks fremragende svar vil jeg påpege, at alternativ nr. 3 følger et lignende paradigme / mønster som standard C-biblioteksfunktioner.

For eksempel strncpy.

 char * strncpy ( char * destination, const char * source, size_t num );

At følge det samme paradigme vil hjælpe for at reducere den kognitive belastning for nye udviklere (eller endda dit fremtidige selv), når de har brug for din funktion.

Den eneste forskel med hvad du har i dit indlæg ville være, at destination -argument i C-bibliotekerne har tendens til at blive anført først i argumentlisten.Så:

 char * mytype_to_string( char *buf, const mytype_t *mt, size_t buflen );

Answer 4

Udover det faktum, at hvad du foreslår at gøre er dårlig kodelugt, alternativ 3 lyder bedst for mig. Jeg synes ligesom @ gnasher729 at du bruger det forkerte sprog.

Kommentarer

Hvad nøjagtigt overvejer du en kodelugt? Uddyb dem.
Se en.m.wikipedia.org/wiki/Cod e_smell for eksempler. Men at konvertere en ikke-streng til en streng, så du kan udskrive den, er en dårlig praksis. Se også en.m.wikipedia.org/wiki/Design_smell for mere kodning af falske pas.

Answer 5

For at være ærlig vil du måske skifte til et andet sprog, hvor returnering af en streng ikke er en kompleks, arbejdeintensiv og fejlbehæftet handling.

Du kan overveje C ++ eller Objective-C, hvor du kan lade 99% af din kode være uændret.

Funktioner, der returnerer strenge, god stil?

Kommentarer

Svar

Kommentarer

Svar

Svar

Svar

Svar

Kommentarer

Svar

Skriv et svar Annuller svar