Interpretationsproblem in C

Aiolos · 4. März 2010, 13:33

Gibts hier irgendwen der mir diese Passage erklären kann, ich bin nicht so fit in bitweisen Operationen. Ich möchte diese Passage in eine andere Sprache übertragen welche völlig andere Syntax hat und die bitweisen Operationen in dieser Form nicht zulässt. Wäre nett wenn mir irgendwer die Methodik umschreiben könnte

Tass · 4. März 2010, 13:36

Formatier das ganze mal etwas schöner und sag in welche Sprache du das umschreiben willst.

Aiolos · 4. März 2010, 13:43

so habs mal etwas besser dargestellt ich dacht die codebox hier wäre praktisch genug dafür.
ich möchte das in einen basicartigen dialekt übersetzen, aber es geht mir rein um die methode es geht mir um kein fertiges ergebnis ich möchte nur verstehen was da passiert weil ich in c und diesen bitweisen shift nicht bewandert bin

okay edit:
noch ne kurz umschreibung
aus einer datei wird ein binär string ausgelesen der "null-terminated" ist, d.h. er endet mit 0x00. Dieser String wird dann in den Char Array encodedString eingetragen und dann beginnt die eigentliche Prozedur:
Der String selber besteht aus 3 Teilstring welche ebenfalls null-terminated sind, aber hier codiert und zwar +1 d.h. sie hören mit 0x01 auf, die ganzen anderen zeichen sind ebenfalls codiert welche irgendwie mit dem startbyte zusammen hängt. Das kann ich noch als Ergänzung dazu sagen...

^woOt · 4. März 2010, 15:07

Während encodedstring an der Stelle pos ungleich 0 ist

wenn pos Modulo 8 0 ist, dann wird mask zum Wert von encodedstring an der Stelle pos (Modulo gibt den Rest einer Division aus. Also pos/8 und davon den Rest. Bei 8, 16, 24 usw also 0)

ansonsten

wenn mask und (0x1 << pos%8) == 0 d.h. wenn eins von den beiden mit und verknüpften Elementen falsch ist, tritt das == 0 ein, ansonsten (beide wahr) wird der Wert "mask & (0x1 << pos%8)" 1 bzw. wahr .

das 0x1 << pos%8 verschiebt Bits. 0x1 ist ne 1 in hexadezimaler Schreibweise verschiebt man die 1 also nach links (und füllt hinten wieder mit 0en auf).

Ich verstehe allerdings den Sinn kein bisschen, weil man mit 0x1 anfängt (also 1) und dann nach links verschiebt, was die Zahl nur größer und nicht kleiner macht. "0x1 << pos%8" ist also immer >0. (Es sei denn man stößt irgendwann beim verschieben an die Grenzen der Datenstruktur, allerdings verschiebt man nur um höchstens 7 bit (pos%8 wird nie größer als 7), daher kommts denkich nicht soweit)

Läuft das Programm genauso wenn du das (0x1 << pos%8) einfach durch ne 1 ersetzt?

EDIT: Also ich hab grad mal ne kleine Schleife programmiert die alle Werte für (0x1 << pos%8) mit 0<pos<64 ausrechnet und es kommt nur 1,2,4,8,16,32,64,128 als Lösung (alles ist >0 und damit wahr).

downtimes · 4. März 2010, 15:34

Brainfuck-Quellcode

char* EncodedString;
char* DecodedString;
char mask;int pos=0;
int dpos=0;
//Solange nicht 0x00 im String steht
while (EncodedString[pos] != 0) {
//Jede achte Stelle also: 0, 8, 16, 24.....
//Ändere die Maske zu dem an der Stelle stehenden Zeichen
if (pos%8 == 0) {
mask = EncodedString[pos];
} else {
//Hier wird Bitweise die Maske mit einer 2er Potenz je nach Stelle verundet. Also als Beispiel
//An der Stelle 3 wird sowas gerechnet (Maske ist hier als BSP.: das Zeichen a):
// 01100001 (Hex 61 = Ascii für Zeichen a)
// 00000100 (pos = 3, 3%8 = 3 und dann noch schnell (0x1 << 3) 1 * 2^3 = 8 gerechnet)
// --------------
// 00000000 (Ergebnis bei Bitweise und)
if ((mask & (0x1 << (pos%8))) == 0)
DecodedString[dpos++] = EncodedString[pos] - 1;
else
DecodedString[dpos++] = EncodedString[pos];
}
pos++;
}

Alles anzeigen

Welche Zeichen in dem else Zweig also anders gehandhabt werden hängt von ihrer Position ab. An den Positionen 0, 8, 16, 24... werden z.B die Zeichen: a,c,e.... anders behandelt
An den Positionen 3, 11, 19, 27 die Zeichen: D, L ..., d,l ... anders behandelt usw usf....
Was das allerdings bringen soll kannich dir nicht sagen. Da die Strings aber Encoded/Decoded heißen nehme ich mal an, dass es sich um eine ganz primitive Form des verschlüsselns handelt.

Hoffe das war klar genug? Wenn du die Sprache sagst kann dir sicher jemand das ganz hier auch schnell als Code rauswerfen dürfte nit sooo schwer sein.

MFG

Aiolos · 4. März 2010, 15:57

genau genommen ist diese codierung in replays zu finden, der einzige teil den ich noch nicht umsetzen konnte, steht der mapname und der host drinne

danke für eure antworten - auf ans werk

^woOt · 4. März 2010, 15:58

Da 0x1 << pos%8 immer wahr ist, kann man das Programm auch umschreiben:

Quellcode

char* EncodedString;
char* DecodedString;
char mask;int pos=0;
int dpos=0;
while (EncodedString[pos] != 0){
if (pos%8 == 0)
mask=EncodedString[pos];
else {
if (mask == 0) DecodedString[dpos++] = EncodedString[pos] - 1;
else DecodedString[dpos++] = EncodedString[pos];
}
pos++;
}

Alles anzeigen

(denn wenn mask 0 ist, wird die ursprüngliche Abfrage 0 & 1 == 0 (0&1 ist falsch, also wird encodedstring[pos] -1 gewählt), wenn mask 1 ist, ist die Abfrage 1&1 == 0 (1&1 ist aber 1, also einfach encodedstring[pos])

Aber woher kommt das Programm eigentlich und warum war das 0x1 << pos%8 überhaupt drin!?

Tass · 4. März 2010, 16:43

Aiolos schrieb:

so habs mal etwas besser dargestellt ich dacht die codebox hier wäre praktisch genug dafür

Ist sie ja auch. mach einfach genug Newlines. FYI: lmgtfy.com/?q=pastebin Benutz _NIE_ Bilder für Code :cursing:

Björne · 4. März 2010, 16:56

Tass bist du ein tard? Wie soll er auf pastebin kommen rofl!

Incognito · 4. März 2010, 17:02

Tass hör doch einfach auf mit deiner arroganten Art in solche Threads zu schreiben, wenn du eh nicht helfen willst.
Ich denke die Formatierung des Codes ist nicht wichtig für die Lösung des Problems.

downtimes · 4. März 2010, 20:38

Da 0x1 << pos%8 immer wahr ist, kann man das Programm auch umschreiben:

Das ist nicht wirklich richtig. Schau dir mal in ner ruhigen Minute den unterschied zwischen & und && an vllt merkste dann wo dein denkfehler ist. Das boolshe und und das Bitweise und sind 2 komplett unterschiedliche paar Schuhe.

Ich muss mich aber Tass anschließen. ist einfach einfacher wenn man per Pastebin oder so wie ichs gemacht hab Codestellen kopieren kann und leichter Kommentare einfügen kann.

MFG

^woOt · 4. März 2010, 21:25

Hä was? Ich kenn den Unterschied ziemlich gut, aber in dem Fall is es wie folgt:

Er Vergleicht x1 mit x2.
x1 = mask
x2 = 0x1 << pos%8

Bitweises Und macht folgendes:

Fall	x1	x2	Erg
1	0	0	0
2	0	1	0
3	1	0	0
4	1	1	1

Da x2 immer >0 ist und alles ungleich 0 wahr (also 1) ist, gibt es nurnoch die Fälle:

Fall	x1	x2	Erg
2	0	1	0
4	1	1	1

Also entweder ist Mask 0 oder ungleich 0.

Wenn Mask 0 ist, wird "mask & (0x1 << pos%8)" also 0 (Fall 2), wenn Mask ungleich 0 ist wird es 1 (Fall 4). Sollte Mask also 0 sein, trifft das "if ((mask & (0x1 << (pos%8))) == 0)" zu und "DecodedString[dpos++] = EncodedString[pos] - 1;" wird ausgeführt (Fall 2). Im anderen Fall (4) trifft "if ((mask & (0x1 << (pos%8))) == 0)" nicht zu und "else DecodedString[dpos++] = EncodedString[pos];" wird ausgeführt.

Und ja, es kann sein, dass ich was nicht raff, aber dann mach mich genau darauf aufmerksam, weil meine Logik erscheint mir logisch

EDIT: Verdammt vergiss alles, habs verrafft

Jo wird jeder Bit einzeln logisch und verknüpft unso. 0x1 << pos%8 wird dann 1, 2, 4, 8, 16, 32, 64, 128 also:

00000001
00000010
00000100
00001000
00010000
00100000
01000000
10000000

Wenn Mask also 98 ist

01100010

wird mask & 0x1 << pos%8 (je nach pos)

00000000
00000010 -- 2
00000000
00000000
00000000
00100000 -- 32
01000000 -- 64
00000000

Mein if mask == 0 kann also auch != 0 sein und trotzdem wird mask & 0x1 << pos%8 == 0.

(Hab mir das jetzt alles nur nochmal zur verdeutlichung aufgeschrieben, aber schicks einfach mal so ab, vllt hilfts ja noch dem TE und es war nicht nur für mich :D)

downtimes · 5. März 2010, 02:37

^woOt ist doch kein Problem.
Wie ich grade eben im Bett festgestellt hab lag ich auch total Falsch mit dem was ich gesagt hab. Und weil man ja sowas nicht einfach stehen lassen kann jetzt nochmal die Textuell wirklich RICHTIGE Beschreibung des Algorithmus:
(Das alte lass ich mal stehen, damit sich Leute drüber totlachen können ^^)

Der Encoded String ist in logische Blöcke a 8 Zeichen unterteilt (Block 0-7, Block 8-15 usw usf.). Bei diesen Blöcken ist jeweils das erste Zeichen die Maske die bestimmt wie mit dem eigentlichen Text verfahren werden soll. Bei der Maske sind die Bits = 1 sehr entscheidend. Als Beispiel nehmen wir mal den String "bHbmmp_Wcemu\0" wobei _ ein LeerZeichen darstellen soll und \0 die Nullterminierung.
Jetzt nimmt unser Algo das Zeichen an der Stelle 0, in unserem Fall das b. Das hat die Dualrepräsentation 01100010 nach Ascii Zeichensatz. Durch dieses b wissen wir nun das die 1. die 6. und die 7. Stelle NORMAL übertragen werden (da diese Stellen eine 1 als Bit vorweisen) und alle anderen Stellen werden eins verringert, d.h die Buchstaben werden im Alphabet eins nach "vorne" geschoben ( aus b -> a).

Also nehmen wir uns die Zeichen einzeln her. Erst das H, das steht an der ersten Stelle also wird es einfach übertragen. Dann das b das steht an Stelle "2" die wird eins verringert also wird aus b ein a. Dann das m das steht an "3." Stelle wird also auch um eines verringert und zum l. Das gleiche mit dem nächsten m -> l. Dann das p steht an der "5.", wird also auch verändert und wir erhalten ein o. Die "6." und "7." Stelle hingegen werden normal übertragen.

Bis hierher haben wir also erhalten "Hallo_W" wobei zu beachten ist, dass die Maske nicht mit übertragen wird. Nun kommt der nächste Block bei dem die Maske ein c ist. Duale räpresentation laut ASCII ist in diesem Fall 01100011 das bedeutet Stelle "8." "9." "14." "15." werden normal übertragen. Nehmen wir uns wieder die Buchstaben her dann kommt ein e an Stelle "9". Das wird laut Maske wieder einfach übertragen. Dann ein m an Stelle "10" das wird zu l verringert und Schlussendlich ein u an Stelle 11 das zu t verringert wird und dann hört der Algo wegen der nullterminierung auf.

Als Ergebnis erhalten wir "Hallo_Welt"
Wichtig hierbei ist auch das dieser String NICHT Nullterminiert ist du das also eventuell noch manuell hinzufüen solltest!

So ich hoffe nu diese textuelle Beschreibung und das kleine konstruierte Beispiel von mir haben dir geholfen den Algorithmus zu verstehen.
Diesesmal dürfte es auch richtig sein

Edith meint: Wenn du dir sicher gehen willst, dass ich richtig liege kannste die Funktion ja einfach mal mit meinem String füttern und dir ausgeben lassen was rauskommt (sofern du halbwegs C Programmieren kannst)

MFG downtimes

PS.: dafür das ich Nachts um 2 extra nochmal an PC bin nur um das klarzstellen will ich aber mindestens ein +1!

^woOt · 5. März 2010, 03:37

Der Programmablauf in Einzelschritten:

Spoiler anzeigen

Also die If-Abfrage guckt einfach nach, welche Bits der Maske 1 sind und übergibt die Stellen an denen der Bit 1 ist einfach an decodedstring, alles andere wird -1 genommen. Du hast also recht

Mein Problem am Anfang war, dass ich gedacht habe, ein bitweises Und vergleicht die Dezimalen Werte der Operanden und nicht jeden Bit der dualen Werte.

Ein Anmerkung hab ich allerdings noch:

Spoiler anzeigen

Maske sind also nur die 2^8 bis 2^1 Bits des Wertes. (Ist ja klar, da ein Block nach der 8ten Stelle (welche die Maske angibt) nur die nächsten 7 Stellen belegen kann, da danach die nächste Maske folgt. Die Maske braucht also nur 7 Bits.)

Brainfuck-Quellcode

Quellcode

Benutzer online 1