Iványi Péter - Assembly programozás

Alapadatok

Év, oldalszám:2010, 183 oldal

Nyelv:magyar

Letöltések száma:80

Feltöltve:2021. február 06.

Méret:1 MB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!

A doksi online olvasásához kérlek jelentkezz be!

A doksi online olvasásához kérlek jelentkezz be!

Értékelések

Nincs még értékelés. Legyél Te az első!

Mit olvastak a többiek, ha ezzel végeztek?

Tartalmi kivonat

Assembly programozás szerkesztette: Iványi Péter September 27, 2010 2 Tartalomjegyzék 1 Bevezetés 11 1.1 RISC és CISC processzor architektúrák . 11 1.2 Assembly elsőre . 12 1.3 Miért tanuljunk assembly nyelvet? . 12 1.4 Mikor ne használjunk assembly nyelvet? . 13 1.41 A magas szintű programozási nyelvek előnye . 14 1.42 Az assembly hátrányai . 14 1.5 Mielőtt elkezdenénk assembly-ben programozni . 14 1.6 Szintakszis . 15 1.7 Assemblerek . 15 1.71 MASM . 15 1.72 GAS . 15 1.73 TASM . 15 1.74 NASM . 15 1.75

Melyik assembler? . 15 1.8 Összefoglalás . 16 1.9 Ellenőrző kérdések . 16 2 A számı́tógép felépı́tése 2.1 17 A processzor . 17 2.11 Végrehajtási ciklus . 18 2.12 A rendszer óra . 19 Cı́mzési architektúra . 19 2.21 Három cı́mes architektúra . 19 2.22 Két cı́mes architektúra . 20 2.23 Egy cı́mes architektúra . 20 2.24 Zéró cı́m architektúra . 20 2.25 Load/Store architektúra . 20 2.3 Regiszterek . 21 2.4 Végrehajtási sorrend . 21

2.41 Branching . 21 Memória . 22 2.51 22 2.2 2.5 Memória műveletek . 3 2.6 2.52 Olvasási ciklus . 22 2.53 Olvasási ciklus . 23 2.54 Memória tı́pusok . 23 2.55 Byte sorozatok tárolása . 24 2.56 Adat “alignment” problema . 25 Input/Output . 26 I/O eszközök elérése . 27 2.7 2.61 Összefoglalás . 27 2.8 Ellenőrző kérdések . 27 3 A processzor 29 3.1 Általános regiszterek . 30 3.2 Szegmentált cı́mzés először . 30 3.3 Cı́mzési

módok . 31 3.31 Direkt cı́mzési mód . 33 3.32 Indirekt cı́mzési mód . 34 3.4 Státusz regiszter . 35 3.5 Ellenőrző kérdések . 36 4 NASM assembler 37 4.1 Egy forrás file szerkezete . 37 4.2 Pszeudo utası́tások . 37 4.3 4.21 DB és társai . 38 4.22 RESB és társai . 38 4.23 Konstansok . 39 4.24 TIMES pszeudo utası́tás . 39 SEG kulcsszó . 39 További hasznosı́tási területek . 40 4.4 4.31 WRT kulcsszó . 40 4.5 Parancssori opciók .

40 4.6 Hibaüzenetek . 40 5 DEBUG program 41 5.1 Jelölések . 41 5.2 A DEBUG indı́tása . 41 5.3 A DEBUG parancsai . 41 5.4 Példák . 44 5.41 1. Példa 44 5.42 2. Példa 44 5.43 3. Példa 45 6 Első programok 47 6.1 Első program . 47 6.2 Egy karakter kinyomtatása . 48 4 6.3 Egy szöveg kinyomtatása . 49 6.4 Egy karakter beolvasása . 51 7 Assembly nyelv utası́tásai 7.1 7.2 7.3 7.4 53 Adatmozgató utası́tások . 54

7.11 MOV . 54 7.12 XCHG . 54 7.13 XLAT . 55 7.14 LDS . 55 7.15 LES . 55 7.16 LEA . 56 7.17 PUSH . 56 7.18 PUSHF . 56 7.19 PUSHA . 57 7.110 POP 57 7.111 POPF 58 7.112 POPA 58 7.113 LAHF 59 7.114 SAHF 59 Matematikai utası́tások . 60 7.21 INC . 60 7.22 DEC . 60 7.23 ADD .

60 7.24 ADC . 61 7.25 SUB . 61 7.26 SBB . 62 7.27 MUL . 62 7.28 IMUL . 63 7.29 DIV . 63 7.210 IDIV 64 7.211 NEG 64 7.212 CBW 65 7.213 CWD 65 Bitforgató és bitléptető utası́tások . 66 7.31 RCL . 66 7.32 RCR . 66 7.33 ROL . 67 7.34 ROR . 68 7.35 SAL, SHL . 68 7.36 SAR . 69 7.37 SHR .

69 Logikai utası́tások . 71 7.41 71 AND . 5 7.5 7.6 7.7 7.8 7.9 7.42 OR . 71 7.43 XOR . 71 7.44 NOT . 71 7.45 TEST . 71 7.46 CMP . 71 Vezérlésátadó utası́tások . 72 7.51 JMP . 72 7.52 Feltételes utası́tások . 72 7.53 JCXZ . 72 7.54 LOOP . 72 7.55 LOOPNZ . 72 7.56 LOOPZ . 73 7.57 CALL . 73 7.58 RET .

73 7.59 INT . 73 String kezelő utası́tások . 74 7.61 MOVSB, MOVSW . 74 7.62 CMPSB, CMPSW . 75 7.63 LODSB, LODSW . 75 7.64 STOSB, STOSW . 75 7.65 SCASB, SCASW . 75 7.66 REP . 76 7.67 REPZ . 77 7.68 REPNZ . 77 Processzor vezérlő utası́tások . 78 7.71 CLC . 78 7.72 STC . 78 7.73 CMC . 78 7.74 CLD 78 7.75 STD . 78 7.76 CLI . 78 7.77 STI .

79 Egyéb utası́tások . 80 7.81 NOP . 80 7.82 IN . 80 7.83 OUT . 80 Ellenőrző kérdések . 81 . 8 Assembly programokról 83 8.1 Programozási módszer . 83 8.2 Megszakı́tások . 84 8.21 Hardware-es megszakı́tások . 84 8.22 Megszakı́tások 8086-os processzorokon . 85 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 86 87 87 88 88 88 88 88 89 9 Példa programok

9.1 Egy byte bináris kinyomtatása 9.2 Egy hexadecimális szám kinyomtatása 9.3 Egy byte hexadecimális kinyomtatása 9.4 Egy decimális számjegy ellenőrzött beolvasása és kinyomtatása 9.5 Egy karakter beolvasása és módosı́tása 9.6 Öt karakter bolvasása és kinyomtatása fordı́tott sorrendben 9.7 Két egyjegyű szám összeadása 9.8 Egy karakter n-szeri kinyomtatása 9.9 Téglalap kinyomtatása 9.10 Sakktábla nyomtatása 9.11 ASCII tábla kinyomtatása 9.12 Szám kiı́rása decimális formában 9.13 Olvasás a memóriából 9.14 Közvetlen videó memóriába ı́rás 9.15 Szöveg beolvasása 9.16 Beolvasott szövegben karakterek számlálása 9.17 Beolvasott

szöveg nagy betűsre konvertálása 9.18 Feladatok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 91 93 95 97 98 100 101 104 105 108 111 112 114 115 116 117 118 119 . . . . . . . . . . . . 121 121 121 123 123 123 124 126 126 128 128 130 135 8.3 8.4 8.5 8.6 8.7 8.8 8.23 INT 21h megszakı́tás 8.24 Kivételek Kitérő Linux-ra . COM programok . 8.41 Program Segment Prefix EXE programok . XOR használata . Assembly integer aritmetika . 8.71 BCD aritmetika Ellenőrző kérdések . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Függvények 10.1 A verem adatszerkezet 10.11 A verem implementációja 10.12 Verem műveletek 10.2 A verem használata 10.21 Értékek időleges tárolás 10.3 Függvények definı́ciója 10.31 Egymásba ágyazott függvényhı́vások 10.4 Paraméter átadás függvényeknek 10.41 Paraméter átadás regiszteren keresztül 10.42 Paraméter átadás memórián keresztül 10.43 Paraméter átadás vermen keresztül 10.44 Érték és cı́m szerinti paraméter átadás 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 10.6 10.7 10.8 10.9 10.45 Változó számú paraméter átadása függvénynek Lokális változók függvényekben . 10.51 ENTER és LEAVE utası́tások Rekurzı́v függvények . Hatékonyság . Ellenőrző kérdések . Feladatok . 11 Makrók 11.1 Egy soros makrók 11.2 Több soros makrók 11.21 Cı́mkék makrókban 11.22 “Greedy” makró paraméterek 11.3 Makrók és

függvények még egyszer 11.4 Makrók gyűjtemények 11.5 Ellenőrző kérdések . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 String műveletek 12.1 String utası́tások 12.11 String másolás 12.12 Stringek összehasonlı́tása 12.13 Keresés stringek-ben 12.14 LODSB és STOSB utası́tások használata 12.2 String utası́tások előnyei és hátrányai 12.3 Ellenőrző kérdések . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 141 142 143 144 144 148 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 149 151 152 153 154 154 157 . . . . . . . 159 160 160 163 165 166 166 168 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Példák függvényekre és szöveg kezelésre 169 13.1 Szöveg hosszának megállapı́tása 169 14 C és assembly programok kapcsolata 171 14.1 Függvény hı́vási konvenciók 171 14.11 16 bites mód 171 14.12 32 bites mód 171 15 Optimalizálás 15.1 Optimalizálás sebességre 15.11 Sorrenden kı́vüli

végrehajtás 15.12 Utası́tás betöltés és dekódolás 15.13 Utası́tás késleltetés és átbocsátási képesség 15.14 Függőségi lánc megtörése 15.15 Ugrások és függvény hı́vások 15.2 Optimalizálás méretre 15.3 Memória hozzáférés optimalizálása 15.4 Ciklusok optimalizálása 15.5 Vector programozás 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 173 173 174 174 174 174 174 174 174 174 15.6 Problémás utası́tások 174 16

Optimalizált példák 175 16.1 ASCII tábla nyomtatása rövidebben 175 17 Megjegyzések 177 17.1 Szokásos hibák 177 A ASCII táblázat 179 B Felhasznált irodalom 181 Példa programok listája . 182 Tárgymutató . 183 9 10 1. Fejezet Bevezetés Ez a jegyzet egy összeállı́tásnak, szerkesztett jegyzetnek indult inkább, mint egy önálló könyv. A jegyzet anyagát igyekeztem úgy összeszedni, hogy az egy egységes egészt alkosson. A jegyzet célja az assembly nyelv megismertetése a hallgatókkal. Ugyanakkor az assembly nyelv nagyon erősen kötődik a processzor architektúrához, ı́gy az assembly programozáshoz az architektúrával is meg kell ismerkedni egy kicsit. A jegyzet kifejezetten az Intel x86-os processzorának alacsony szintű programozásával foglalkozik, ezek

közül is a 8086-os processzorral. Ez az egyik legkorábbi Intel processzor és furcsának tűnhet a választás, hogy 2010 környékén is erről a processzorról beszélünk. A jegyzet ı́rása során fő célom az volt, hogy az alapokat minden hallgató meg tudja érteni és el tudja sajátı́tani. Ehhez egy viszonylag “egyszerű” processzorra volt szükség és főleg ezért választottam a 8086-os processzort alapul. A másik indok, hogy a szimulátorok és virtuális gépek biztos támogatják ezt a processzort és ı́gy bármilyen környezetben lehet az assembly programozást gyakorolni. Így a jegyzet főleg kezdőknek szól, de azt remélem, hogy a gyakorlottabb hallgatók is profitálnak a jegyzet elolvasásából. A jegyzet természetesen igyekszik foglalkozni az újabb utası́tásokkal és módszerekkel, amiket például a Pentium processzorokra fejlesztettek. 1.1 RISC és CISC processzor architektúrák

A processzor architektúrák két nagy csoportba sorolhatók: CISC (Complex Instruction Set Computers)1 , RISC (Reduced Instruction Set Computers)2 . A domináns processzor architektúra a piacon a Pentium processzor, ami a CISC családhoz tartozik, de ugyanakkor a jelenlegi trendek szerint egyre inkább a RISC architektúra kerül előtérbe. A RISC processzorok közé tartoznak a MIPS, SPARC, PowerPC és ARM processzorok. A 64-bites Itanium is RISC alapú processzor Mit jelent az, hogy komplex utası́tás a CISC architektúra esetén? Két szám összeadása egyszerű műveletnek számı́t. Ugyanakkor, ha egy tömböt átmásolunk és közben a tömb mutatókat folyamatosan frissı́tjük, az már komplex utası́tásnak számı́t3 A RISC rendszerek csak egyszerű utası́tásokat használnak, és bizonyos feltételeket is szabnak. Például az utası́tások argumentumainak a regiszterekben kell lenniük és nem a memóriában 1

Szabad fordı́tásban: Komplex utası́táskészletű számı́tógép fordı́tásban: Egyszerűsı́tett utası́táskészletű számı́tógép 3 Létezik ilyen utası́tás a CISC processzorokon, ez a MOVSB utası́tás, lásd 7.61 bekezdés 2 Szabad 11 1.2 Assembly elsőre Az assembly nyelven ı́rt programokat processzálni kell egy másik program, assembler, által ami gépi kódot generál. A gépi kódot fogja futtatni a processzor Nézzünk néhány assembly utası́tást: inc mov add [result] [meret], 45 [mask1], 256 Az első sorban megadott utası́tás megnöveli a ‘result’ változó értékét. A második sorban megadott utası́tás a 45-ös értéket tölti a ‘méret’ változóba, mı́g a harmadik utası́tás 256-ot add a ‘mask1’ változóhoz. A fenti kódrészlet C programozási nyelven a következőképpen néz ki: result++; meret = 45; mask1 = mask1+ 256; A példa alapján a

következőket lehet megállapı́tani az assembly nyelvről: • Az assembly nyelv utası́tásai kriptikusak. • Az assembly nyelv műveleteit mnemonikok ı́rják le, például add vagy mov. • Az assembly nyelv utası́tásai nagyon alacsony szintűek. Például a következőt már nem ı́rhatjuk le4 : mov [meret], [adat] A 1.1 táblázat néhány assembly utası́tást és a neki megfelelő gépi kódot mutatja A táblázatnál az első észrevétel, hogy a RISC processzorokon az utası́tások hossza fix. (Ezzel is csökkentve a komplexitást) A másik fontos észrevétel, hogy a gép kód megértése nagyon nehéz az emberek számára, hiszen több ezer szám kombinációt kellene megjegyezni. Ugyanakkor közvetlen, egy az egyes megfeleltetés van az assembly utası́tás és a gépi kód között ezért ha az utası́tást ı́rjuk le az pontosan megfelel a szándék szerinti gépi kódnak és ı́gy csak

‘mazochisták’ programoznának gépi kódban. Mindenki inkább az emberek számára jobban értelmezhető assembly parancsokat, mnemonikokat használja. Persze a digitális forradalom elején néhány programot még gépi kódban ı́rtak 1.3 Miért tanuljunk assembly nyelvet? Az assembly programozás nem annyira népszerű mint néhány éve volt. Ugyanakkor még mindig több oka van annak, hogy megtanuljunk assembly-ben programozni: • Tanulás: Fontos tudni hogyan működnek a processzorok és fordı́tók az utası́tás szinten. Ezen ismeretek segı́tségével meg lehet állapı́tani mely programozási módok a leghatékonyabbak, illetve, hogy a magasabb szintű programozási szerkezetek hogyan működnek. • Debuggolás: Több szempontból is hasznos lehet ha a fordı́tók által generált kódot meg tudjuk érteni illetve meg tudjuk állapı́tani, hogy mennyire jó, optimalizált kódot generál egy fordı́tó.

• Fordı́tók: Az assembly kód megértése elengedhetetlen ahhoz, hogy fordı́tót, debugger-t vagy egyéb fejlesztő eszközöket fejlesszünk. • Beágyazott rendszerek: A beágyazott rendszereknek nincs annyi erőforrása mint egy hagyományos PC-nek és ezért szükség lehet az assembly nyelvre, hogy ilyen rendszerekre gyors és hatékony kódot ı́rjunk. 4A magyarázat a 3. fejezetben található 12 Pentium processzor Assembly Művelet Gépi kód (hex) Üres művelet 90 nop inc result Növelés FF060A00 mov result, 45 Másolás C7060C002D00 and mask, 128 Maszkolás 80260E0080 MIPS processzor Assembly Művelet nop Üres művelet mov $t2, $t15 Másolás and $t2, $t1, 15 Logikai ÉS addu $t3, $t1, $t2 Összeadás Gépi kód (hex) 00000000 000A2021 312A000F 012A5821 1.1 tábla: Assembly parancsok és a megfelelő gépi kód • Hardware eszközök: A magas szintű programozási nyelvek korlátozott (absztrakt)

hozzáférést engednek a hardware elemekhez, ı́gy a hardware eszközök használatát és elérését biztosı́tó eszközvezérlőt ı́rni magas szintű nyelven nehéz vagy lehetetlen. Ilyen esetben is jól jöhet az assembly nyelv ismerete • Olyan utası́tásokat is használhatunk assembly-ben aminek a magasabb szintű nyelvekben nincs megfelelője. • Méretre való optimalizálás: A méretre való optimalizálás azt jelenti, hogy Program A kevesebb helyet foglal mint Program B de ugyanazt a feladatot látja el. A memória ma már olyan olcsó, hogy tulajdonképpen nem éri meg assembly-ben kódot ı́rni a program méretének csökkentése miatt. Ugyanakkor a cache még midig kis méretű és drága, ı́gy az erre optimalizált kód esetén még mindig fontos az assembly nyelv használata. • Sebességre való optimalizálás: A sebességre optimalizált program a lehető legrövidebb idő alatt végzi el a

feladatot. Habár a modern fordı́tók viszonylag jól optimalizálják a generált kódot, bizonyos esetekben a kézzel optimalizált assembly program részlet drámaian fel tudja gyorsı́tani a programot. Az utolsó két szempontból az utóbbi a fontosabb. Egyrészt a hely megtakarı́tás csak a program kódra vonatkozik és az adatra nem, másrészt a memória méretének növekedése miatt. Assemblyben azért lehet hatékony kódot ı́rni, mivel a nyelv sajátossága, hogy a generált kód csak azt tartalmazza amit beleı́rtunk, vagyis ami a feladat megoldásához kell Semmi más, extra információt nem fordı́t bele az assembler. A sebességre optimalizált alkalmazások két kategóriába sorolhatók: – idő hatékony alkalmazások: ezeknél a programoknál a gyorsabb futás jelent előnyt, de nincs különösebb probléma ha a sebesség lassabb; – idő kritikus alkalmazások: ebben az esetben a feladatot

adott idő alatt kell elvégezni. Általában ezek a valós idejű alkalmazások (real-time systems), például: repülőgép navigációs eszközei, robot kontroll rendszerek, kommunikációs szoftverek. 1.4 Mikor ne használjunk assembly nyelvet? Olyan sok hátránya van az assembly nyelven való programozásnak, hogy mielőtt elkezdenénk programozni assembly-ben más alternatı́vákat is vegyünk figyelembe. 13 1.41 A magas szintű programozási nyelvek előnye A magas szintű programozási nyelvek viszonylag kényelmes absztrakciót tesznek lehetővé, hogy az adott problémát megoldjuk. A magas szintű programozási nyelvek előnyei: • A programfejlesztés gyorsabb: A magas szintű programozási nyelvekben sokféle programozási konstrukció áll rendelkezésre. Általában rövidebbek is a programok • A programokat könnyebb karbantartani: A magas szintű programozási nyelven ı́rt programokat egyszerűbb

megérteni és ezért könnyebb mások által ı́rt programot áttekinteni és megérteni. • A programok hordozhatóak: A program nem tartalmaz processzor specifikus részleteket és ezért bármilyen rendszeren használhatóak.5 1.42 Az assembly hátrányai Az assembly-ben való programozás ellen szóló legfontosabb érvek: 1. Fejlesztési idő: Az assembly-ben való programozás szinte mindig több időt igényel mint a magasabb szintű programozási nyelv használata 2. Megbı́zhatóság és biztonság: Assembly nyelven könnyű hibát véteni Az assembler csak szintaktikai ellenőrzéseket végez 3. Debuggolás és ellenőrzés: Az assembly nyelven ı́rt programokban nehezebb hibát keresni, illetve nehezebb ellenőrizni a kódot, hogy az előı́rt feladatot oldja meg. 4. Karbantartás: Az assembly nyelven ı́rt programokat nehezebb módosı́tani és karbantartani A nyelv megengedi a “spagetti” kód ı́rási

technikát és egyéb trükkök is megengedettek a nyelvben, melyeket más nyelven nem lehet megvalósı́tani. 5. Hordozhatóság: Az assembly kód a hardware platformhoz kapcsolódik, csak az adott processzoron, architektúrán lehet lefuttatni 6. Modern fordı́tók: A modern fordı́tók sokat fejlődtek az elmúlt években és már nagyon jó kódot tudnak generálni és gyakran nehezebb jobb assembly kódot generálni. 1.5 Mielőtt elkezdenénk assembly-ben programozni Van néhány szempont amit figyelembe kell venni mielőtt egy komplex alkalmazást elkezdenénk assemblyben programozni: • Ha az a célunk, hogy egy program sebességét optimalizáljuk, akkor először azonosı́tsuk, hogy a program mely része fut a legtöbbet a processzoron. Ellenőrizzük, hogy mivel tölti a legtöbb időt a program, például a memória eléréssel, CPU utası́tások végrehajtásával, file-ok elérésével vagy valami mással.

• Döntsük el, hogy a fejlesztett program újrahasznosı́tható vagy csak egy egyedi alkalmazás. Ha a kódot újra fel akarjuk használni, akkor érdemes több időt tölteni az optimalizálással. • El kell dönteni, melyik assemblert használjuk, mivel a különböző assemblerek más-más szintakszist használhatnak. • A jelentős mértékben optimalizált kódot nehéz lehet olvasni, ı́gy a karbantartás miatt érdemes kisebb egységekbe szervezni a programot melyeknek jól definiált interface-e van és megfelelően van dokumentálva. 5 Itt főleg a forráskódról beszélünk, nem a futtatható, már lefordı́tott gépi kódú programról. 14 1.6 Szintakszis Kétféle jelentősebb szintakszis alakult ki az évek során, amiket az assembly programok ı́rásánál használhatunk: • AT&T szintakszis • Intel szintakszis 1.7 Assemblerek Több assembler is létezik az Intel processzorokra, melyek az

x86-os utası́tás készletet használják, vagyis a mnemonikokból Intel gépi kódot hoznak létre. Az alábbiakban csak néhányat mutatunk be 1.71 MASM Ez a Microsoft Assembler, mely a mai napig része a Microsoft fejlesztő környezetének, a Visual Studionak. A program neve: mlexe A MASM sokáig a “de-facto” ipari szabvány volt és több magasabb szintű programozási konstrukciót is tudott kezelni A formátuma nem teljesen ‘tiszta’, vannak inkonzisztens részek benne. Microsoft továbbra is fejleszti, de igazából minimális módon 1.72 GAS GAS rövidités megfelelője a GNU Assembler, mely a GNU binutils csomag része is. A GNU fordı́tók olyan formátumot generálnak, melyet ez az assembler képes lefordı́tani. GAS az úgynevezett AT&T szintakszist használja, bár ma már az Intel szintakszisnak megfelelő kódot is el tud fogadni. Ez az assembler használható Linux, Mac OS X és Windows alatt is. 1.73 TASM

Az egyik legnépszerűbb fejlesztői eszközöket a Borland cég készı́tette. Az általuk készı́tett programfejlesztő családba tartozik a Turbo Assembler is Sajnos ma már nem fejlesztik, az újabb utası́tások nem kerülnek bele, de még mindig elérhető az Interneten. Az assembler által használt szintakszis nagyon hasonló a MASM assembler szintakszisához. 1.74 NASM NASM megfelel a Netwide Assembler névnek és egy szabad forráskodú assembler, mely többféle objektum formátumot képes generálni és ı́gy több operációs rendszert támogat (Linux, Windows, Mac OS X, FreeBSD, stb). A szintakszisa tisztább mint a MASM assembler-é, de kevesebb magas szintű programozási konstrukciót képes kezelni. 1.75 Melyik assembler? Ez a jegyzet a NASM assemblert használja két fő ok miatt: • Az egyszerű szintakszis nagyon logikus és konzisztens. • Windows és Linux rendszeren is használható, melyek manapság a

legjobban elterjedt operációs rendszerek. 15 1.8 Összefoglalás Az assembly nyelv tanulása mind gyakorlati és pedagógia célokat szolgálhat. Még ha nem is szándékozunk assembly-ben programozni, akkor is érdemes megtanulni, mivel egy nagyon jó alapot ad ahhoz hogy megértsük, hogyan működnek a számı́tógépek. Amikor magas szintű programozási nyelvet használunk, akkor a rendszert egy “fekete dobozként” kezeljük. Ezzel szemben assembly programozás esetén a rendszert részleteit is ismerni kell, például a regisztereket. 1.9 Ellenőrző kérdések 1. Soroljon fel különböző processzorokat! 2. Mit jelent a CISC kifejezés és mi jellemző az ilyen processzorokra? 3. Soroljon fel indokokat miért érdemes assembly nyelvet tanulni? 4. Soroljon fel indokokat mikor kell assembly nyelvet tanulni? 5. Soroljon fel indokokat mikor ne használjunk assembly nyelvet? 6. Mi az assembly nyelv és a gépi kód

kapcsolata? 7. Magas szintű programozási nyelvben miért nem tudjuk teljes mértékben kontrollálni a hardwaret? 8. Miért hı́vjuk az assembly programozási nyelvet alacsony szintű nyelvnek és a C programozási nyelvet magas szintűnek? 9. Soroljon fel néhány különbséget a CISC és RISC processzorok között? 10. Hasonlı́tsa össze a két féle assembly szintakszist! 11. Soroljon fel assemblereket! 12. Miért lehet szükség az assembly használatára idő kritikus alkalmazások esetén? 13. Soroljon fel idő kritikus alkalmazásokat! 16 2. Fejezet A számı́tógép felépı́tése A számı́tógépnek alapvetően három fő komponense van: a központi egység vagy processzor (CPU), a memória, és az Input/Output eszközök. Lásd a 21 ábra A részek közötti kapcsolatot a rendszer busz biztosı́tja A memória tárolja a programokat és az adatokat is egyszerre Az Input/Output eszközök lehetnek a

billentyűzet, a képernyő és ı́gy tovább. A 22 ábra egy részletesebb nézetét adja a számı́tógépnek, ahol jól látható hogy a rendszer busz három részből áll: cı́m busz, adat busz és kontroll busz. A cı́m busz szélessége határozza meg az elérhető memória kapacitást, illetve az adat busz adja meg, hogy milyen méretű adatok mozoghatnak a CPU, a memória és az I/O eszközök között. Például a 8086-os processzornak 20 bites a cı́m busza és 16 bites az adat busza. Ezek alapján a processzor 220 byte-ot tud megcı́mezni, vagyis 1 MByte-ot és minden alkalommal 16 bit mozog az egységek között. A Pentium processzoroknak 32 cı́m vonaluk van a cı́m buszban és 64 adat vonala Így a Pentium 4 GByte memóriát tud megcı́mezni. A 2.2 ábrán az is fontos, hogy a buszok milyen irányba képesek adatot küldeni Látható, hogy a CPU a kontroll buszon keresztül ad utası́tásokat a

memóriának és az I/O alrendszernek, adatot viszont az adat buszon keresztül fogad. A kontroll buszon kiadható jelek: memória olvasás, memória ı́rás, I/O olvasás, I/O ı́rás, megszakı́tás és ı́gy tovább. 2.1 A processzor A processzor kontrollálja a legtöbb tevékenységet a rendszerben. Úgy érdemes rá gondolni, hogy a következő ciklust hajtja végre: 1. Egy utası́tás betöltése a memóriából (fetch), 2. Az utası́tás dekódolása, azonosı́tása (decode), CPU Memória Kapcsolat Input/Output 2.1 ábra: Absztrakt értelmezése a számı́tógépnek 17 CPU Memória Cím busz Adat busz I/O alrendszer Kontroll busz 2.2 ábra: Egy számı́tógép egyszerűsı́tett diagramja 3. Az utası́tás végrehajtása (execute) Ez a végrehajtási ciklus, vagy fetch-decode-execute ciklus. 2.11 Végrehajtási ciklus • Fetch – A processzor a betöltendő utası́tás cı́mét felrakja a

cı́m buszra. – A processzor a kontroll buszon keresztül memória olvasásra ad utası́tást a memória egységnek. A processzor addig vár amı́g az utası́tás meg nem jelenik az adat buszon. – A memória egységnek idő kell mı́g hozzáfér a szükséges részhez. Ez a hozzáférési idő – A memória a beolvasott utası́tást az adat buszra helyezi. – A processzor beolvassa az adat buszról az utası́tást • Decode – Azonosı́tani kell a beolvasott utası́tást. Ezt segı́tendő az utası́tások bizonyos kódolási mintát követnek, melyet majd a 7. fejezetben tárgyalunk • Execute – A végrehajtáshoz két egységre van szükség: egy kontrol és egy aritmetikai (ALU) egységre. A kontroll egység segı́t az időzı́tésben, mı́g az ALU egység a matematikai számı́tásokat végzi el. Megjegyezzük, hogy az adatok és az utası́tások nem mindig közvetlenül a memóriából jönnek, hanem

az úgynevezett cache-ből. A cache memóriához való hozzáférés gyorsabb A Pentium processzoron 16 KB-os cache van a chipen, melynek fele adat és fele utası́tás cache Szerencsére a cache használata hardware-ben van megoldva és teljesen transzparens a programozó számára. 18 2.12 A rendszer óra A rendszer óra a system clock. A rendszer óra teszi lehetővé, hogy a műveleteket összeszinkronizáljuk Az órajel 1-eseket és 0-kat ad ki sorozatban, szekvenciában. Az óra frekvencia értékét a másodpercenkénti ciklusok száma adja meg és a mértékegysége Hertz (Hz). A MHz és GHz 106 és 109 ciklust jelent másodpercenként. 1 óra frekvencia = (2.1) óra ciklus hossza A rendszer óra adja meg a számı́tógép sebességét. Minden processzor művelet végrehajtása több órajel ciklust igényel. Például egy 1 GHz-es Pentium processzoron egy adat továbbı́tása a memóriából a processzorra

három órajel ciklust igényel. Egy óra ciklus hossza: 1 = 1ns 1 × 109 (2.2) és ı́gy az adattovábbı́táshoz 3 ns-ra van szükség. A számı́tógépek sebességét növelhetjük úgy, hogy nagyobb órajel frekvenciát használunk. Például egy 2 GHz-es processzoron az adat továbbı́tás már csak 1.5 ns-ig fog tartani 2.2 Cı́mzési architektúra Érdekes módon az egyik legfontosabb tulajdonsága egy architektúrának hogy hány cı́met használunk az utası́tásokban. A legtöbb művelethez egy vagy két argumentumra van szükség Ezek alapján szokták a műveleteket binary és unary műveleteknek nevezni, ahol a a “bi-” kettőt, az “un-” egyet jelent. “Unary” művelet például a tagadás (NOT) művelet, mı́g “binary” művelet az összeadás és a kivonás. Ezek a műveletek egy eredményt adnak. Természetesen vannak kivételek, például az osztás Az osztásnál két

argumentumra van szükség, az osztandóra és az osztóra, viszont két eredmény is keletkezik: az eredmény és a maradék. Mivel a “binary” műveletek a leggyakoribbak és ebben az esetben két input argumentumra és egy eredmény, output argumentumra van szükség ezért ezért általában három cı́mre van szükség egy utası́tásnál. Ebben a részben azt nézzük meg, hogyan lehet három, kettő, egy és zérus cı́met használni az utası́tásokkal. 2.21 Három cı́mes architektúra A három cı́met használó utası́táskészlettel rendelkező processzoroknál a két input argumentumot és az egyetlen output argumentumot tudjuk megadni. A legtöbb modern processzor ilyen utası́táskészletet használ. Nézzünk egy példát: A = B + C * D - E + F + A mely pszeudo assembly-ben a következőképpen néz ki: mult add sub add add T,C,D T,T,B T,T,E T,T,F A,A,T ; ; ; ; ; T T T T A = = = = = C B B B B *

+ + + + D C C C C * * * * D D - E D - E + F D - E + F + A A példában az látható, hogy matematikai műveletre egy utası́tást kell megadni. Ami szintén szembetűnő, hogy az első utası́tást kivéve az első két argumentum azonos Mivel az esetek jelentős részében ı́gy van, ezért a sok duplikáció elkerülése végett “két-cı́mes” utası́táskészleteket is szoktak implementálni processzorokban. 19 2.22 Két cı́mes architektúra Ebben az esetben az utası́tásoknak csak cı́m argumentuma van és az egyik cı́m inputként és outputként is szolgál. Az Intel processzorok, például a Pentium is ilyen utası́tásokat használ Nézzük az előző példát újra: A = B + C * D - E + F + A mely pszeudo assembly-ben a következőképpen néz ki: load mult add sub add add T,C T,D T,B T,E T,F A,T ; ; ; ; ; ; T T T T T A = = = = = = C C B B B B * + + + + D C C C C * * * * D D - E D - E + F D - E

+ F + A Mivel csak két argumentum áll rendelkezésre ezért az első utası́tással betöltjük az adatot T-be. Ebben az esetben az a feltűnő, hogy az első 6 utası́tásban a T argumentum közös. Ha ez lesz az alap eset, akkor már csak egy cı́m, argumentum kell az utası́tásokhoz. 2.23 Egy cı́mes architektúra Ha a memória drága vagy lassú akkor egy speciális regisztert használ a processzor. Ez a regiszter szolgáltatja az input és az output argumentumot egy utası́tásnak. Ezt a regisztert akkumulátor regiszternek is szokták nevezni, mivel benne gyűlik össze, akkumulálódik, az eredmény A legtöbb arhitektúra esetén csak egy akkumulátor regiszter van. Ezt a regisztert nem kell megadni az utası́tásnak csak a másik argumentumot. 2.24 Zéró cı́m architektúra Arra is van lehetőség, hogy mindkét argumentum speciális helyen tárolódik és ı́gy nem kell megadni őket az utası́tásoknál.

Ezek a processzorok egy vermet használnak Az argumentumok a verem tetején vannak amiket az utası́tás levesz onnan, majd az eredményt is a verem tetejére teszi vissza. 2.25 Load/Store architektúra Ebben az esetben a műveleteket a processzor belső regiszterein végezhetjük el és külön utası́tással kell beolvasni az adatokat a memóriából a regiszterekbe, illetve a regiszterekből kiı́rni a memóriába. A fenti példa a következőképpen módosul: A = B + C * D - E + F + A mely pszeudo assembly-ben a következőképpen néz ki: load load load load load load mult add R1,B R2,C R3,D R4,E R5,F R6,A R2,R2,R3 R2,R2,R1 ; R2 = C * D ; R2 = B + C * D 20 sub add add store R2,R2,R4 R2,R2,R5 R2,R2,R6 A,R2 ; R2 = B + C * D - E ; R2 = B + C * D - E + F ; R2 = B + C * D - E + F + A A fenti példában hat regisztert is használunk. Bár nincs ennyire szükség, de ez általában jellemző ezekre az architektúrákra, hogy sok

regiszterük van. A RISC processzoroknak több regiszterük van mint a CISC processzoroknak. A MIPS processzornak 32 regisztere van, az Intel Itanium processzornak 128 regisztere és az Intel Pentium processzornak csak 10 regisztere van. 2.3 Regiszterek Minden processzorban vannak regiszterek, melyeket két fő csoportba sorolhatunk: • általános célú regiszterek, • speciális célú regiszterek. A speciális célú regisztereket további két csoportba oszthatjuk: felhasználó által elérhető regiszterek és csak a rendszer által elérhető regiszterek. A Pentium regisztereit a 3 fejezetben tárgyaljuk 2.4 Végrehajtási sorrend A program végrehajtása általában szekvenciálisan történik, az utası́tásokat egymás után hajtjuk végre. Az egyik regiszter, a “Program Counter” (PC) vagy “Instructon Pointer” (IP) regiszter, fontos szerept játszik a végrehajtási sorrend kezelésében. A processzor mindig azt az

utası́tást tölti be (fetch) amire a PC regiszter mutat. A betöltés után a PC regiszter értékét megnöveljük, hogy a következő utası́tásra mutasson. Ez a megnövelés lehet fix méretű, például a RISC processzoroknál, vagy változó méretű a CISC processzoroknál, ahogy ez látható a 1.1 A CISC processzorok esetén minden utası́tásnál külön meg kell állapı́tani, hogy mennyivel növeljük meg a PC regiszter értékét. A magasabb szintű programozási nyelvekben ugyanakkor vannak feltételes végrehajtási és ciklikus programozási konstrukciók, melyek a végrehajtási sorrendet változtatják meg valamilyen futás közbeni feltételtől függően. Ezek megvalósı́tása a processzorokban “speciális” módon történik 2.41 Branching A “branching” szó fordı́tása talán az elágazás lehet. Arról van szó, hogy az eredeti szekvenciát megszakı́tva, máshol

folytatódik a program végrehajtása. Két változata van: a feltétel nélküli és feltételes ugró utası́tás. Ezeknek az utası́tásoknak egy argumentuma van, mely explicit módon megadja az új utası́tás cı́mét. Ez azt jelenti, hogy amikor máshol kell folytatni a végrehajtást, akkor a PC regiszterbe az új cı́met töltjük be és ı́gy a következő “fetch”-nél már ezt a cı́met fogja használni a processzor. A végrehajtási sorrend a feltétel nélküli ugró utası́tás esetén a 2.3 ábrán látható Feltételes ugrás A feltételes ugrás esetén az új cı́m csak akkor töltődik be a PC regiszterbe, ha valamilyen feltétel teljesül. Kétféle módon szokták ezt megadni a különböző processzorokban: Set-Then-Jump : Az ilyen architektúrájú processzorokban a vizsgálat és az ugrás szét van választva. A két, különálló rész közötti kapcsolatot egy regiszter

biztosı́tja. A vizsgálat beállı́tja a regiszter értékét, majd az ugró utası́tás ezt a regisztert vizsgálja meg hogy bekövetkezzen-e az ugrás vagy sem. A Pentium processzorok ezt a technikát használják 21 utasítás jump utasítás a cím b utasítás utasítás c d 2.3 ábra: Ugró utası́tás Test-And-Jump : A legtöbb processzor összekombinálja a két részt, például a MIPS processzorok. Például: beq Rsrc1, Rsrc2, célcı́m összehasonlı́tja az Rsrc1 és Rsrc2 regiszterek tartalmát és ha egyenlőek, akkor a célcı́m-nél folytatódik a végrehajtás. 2.5 Memória A számı́tógép memóriáját úgy érdemes elképzelni mint sok elektronikus “kapcsoló” összessége. Ezek a “kapcsolók” két állapotban lehetnek: nyitott vagy zárt állapotban. Ugyanakkor ezeket az állapotokat érdemesebb 1 és 0 állapottal jellemezni. Így minden “kapcsolót” reprezentálni lehet

egy bináris számmal vagy bittel. A memória millió szám tartalmaz biteket A jobb kezelhetőség miatt a memória a biteket csoportokba szervezik. 8 bit csoportja egy byte Így a memória mint egy byte sorozat képzelhető el Minden byte-ra egy index számmal lehet hivatkozni. Az első index értéke 0 Az utolsó index értéke 2n − 1, ahol az n az adatbusz szélessége (hány bites). A memória sematikus képe a 24 ábrán látható 2.51 Memória műveletek Két alapvető művelet van: adat olvasás a memóriából és adat ı́rás a memóriába. Mindkét esetben szükség van egy memória cı́mre ahonnan olvashatunk, vagy ahova ı́rhatunk. Ezenkı́vűl az ı́rási művelet még egy adatot is igényel. 2.52 Olvasási ciklus 1. A processor elhelyezi az olvasandó adat cı́mét a cı́m buszon 2. A kontroll buszon a processzor kiadja a memória olvasási jelet 3. A processzor várakozik amı́g az olvasás

megtörténik és az adat megjelenik az adat buszon 4. A processzor beolvassa az adatot az adat buszról 22 32 FFFF FFFF 2 -1 FFFF FFFE 1 0000 0001 0 0000 0000 2.4 ábra: A memória sematikus képe 5. A kontroll buszon jelzi a processzor, hogy véget ért az olvasás Egy Pentium processzor olvasási ciklusa három órajel ciklusnak felel meg. Az első órajel ciklus alatt az 1. és 2 lépés hajtódik végre A második órajel ciklus alatt a processzor várakozik A harmadik órajel ciklus alatt az utolsó két lépés fut le. Ha a memóriának mégsem sikerül az olvasás, akkor ezt jelzi a processzornak ami egy újabb órajel ciklusig vár. 2.53 Olvasási ciklus 1. A processzor elhelyezi az ı́randó adat cı́mét a cı́m buszon 2. A processzor elhelyezi az adatot az adat buszra 3. A kontroll buszon a processzor kiadja a memória ı́rási jelet 4. A processzor várakozik amı́g az ı́rás megtörténik 5. A kontroll

buszon jelezzük az ı́rás végét A Pentium processzor ı́rási cı́klusa is három órajel ciklust igényel. Az 1 és 3 lépés az első órajel alatt következik be. A 2 lépés csak a második órajel ciklus alatt történik A második órajel ciklus végén jelzi az ı́rás végét. 2.54 Memória tı́pusok A memóriákat különböző kategóriákba lehet csoportosı́tani. Az egyik legfontosabb tulajdonsága a memóriáknak, hogy csak olvashatók vagy ı́rhatók-olvashatók. Szintén fontos tulajdonság, hogy a memória minden részének elérése azonos időben lehetséges (random-access) vagy csak szekvenciálisan. A szekvenciális elérés magyarázatához a legjobb példa egy kazetta, amikor is addig kell olvasni a kazettát, amı́g el nem értük a keresett adatot. Végül vannak a “volatile” memóriák, melyeknél amı́g feszültség alatt van az egység csak addig őrzi meg a tartalmat. A

“nonvolatile” memória akkor is megőrzi a tartalmát ha nincs feszültség alatt az egység. Csak olvasható memóriák A csak olvasható memóriák (Read Only Memory vagy ROM) csak olvasási műveletet enged. Ebbe a memóriába nem tudunk ı́rni. A fő előnyük, hogy egyben “nonvolatile” memóriák is A ROM memóriák 23 tartalmát a “gyárban” égetik bele. Ezeket a memóriákat olcsó gyártani A régebbi számı́tógépekben a BIOS általában ROM. Vannak úgynevezett programozható ROM-ok is (PROM), illetve törölhető (erasbale) PROM-ok (EPROM). Írható-olvasható memóriák Az ı́rható-olvasható memóriákat általában RAM-nak (random access memory-nak) is szokták nevezni, habár a ROM-ok esetén is igaz az, hogy minden része azonos időben érhető el. Ezeket a memóriákat két csoportba lehet sorolni: statikus és dinamikus. A statikus RAM memóriák (SRAM) megőrzi az adatot a

beı́rás után, minden további menipuláció nélkül, amı́g a rendszer feszültség alatt van. Ilyen memória a cache vagy a regiszterek. Ezzel szemben a fő memória dinamikus (DRAM) A DRAM egy komplex eszköz, mely kondenzátorok segı́tségével tárol egy bitet. A feltöltött kondenzátor jelöli az 1-es értéket Mivel a kondenzátorok idővel vesztenek a töltésükből ezért időközönként frissı́teni kell. Tipikusan 64 ms a frissı́tési periódus Az olvasás során azt teszteljük, hogy a kondenzátor fel van-e töltve. Ugyanakkor ez a tesztelés tönkre is teszi a töltést Ebben az értelemben a DRAM egy speciális memória, mivel az olvasás is destruktı́v, nem csak az ı́rás. A legtöbb memória esetén csak az ı́rás destruktı́v. A destruktı́v olvasás következménye, hogy az olvasás után egy helyreállı́tási ciklus szükséges. Ennek az a következménye, hogy az olvasás

kétszer olyan sokáig tart mint más memóriák esetén. Modern memória tı́pusok: • FPM DRAM: Fast page-mode DRAM • EDO DRAM: Extended Data Output DRAM • SDRAM: synchronous DRAM • DDR SDRAM • RDRAM: Rambus DRAM 2.55 Byte sorozatok tárolása Természetesen általában nem csak egy byte-ot kell tárolni, hanem több byte-ot is. Például egy egész számot a C programozási nyelvben általában 4 byte-on tárolunk. Felmerülhet a kérdés, hogy hogyan tároljuk ezt a 4 byte-ot a memóriában? A 2.5 ábra két megoldást is mutat Az ábrán az MSB jelölés a “Most Significant Byte”-nek felel meg, mı́g az LSB a “Least Significant Byte”. Mindkét megoldás esetén a 100-as cı́met adtuk meg, és ehhez képest történik a tárolás. A “Little-endian” tárolási módban a legkisebb helyiértékű byte (LSB) tárolódik először. Ezzel szemben a “Big-endian” tárolási módban a legnagyobb

helyiértékű byte (MSB) tárolódik legelőször. Nézzünk egy másik példát a “Little-endian” tárolási módra. Az 1234h hexadecimális szám esetén először a 34h, majd a 12h byte-ot tárolja a rendszer. Az 12345678h szám esetén a tárolási sorrend: 78h, 56h, 34h, 12h. Melyik tárolási módszer a jobb? Mindkettő ugyanolyan jó. Csak a processzor tervező döntése, hogy melyiket használja. A Pentium processzorok a “Little-endian” tárolási módot használják A MIPS és PowerPC processzorokon a “Big-endian” tárolási mód az alapértelmezett, de át lehet konfigurálni őket “Little-endian” tárolási módra is. Általában a különböző tárolási mód nem okoz problémát, ha mindig csak egyféle processzort használunk. Az igazi problémák akkor jelennek meg, ha különböző tárolási módszert használó processzorok között akarunk egy programot hordozni. Ebben az

esetben az adatokat konvertálni kell! 24 MSB LSB 11110100 10011000 10110111 00001111 cím 103 102 101 100 cím 11110100 10011000 10110111 00001111 103 102 101 100 Little-endian 00001111 10110111 10011000 11110100 Big-endian 2.5 ábra: “Little-endian” és “Big-endian” tárolási mód 2.56 Adat “alignment” problema Egy program végrehajtási sebességét több tényező is befolyásolja. A tényezők közül néhány a programozó befolyása alatt van, mı́g másokat nem tudnak befolyásolni Ebben a fejezetben az egyik fontos tényezőt vizsgáljuk meg. Tegyük fel, hogy egy 32 bites adatot szeretnénk olvasni a memóriából. Azt is tegyük fel, hogy az adat busz szintén 32 bites. Ha az olvasni kı́vánt adat cı́me néggyel osztható, akkor a memóriában pont úgy van elhelyezve, hogy egy sorba esik. Ez látható a 26 ábrán és ezt szoktuk illesztett, “aligned” adatnak nevezni. Mivel az adatbusz 32 bites,

ezért egyszerre 4 byte-ot, egy sort lehet beolvasni a memóriából. Ez azt jelenti, hogy ha a cı́m nem osztható néggyel, akkor az adat két sorba kerül és kétszer kell olvasni a memóriából, majd ezekből fogja a processzor összeállı́tani a szükséges 32 bites adatot. A kétszeri olvasásnak hatása van a program futására, mivel a nem illesztett adatok miatt lassabban fog futni! n+3 k+2 24-31 n+2 k+1 16-23 n+1 8-15 k 0-7 n+0 CPU adatbusz 32 bit k+3 memória adat1 adat2 2.6 ábra: Adat illesztés - “data alignment” Az adat illesztés problémája teljesen transzparans módon, vagyis nem jelenik meg a felhasználó számára, kivéve, hogy a program lassabban fut. A 16 bites adatokat 2 byte-ra kell illeszteni Ez azt 25 Cím busz Adat Adat busz Státusz Parancs Kontroll busz I/O eszköz I/O kontroller 2.7 ábra: Input/Output eszköz sematikus ábrája jelenti, hogy a cı́m legkisebb helyiértékű bite

zérus, vagyis a cı́m páros. A 32 bites adatokat 4 byte-ra kell illeszteni vagyis a cı́m két legkisebb helyiértékű bite zérus. És ı́gy tovább A Pentium processzorok megengedik az illesztett (“aligned”) és nem illesztett adattárolást is. Bizonyos processzorok az előbb leı́rt hatékonysági probléma miatt nem engedik meg, hogy az adat ne legyen illeszteve. 2.6 Input/Output Az Input/Output eszközök teszik lehetővé, hogy a számı́tógépek kommunikáljanak a “külvilággal”. Input/Output eszköz lehet hogy csak adatszolgáltatásra alkalmas, input-ra, például az egér, vagy csak output-ra képes, például a monitor, vagy input-ra és output-ra is képes. Így lényegében az I/O eszközöknek két fő célja van, a külvilággal kommunikálni és adatot tárolni. Mindegyik kommunikáció a rendszer buszon keresztül történik, bár az I/O eszközök nem közvetlenül kapcsolódnak a

buszhoz, hanem van egy I/O kontroller az eszköz és a rendszer busz között, ahogy ez 2.7 ábrán látható Két fontos ok miatt van szükség ezekre az I/O kontrollerekre: 1. A különböző I/O eszközöket különböző módon kell kezelni Ez azt jelenti, hogy a különböző eszközökkel különböző módon kell kommunikálni, néha várni kell az adat megérkezésére vagy vezérlő jeleket kell adni. Ha a processzornak kellen mind ezt a feladatot ellátni, akkor több időt töltene ezzel, mint a felhasználó kiszolgálásával, vagyis a programok futtatásával. Az I/O eszköz kontroller elvégzi a processzor helyett ezeket a feladatokat. 2. A másik ok, hogy a rendszer buszon keresztül küldött elektromos jel igen alacsony, ami azt is jelenti, hogy a rendszer busz nem lehet túl hosszú. Emiatt az I/O eszköz kontrollerek közel vannak a processzorhoz, például a számı́tógép házban, és majd a

kontroller tud külön, erősebb jelet küldeni az eszköznek. Az 2.7 ábra azt is mutatja, hogy az I/O eszköz kontrollerekben általában három regiszter is van Például egy nyomtató esetén a “Státusz regiszter” jelzi, hogy az eszköz készen áll-e, az “Adat regiszterbe” kell tenni a nyomtatandó karaktert és a “Parancs regiszterben” kell utası́tást adni az eszköznek, hogy nyomtassa ki a karaktert. A processzor I/O portokon keresztül éri el ezekete a regisztereket Az I/O port nem más mint az I/O eszközön levő regiszter cı́me. Az I/O portok lehetnek a memóriára illesztettek, memory-mapped I/O. Ilyen rendszer például a MIPS processzorban van A Pentium processzorok egy I/O cı́m tartományt használnak Ez a cı́m tartomány különbözik a memória cı́m tartományától Ebben az esetben külön I/O utası́tásokat kell használni Ugyanakkor ez az utóbbi technika a memóriára illesztett I/O-t is

lehető teszi. Később látni fogjuk, hogy például a képernyő a memóriára illeszthető és úgy is ı́rhatunk a képernyőre, hogy egy speciális memória területre ı́runk. Ezzel szemben a billentyűzettel lehet I/O utası́tásokkal is kommunikálni. 26 2.61 I/O eszközök elérése Amikor assembly-ben programozunk közvetlenül vezérelhetjük az I/O eszközöket. Bár erre lehetőségünk van, de leı́rások és segı́tség nélkül gyakran nagyon bonyolult lehet, illetve minden esetben saját input és output függvényeket kellene kifejlesztenünk. Ezenkı́vül, ha mindenkinek teljesen szabad hozzáférése van az I/O eszközökhöz, akkor rosszindulatú emberek ezt ki is használhatják. Ezért van az, hogy általában az operációs rendszer kontrollálja az eszközökhöz való hozzáférést, illetve biztosı́tja a rutinokat is amiket használhatunk. A rutinok általában valamilyen

megszakı́tást használnak A megszakı́tásokat a 8.2 bekezdésben tárgyaljuk 2.7 Összefoglalás Ebben a fejezetben a számı́tógép alapvető elemeit ismertük meg olyan mélységben amire szükségünk lehet az assembly programozás során. Ezek az ismeretek lehetnek újak, illetve bizonyos fogalmak előfordulhattak más tárgyak keretében. 2.8 Ellenőrző kérdések 1. Milyen részekből áll egy sematikus számı́tógép? 2. Mi a fetch-decode-execute ciklus? Melyik lépésben, mi történik? 3. A rendszer busz milyen fő részekből áll? Melyiknek mi a szerepe? 4. Ha a processzornak 64 cı́m vonala van, mekkora lehet maximálisan a memória mérete? Mi az utolsó byte cı́me? 5. Mi határozza meg, hogy a memória és a processzor között adatok mérete mekkora? 6. Egy 2GH-es processzorban mekkora egy óra jel ciklus? 7. Miben különbözik a “load/store” architektúra a többi architektúrától? 8.

Adjon magyarázatot arra hogy a RISC processzorokon az utası́tások egymás utáni végrehajtása miért lehet gyorsabb mint a CISC processzorokon! 9. Mit jelent a három cı́mes architektúra? 10. Miben különbözik a három és két cı́mes architektúra? 11. Hogyan lehet olyan architektúrát megvalósı́tani, amelyikben az utası́tásoknak nem kell argumentumot megadni? 12. Adja meg a következő matematikai műveleteket pszeudo assembly-ben két cı́mes architektúra esetén: E = A * B + C - D 13. A RISC vagy a CISC processzorokra jellemző a nagy számú regiszter? Melyik cı́mzési architektúra esetén van szükség erre a nagyszámú regiszterre? 14. A Pentium processzor a RISC vagy CISC processzorok családjába tartozik? 15. A MIPS processzor a RISC vagy CISC processzorok családjába tartozik? 16. Hogyan lehet megvalósı́tani a feltételes ugró utası́tást különböző architektúrákon? 17. Mi a PC regiszter

szerepe a feltételes ugró utası́tás végrehajtása során? 27 18. Hogyan néz ki a memória sematikus képe? Jelölje a minimum és maximum indexet 16 bites adatbusz esetén. 19. Mi jellemzi a ROM memóriákat? 20. Mi a különbség a statik és dinamikus RAM-ok között? 21. Mi a DRAM működésének alapelve? Miért dinamikus memória? 22. Miért kell frissı́teni a DRAM memóriát? 23. Mi a különbség a “volatile” és “nonvolatile” memória között? 24. Mit jelent a “little-endian” tárolási mód? 25. Hogyan tárolódik a 44443333h hexadecimális szám a “big-endian” tárolási móddal? 26. Milyen tárolási módot használ a Pentium processzor? 27. Mit jelent az adat “alignment”? 28. Miért van hatással a nem illesztett adat tárolás a programok sebességére? 29. Miért van szükség I/O kontrollerre? 30. A processzor milyen módokon kommunikálhat az I/O kontrollerrel? 28 3.

Fejezet A processzor Az Intel cég 1969-ben vezette be az első processzorát, a 4004 processzort. Ezt követte a 8080 és 8085 processzorok. Ezek a processzorok vezettek az Intel Architektúra (IA) kidolgozásához, a 8086os processzorhoz, 1979-ben A 8086 processzornak 20 bites cı́m busza és 16 bites adatbusza van A következő generáció a 80186 processzor volt, melyben újabb utası́tásokat vezettek be, de a cı́m és adat busz mérete változatlan maradt. Mivel ezt a processzort nem igazán használták, ı́gy az igazi következő generációs processzor a 8086 után a 80286 processzor volt. A 80286 processzornak 24 bites cı́m busza van, amivel 16 MByte memóriát lehet megcı́mezni. Ugyanakkor az adatbusz megmaradt 16 bites A másik újı́tás a védett mód (protected mode) bevezetése volt. Az Intel cég első igazi 32 bites processzora a 80386-os processzor volt, melynek 32 bites cı́m és adat busza van. Ezzel a processzorral

4GByte memóriát lehet megcı́mezni, ráadásul akár egyben, ami lehetővé tette a “flat” módot. A 80486 processzor 1989-ben jelent meg A processzorba beépült a matematikai ko-processzor, egy 8KB-os L1-es cache is került a hardware-be, támogatta az L2 cache-t is és lehetővé vált a párhuzamos futtatás. A Pentium processzorok a “legújabbak” az Intel-től, bár itt a Pentium nevet mint a processzorok egy családjának a neveként használjuk. Az első Pentium processzort 1983-ban mutatták be Azóta megjelentek a Pentium Pro, Pentium II, Pentium III és Pentium 4 processzorok. A processzorokról ad áttekintést a 3.1 táblázat A hagyományos Intel architektúrától jelentősen eltér az Itanium processzor, mely RISC alapú, eltérően az Intel más processzoraitól, és más újı́tásokat is tartalmaz. Ugyanakkor, ma (2009 szeptember) már kijelenthetjük, hogy ez a processzor nem váltotta be a hozzá

fűzött reményeket és nem terjedt el olyan mértékben a számı́tógépes piacon, hogy jelentős szereplője legyen. Processzor Év 8086 80286 80386 80486 Pentium Pentium Pro Pentium II Pentium III Pentium 4 1979 1982 1985 1989 1993 1995 1997 1999 2000 Frekvencia (MHz) 8 12.5 20 25 60 200 266 500 1500 Regiszter méret 16 16 32 32 32 32 32 32 32 Adat busz méret 16 16 32 32 64 64 64 64 64 3.1 tábla: Processzorok áttekintése 29 Maximum memória 1 MB 16 MB 4 GB 4 GB 4 GB 64 GB 64 GB 64 GB 64 GB 3.1 Általános regiszterek A 3.2 táblázat tartalmazza a 8086-os processzor általános célú regisztereinek listáját A táblázatban az is látható, hogy a 16 bites regiszterek közül melyeket lehet 8 bites “darabokban”, regiszterekként használni. Fontos megjegyezni, hogy 8 bites regiszterek esetén az egyik regiszter értékének megváltoztatása nincs hatással a regiszter többi részére. Például ha az AL

regiszter résznek értéket adunk attól még az AH regiszter rész nem fog megváltozni! Speciális regiszter az IP vagy instruction pointer regiszter, mely a következő végrehajtandó utası́tásra mutat. Ezt a regisztert kontroll regiszternek is szoktuk nevezni Végül a szegmens regiszterek listáját a 3.3 táblázat tartalmazza Ezek a regiszterek támogatják a szegmentált memória kezelését. Név Akkumulátor Bázis Számláló Adat Forrás index Cél index Bázis pointer Stack pointer Teljes regiszterek 0-15 bit AX BX CX DX SI DI BP SP 8-15 bit AH BH CH DH 0-7 bit AL BL CL DL 3.2 tábla: Általános célú regiszterek Név Kód szegmens Data szegmens Extra szegmens Stack szegmens Regiszterek 0-15 bit CS DS ES SS 3.3 tábla: Szegmens regiszterek 3.2 Szegmentált cı́mzés először Ebben a fejezetben csak az úgynevezett valós módú memória architektúrát (real-mode memory architecture) tárgyaljuk, mely a

8086-os processzorra jellemző. A processzor 1MB memóriát tud megcı́mezni A memória megcı́mzéséhez 20 bites értékre van szükség. Az első memória hely cı́me: 00000h, mı́g az utolsó memória hely cı́me: FFFFFh. Mivel minden regiszter 16 bites a 8086 processzorban, ezért az ı́gy megcı́mezhető memória mérete korlátozott: 216 vagy 65536 byte. Ennek következtében a memóriát szegmensekre kell osztani, melyek mérete 65536 byte. Így, ebben a szegmentált memóriában meg kell adni egy szegmens bázis cı́met és egy offszetet. Ez a két érték adja meg a logikai cı́met A szegmens bázis cı́m adja meg, hogy a szegmens hol kezdődik a memórián belül, mı́g az offszet a szegmensen belüli helyet adja meg. A 31 ábra a fizikai memória cı́mek és a szegmentált, logikai cı́mzés közötti kapcsolatot mutatja. Amint látható, a szegmens fizikai cı́me 20 bites (12000h). Hogyan lehet 20 bites cı́met

tárolni 16 bites regiszterekben? A válasz az, hogy sehogy, és egy trükköt kell alkalmazni. A lényeg, hogy a szegmens regiszter a 20 bites cı́mből a 16 legnagyobb helyiértékű bitet tárolja (most significant bit) és feltételezzük, 30 fizikai cím 12345 offszet (345) szegmens bázis (1200) 12000 3.1 ábra: Kapcsolat a fizikai és logikai cı́mek között hogy az utolsó 4 bit zérus, amit nem kell tárolni. Ez persze azt is jelenti, hogy a szegmensek fizikai cı́me csak olyan lehet, aminek a 4 legkisebb helyiértékű bite zérus lesz, vagyis: 00000h, 00010h, 00020h, 00030h, . FFFE0h, FFFF0h A szegmensen belüli memória helyet az offszet adja meg A programozónak csak a logikai cı́mzéssel, vagyis a szegmens:offszet párral kell foglalkoznia, ami automatikusan konvertálódik 20 bites fizikai cı́mmé, ahogy ez a 3.2 ábrán látható Lényegében a szegmens regiszter tartalmához jobbról hozzáillesztünk négy

darab zérus bitet, majd ehhez az értékhez hozzáadjuk az offszet értékét. Ha hexadecimális számrendszerben dolgozunk, akkor a szegmens regiszter tartalmához egy nullát kell hozzáı́rni és ehhez kell az offszet értékét hozzáadni Nézzünk egy példát, ahol a logikai cı́m hexadecimális számrendszerben: 1200:0345 és ı́gy a fizikai cı́m: 12345, mivel: 1 2 1 2 + 0 3 3 0 4 4 0 5 5 Minden logikai cı́mhez tartozik egyetlen fizikai cı́m. Ugyanakkor a fordı́tottja nem igaz, vagyis egy fizikai cı́mhez több logikai cı́m is tartozhat. Például a 1200:0345 és 1000:2345 logikai cı́mek ugyanazt a fizikai cı́met adják meg. A logikai cı́m tárolásához tehát kell egy szegmens regiszter és egy offszet regiszter. A szegmens regisztereket a 33 táblázat sorolta fel Ezek a regiszterek teljesen függetlenek egymástól és a megcı́mzett szegmensek lehetnek szomszédosak, átfedők, ugyanazok illetve

egymástól távoli memória tartományok, ahogy ezt a 3.3 ábra is mutatja Offszet regiszterként csak azok a regiszterek használhatók, melyeket a cı́mzésben lehet használni: BX, BP, SP, SI, DI. 3.3 Cı́mzési módok A CISC processzorok nagy számú cı́mzési módot támogatnak, szemben a RISC processzorokkal. A 8086-os processzor, mint egy CISC tı́pusú processzor, három fő cı́mzési módot támogat: 1. Regiszter mód: Ebben az esetben regiszterek adják az utası́tás a bemeneti paraméterét és az 31 19 szegmens regiszter 0 4 3 0000 19 16 15 0000 0 offszet regiszter Összeadó 19 0 20 bites fizikai cím 3.2 ábra: Fizikai cı́m generálása 8086 processzoron 3.3 ábra: A szegmensek egymáshoz való viszonya eredményt is regiszterben tároljuk. Például: MOV AX, BX Ez a leghatékonyabb cı́mzési mód, mivel az adat a processzoron belül marad, nincs szükség memória műveletre. 2. Közvetlen

mód: Ebben az esetben az adat az utası́tás része és bár az adat a memóriában van, de a kód szegmensben, nem az adat szegmensben. Az adat mindig egy konstans szám és csak forrás lehet, vagyis a közvetlenül megadott számot tároljuk, vagy manipuláljuk az utası́tással. Az utası́tás másik operandusa mindig valamilyen más tı́pusú, cı́mzésű kell legyen, például regiszter. Például: MOV AX, 1234h 3. Memória mód: Amikor az egyik operandus a memóriára hivatkozik, akkor több cı́mzési lehetőségünk is van. Itt érdemes az előző bekezdésre emlékezni, hogy egy szegmens és egy offszet cı́m komponenst kell megadni a végső, fizikai cı́mhez A szegmens részt vagy explicit módon adjuk meg, vagy a használt regiszterek és kontextus határozza meg az egyik szegmens regisztert. A különböző cı́mzési módok csak az offszet formáit adja meg. A cı́mzési módok formáit a 34

táblázat foglalja össze. Ezekben az esetekben az adat mindig az adat szegmensben van és a hozzáférés lassabb mint az előző két esetben. Memória cı́mzésre csak a BX, BP, SP, SI, DI regiszterek használhatók. A BP és SP regiszter esetén az SS szegmens regisztert feltételezzük, mı́g a többi regiszter esetén (BX, SI, DI) a DS szegmens reg- 32 Direkt Regiszter [disp] [BX] [BP] [SI] [DI] Cı́mzési mód Indirekt Bázisrelatı́v Indexelt [BX+disp] [BP+disp] [SI+disp] [DI+disp] Bázisrelatı́v indexelt eltolás nélkül eltolással [BX+SI] [BX+SI+disp] [BX+DI] [BX+DI+disp] [BP+SI] [BP+SI+disp] [BP+DI] [BP+DI+disp] 3.4 tábla: Cı́mzési módok Szegmens regiszter DS DS SS DS DS DS DS SS SS Offszet [disp] [BX+disp] [BP+disp] [DI+disp] [SI+disp] [BX+SI+disp] [BX+DI+disp] [BP+SI+disp] [BP+DI+disp] Cı́mzési példa [DS:4423] [DS:BX+3] [SS:BP+5512] [DS:DI+6201] [DS:SI+18] [DS:BX+SI+35] [DS:BX+DI+43] [SS:BP+SI+12] [SS:BP+dI+22]

3.5 tábla: Cı́mzési mód példák isztert feltételezzük a cı́mzésnél, ha nincs szegmens regiszter megadva az utası́tásban. Természetesen a szegmens regiszter explicit módon is megadható, ı́gy például a BX regiszterrel az ES szegmens regiszter is használható. Cı́mzési példákat a 35 táblázat tartalmaz 3.31 Direkt cı́mzési mód Ez az egyik legegyszerűbb cı́mzési mód. Az adat az adat szegmensben található és általában elegendő az offszetet megadni. Ilyenkor automatikusan a DS regisztert feltételezhetjük Természetesen explicit módon elő is ı́rhatjuk a szegmens regisztert. Mı́g a végső gépi kódban konkrét számnak, cı́mnek kell szerepelnie, assembly-ben lehetőségünk van szimbólikus cı́mek használatára. Ha szimbólikus cı́met használunk az assembler majd kiszámolja és behelyettesı́ti a konkrét cı́met a gépi kódba. Vegyük a következő adat

definı́ciókat a 4.21 fejezet alapján: valasz tabla1 nev1 DB ’i’ DB 0, 0, 0, 0, 0 DB ’Jim Doe’ majd nézzünk néhány példát ezeknek az adatoknak a direkt cı́mzésére: MOV MOV MOV MOV AL, [valasz] [valasz], ’n’ [nev1], ’K’ [tabla1], 32 ; ; ; ; AL-be az ’i’ karakter valasz-t felulı́rjuk ’n’ karakterrel Ezután ’Kim Doe’ lesz a név az els} o tárolt érték 32 lesz Nagyon fontos, hogy a szögletes zárójelet használjuk, ha magát az adatot akarjuk betölteni vagy kiı́rni. Hasonlı́tsuk össze az alábbi két utası́tást: MOV BX, [tabla1] MOV BX, tabla1 33 Az első utası́tás a ‘tabla1’ cı́men található 16 bites, word értéket tölti be a BX regiszterbe. A második utası́tásban a ‘tabla1’ cı́mét töltjük be a BX regiszterbe! Ez utóbbi jelölésre például az indirekt cı́mzésnél van szükségünk. 3.32 Indirekt cı́mzési mód A direkt cı́mzési

módot az egyszerűsége folytán leginkább arra használjuk, hogy egy-egy változót közvetlenül olvassunk vagy ı́rjunk. Ugyanakkor arra már nem alkalmas, hogy egy tömb n-edik elemét módosı́tsuk,1 erre inkább az indirekt cı́mzés alkalmas. Az indirekt cı́mzés során valamelyik cı́m regisztert használjuk arra, hogy például egy tömb cı́met a regiszterbe tötltsük, majd a regiszter módosı́tásával a tömb különböző elemeit elérjük. Vegyük azt a példát amelyben egy 10 elemű tömb elemit érjük el: tomb DB 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ; | ; [BX+4] . MOV BX, tomb MOV [BX], byte 11 ; tomb[0] = 11 ADD BX, 4 MOV [BX], byte 66 ; tomb[4] = 66 Fontos megjegyezni, hogy az adat méretét is figyelembe kell venni a cı́mzés során. A fenti példában 10 darab byte adatot kezeltünk, mı́g a következő példában word méretű adatokat használunk: tomb DW 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ; | ; [BX+4] .

MOV BX, tomb MOV [BX], word 11 ; tomb[0] = 11 ADD BX, 4 MOV [BX], word 66 ; tomb[2] = 66 Ennél a példánál arra érdemes emlékezni, hogy egy word adat két byte-ból áll, és a BX regiszterhez négyet hozzáadva a BX által mutatott cı́met négy byte-al toljuk el. A két példa közötti különbséget a 3.4 ábra mutatja Az ábrán nem véletlen a 66 00 adat, mivel bár a programban csak 66 szerepel, de ez word méretű adatként 0066 lesz, amit viszont az Intel processzorok a “Little endian” módon tárolnak. Az indirekt cı́mzéshez szükséges cı́met másképpen is betölthetjük a regiszterbe: MOV BX, tomb helyett LEA BX, [tomb] A fő különbség az, hogy az első esetben a cı́met az assembler a gépi kód generálása közben számolja ki addig a második esetben a cı́met futási időben határozza meg a rendszer. Bár ebben az esetben nincs közvetlen előnye, de összetettebb cı́mzés esetén már

igen, például: MOV BX, tomb ADD BX, SI 1 Hacsak nincs minden elemnek a tömbben saját neve. 34 tomb[4] tomb[0] 0 1 byte 2 3 11 4 5 . 66 tomb[0] tomb[1] tomb[2] 0 1 word 2 3 11 00 4 5 . 66 00 3.4 ábra: Byte és word méretű tömbök közötti különbség helyett LEA BX, [tomb+SI] lehet használni. 3.4 Státusz regiszter A státusz regiszter 16 bitből áll. Ebből a 16 bitből kilencet használ a 8086-os processzor A további 7 bit nincs definiálva illetve nem használja a processzor. A státusz bitek függetlenek egymástól és természetesen az értékük csak 1 vagy 0 lehet. A státusz bitek alapvetően jelzések Lényegében értesı́tik a programozót hogy a processzor valamilyen állapotban van ı́gy a program reagálni tud ezekre az állapotokra. Minden státusz bitnek külön jelentése van és külön két betűs szimbólummal jelöljük őket A 3.6 táblázat mutatja a bitek jelölését

OF : Overflow bit. Értéke 1 ha az utolsó eredmény az előjeles szám ábrázolási tartományon kı́vülre esik. Minden más esetben az értéke nulla DF : Direction bit. Ez egy furcsa státusz bit, mivel ebben az esetben nem a processzor jelez a programozónak, hanem fordı́tva, a programozó jelez a processzornak Ez a bit adja meg hogy string műveletek során a cı́mek növekedjenek vagy csökkenjenek. Amikor a bit értéke 1, akkor a string műveletek során a cı́mek csökkennek, ha a bit értéke 0, akkor pedig csökkennek a cı́mek. Ezt a bitet még újra megvizsgáljuk a 7.6 fejezetben IF : Interrupt enable bit. Ez egy két irányú státusz bit, vagyis nem csak a processzor jelezhet egy állapotot, hanem mi is képesek vagyunk jelezni a processzornak. Amikor ennek a bitnek az értéke 1, akkor a megszakı́tások engedélyezettek és bármikor bekövetkezhetnek. Ha a bit értéke zérus akkor CPU nem veszi figyelembe a

megszakı́tásokat. TF : Trap bit. Ennek a bitnek a segı́tségével lehet programokat lépésenként végrehajtani Ha be van állı́tva (értéke 1), akkor a processzor egy utası́tást hajt végre majd meghı́v egy megszakı́tást. Általános esetben a programozók nem használják, de például a DEBUG programnál elengedhetetlen. SF : Overflow bit. Értéke 1 ha az utolsó eredményben a legmagasabb helyiértékű bit értéke 1, vagyis negatı́v szám az eredmény. Ha az eredmény pozitı́v szám, akkor a legmagasabb helyiértékű bit értéke zérus és a ez a bit is zérus lesz. ZF : Zérus bit. Értéke 1 ha az utolsó eredmény zérus volt Ha az utolsó eredmény bármilyen zérustól különböző értékű, akkor ennek a bitnek az értéke zérus. 35 15 14 13 12 11 OF 10 DF 9 IF 8 TF 7 SF 6 ZF 5 4 AF 3 2 PF 1 0 CF 3.6 tábla: Státusz regiszter bitjei AF : Auxiliary bit. Ezt a

bitet csak a BCD aritmetika során használjuk A BCD aritmetikát a 871 fejezetben tárgyaljuk. PF : Parity (paritás) bit. Ez a bit azt jelzi, hogy az utolsó művelet eredményében (mint bináris számban) hány darab 1-es bit van. Például a 0F2h hexadecimális szám binárisan 1111 0010 amiben páratlan számú 1-es van és ı́gy a paritás bit értéke zérus lesz. A 03Ah binárisan 0011 1100 és mivel páros számú 1-es található az eredményben ı́gy a paritás bit értéke egy lesz. Ez bit tulajdonképpen abból az időből származik, amikor még minden kommunikáció soros porton keresztül zajlott. A soros kommunikáció esetén a hiba érzékelésének egyik módja volt, hogy a küldés előtt megállapı́tjuk az adat paritását, majd átküldjük az adatot és a paritás bitet. A “túloldalra” megérkezett adatot a paritás bittel lehet ellenőrizni. CF : Carry bit. Értéke 1 ha az utolsó

eredmény az előjel nélküli szám ábrázolási tartományon kı́vülre esik. Például ha egy aritmetikai vagy shift művelet során egy 9 vagy 17 bit is keletkezik, akkor ennek a bitnek az értéke 1 lesz. Minden más esetben az értéke nulla Példa a 87 fejezetben látható. 3.5 Ellenőrző kérdések 1. Mi a szegmens? Miért kell a Pentium processzorokon szegmentált memória architektúrát használni? 2. Valós módban miért 64KByte méretű egy szegmens? 3. Valós módban egy szegmens nem kezdődhet bárhol a memóriában Miért? 4. A 8086-os processzoron négy szegmens lehet egyszerre kezelni Miért? 5. Mutassa be a fizikai cı́m kiszámı́tásának módját logikai cı́mből! 6. Konvertálja az alábbi logikai cı́met fizikai cı́mmé: 3911:0200, 3000:0333 7. Az IP regiszterhez, melyik szegmens regiszter tartozik? 8. Lehet-e a CS és DS regiszter értéke ugyanaz? 9. Lehet-e a ES regiszter értéke: 1234h?

10. Melyik szegmens regiszter járul az SP regiszterhez? 11. Mire való a státusz regiszter? 12. Soroljon fel néhány dolgot, hogy mit jelezhet a státusz regiszter! 13. Mi a különbség a sor orientált és oszlop orientált tömb tárolási módok között? 14. Adva van a következő adat: tomb resb 12 töltse ki a hiányzó részeket, hogy a 4. és 5 elemet hasonlı́tsuk össze: MOV SI, MOV AX, [tomb+SI] CMP AX, 36 4. Fejezet NASM assembler 4.1 Egy forrás file szerkezete Az assembly nyelvben, illetve a legtöbb assembler alatt és ı́gy a NASM assembler alatt is, a forráskódban a sor a következő négyféle dolgot tartalmazhatja: cı́mke: utası́tás operandus ; megjegyzés A négyféle rész közül a legtöbb opcionális, hiszen egy sorban lehet csak megjegyzés, csak cı́mke, ezek kombinációja, esetleg cı́mke és utası́tás és ı́gy tovább. Az operandus jelenléte mindig az utası́tástól

függ. Ha a sor végén a ’backslash’ () karakter áll, ez azt jelenti, hogy a következő sor is az adott sorhoz tartozik, annak folytatása. A NASM assemblerben nincs semmilyen megkötés a SPACE-ek és tabulátorok használatára. Ezekből a karakterekből, a sor részei között bármennyit használhatunk. Rááadásul a cı́mke után a kettőspont is opcionális. Ez sajnos hibákhoz vezethet! Például, habár a lodsb utası́tást szeretnénk leı́rni egy sorba, de a lodab szöveget ı́rtuk le, az assembler nem fog szólni mivel úgy tekint rá mintha abban a sorban csak egy cı́mkét definiáltunk volna. A NASM assemblernek van egy kapcsolója (-w+orphan-labels) melynek megadása esetén az assembler szólni fog ha egy sorba, kettőspont nélkül, ı́runk le egy cı́met. A cı́mkékben használható érvényes karakterek a betűk és számok, ‘ ’, ‘$’, ‘#’, ‘@’, ‘˜’, ‘.’ és ‘?’. A

cı́mke első karaktere betű, ‘ ’, ‘?’ vagy pont () lehet Ha egy cı́mke ponttal kezdődik, annek sepciális jelentése van. A NASM assembler képes lefordı́tani a 8086, 386, 486, Pentium, P6, FPU és MMX utası́táskészleteket. Az utası́tások előtt szerepelhet egy prefix: REP, REPE/REPZ, REPNE/REPNZ, LOCK. A szegmens regiszter is megadható prefixként: es mov [bx], ax ami egyenértékű azzal, hogy mov [es:bx], ax Az utóbbi jelölés preferált, mivel más szintaktikai elemekkel ez konzisztens. Ha nem adtunk meg prefixet, például nem adtunk meg szegmens regisztert, akkor a NASM automatikusan generálni fogja. 4.2 Pszeudo utası́tások A pszeudo utası́tások nem igazi processzor utası́tások, de egy forrás sorban az ‘utası́tás’ részben szerepelhet. 37 4.21 DB és társai A DB, DW, DD, DQ, DT adatokat ad meg a forráskódban. A fő különbség, hogy milyen méretű adatot/adatokat definiálnak DB : egy

byte-ot vagy byte sorozatot definiál. DW : egy word-ot vagy word sorozatot definiál. Egy word két byte-ból áll Itt azt is figyelembe kell venni, hogy az Intel processzor ‘Little endian’ tárolási módot használ, vagyis a tárolás során a byte-okat felcseréli. DD : egy vagy több double word-ot definiál. Egy double word 4 byte-ból áll Ez az adatméret használható egyszeres precizitású floating-point számok (float) megadására is a matematikai koprocesszor számára. DQ : egy vagy több quad word-ot definiál. Egy quad word 8 byte-ból áll Ez az adatméret használható dupla precizitású floating-point számok (double) megadására is a matematikai koprocesszor számára. DT : egy vagy több ten byte-ot definiál. Egy ten byte adat 10 byte-ból áll Az alábbi lista több példát is mutat az adatok definiálására: db db db db dw dw dw dw dd dd dq 0x55 0x55,0x56,0x57 ’a’,0x55 ’hello’,13,10,’$’

0x1234 ’a’ ’ab’ ’abc’ 0x12345678 1.234567e20 1.234567e20 ; ; ; ; ; ; ; ; ; ; ; egy byte 0x55 3 bytes egymás után egy karakter és egy byte keverve karakter sorozat és számok keverve 0x34 0x12 0x41 0x00 0x41 0x42 0x41 0x42 0x43 0x00 0x78 0x56 0x34 0x12 floating-point konstans double-precision konstans A fenti példában érdemes megfigyelni a 6. és 8 sort A 6 sorban úgy tűnik, hogy csak egy karaktert definiálunk, de mivel a sor elején a DW pszeudo utası́tás szerepel, ami ‘word’ adatméretet, vagyis két byte-ot jelent. Ennek megfelelően a lefordı́tás után valójában két byte-ot foglal le az assembler, amelyből az egyik zérus lesz. A fenti példákból az is látható, hogy a karakterek (ASCII kódok) és számok szabadon keverhetők. A karaktersorozatok többféleképpen is megadhatók, egyszeres vagy dupla aposztrofok között, illetve egyben vagy karakterenként: db ’hello’ db

’h’,’e’,’l’,’l’,’o’ db "hello" 4.22 RESB és társai A RESB, RESW, RESD, RESQ és REST pszeudo utası́tások inicializálás nélküli adatoknak foglal helyet. Az ‘inicializálás nélküli adat’ azt jelenti, hogy csak az adat tárolására szükséges helyet foglalja le az assembler, de a helyen tárolandó adat bármi lehet kezdetben. (Lehet zérus vagy a memória egy részlete, bármi.) Ezek a pszeudo utası́tások több adatnak foglalnak helyet, például: buffer: resb 64 wordvar: resw 1 db "hello" ; 64 byte-nyi helyet foglal ; 1 word-nyi helyet foglal 38 4.23 Konstansok Ugyanúgy mint a legtöbb programozási nyelvben, például a C programozási nyelvben, assembly-ben is lehet konstansokat definiálni a forráskódban. A konstansokat egy helyen definiáljuk és a programban mindenhol csak egy névvel, szimbolikusan hivatkozunk rájuk. Ezeknek a konstansoknak kettős lehet szerepe: •

ha későbbi fejlesztések során a konstans értékét meg kellene változtatni, akkor csak a definı́ció helyén kell megváltoztatni az értéket, hiszen a programban csak a szimbólikus név szerepel és • ha a konstans neve ‘olvasmányos’, vagyis jelentéssel bı́r, akkor a program olvasása során könnyebb értelmezni a forráskódot. Például nem csak egy szám szerepel az adott helyen, argumentumban, hanem a szám funkcióját leı́ró név. A C programozási nyelvben a konstansok definı́ciója makrókkal lehetséges: #define PI 3.1415 A NASM assemblerben az ennek megfelelő konstans definı́ció: hossz EQU 12 4.24 TIMES pszeudo utası́tás Ha a TIMES pszeudo prefixet használjuk, akkor arra utası́tjuk a NASM Assemblert, hogy az adott utası́tást vagy adatot többször fordı́tsa bele az eredmény programba. Például: zerobuffer: TIMES 64 db 0 Ennek a sornak a hatására 64 darab zérus byte kerül az

eredmény programba. Ezt a sort érdemes összevetni az alábbi sorral, ami csak a helyet lefoglalja le, de a helyen tárolt adatról nem mond semmit. (Lásd: 4.22 fejezetet) zerobuffer: resb 64 A TIMES pszeudo utası́tás egyéb, összetett módon is használható, illetve egyszerűen utası́tásoknál is. Például az alábbi sor azt adja meg, hogy a MOVSB (761 fejezet) utası́tást háromszor kell a programba belefordı́tani: TIMES 3 movsb 4.3 SEG kulcsszó Ha egy olyan programot ı́runk amelyik több szegmensből áll, akkor egy memória hely (például változó) elérésénél szükség lehet a memória hely preferált szegmens cı́mére is.1 A preferált itt annyit jelent, hogy az assembler preferálja ezt a cı́met. Ilyen esetben lehet használni a seg kulcsszót Például: mov ax, SEG valami mov es, ax mov bx, valami aminek hatására a ES:BX regiszterek a valami változó memória cı́mét fogja tartalmazni. 1A

szegmens és offszet regisztereket használó memória cı́mzésről részletesebb leı́rás található a 3.2 fejezetben 39 4.31 További hasznosı́tási területek A seg kulcsszó használható távoli függvény hı́vásnál is, amikor a függvénynek a szegmense és offszet cı́me is kell. Például: call (SEG nyomtat):nyomtat Ha egy memória hely teljes cı́mét, szegmens és offszetet, is tárolni kell akkor a következő módon lehet ezt megadni: db valami, SEG valami Itt se felejtsük el, hogy a fordı́tott sorrend a ‘Little endian’ tárolási mód miatt van. 4.4 WRT kulcsszó Előfordulhat, hogy nem a preferált szegmensen keresztül akarunk hivatkozni egy memória helyre. (Ezt megtehetjük, hiszen a szegmensek átfedik egymást a 8086-os gépeken.) Ilyen esetben a wrt (With Reference To) kulcsszót lehet haználni. Például: mov ax, egy masik szegmens mov es, ax mov bx, valami wrt egy masik szegmens 4.5

Parancssori opciók 4.6 Hibaüzenetek 40 5. Fejezet DEBUG program Ez a fejezet a DEBUG program használatát mutatja be. A DEBUG program segı́tségével már lefordı́tott programokat tudunk “debuggolni”, lépésenként végrehajtani és közben a rendszer állapotát megvizsgálni, illetve hibákat (bug-okat) keresni. Bár a program igen egyszerű, azt is mondhatnánk “fapados”, azért is érdemes megismerni ezt a programot, mivel minden Microsoft Windows rendszeren létezik. 5.1 Jelölések cı́m - cı́mleı́rás • segmens:offset - pl. 0044:0f57 • segmens reg:offset - pl. ES:0f30 • offset - pl. 400 tartomány - egy memóriatartomány kijelölése • cı́m cı́m • cı́m, cı́m • cı́m L hossz lista - egymás után leı́rt hexadecimális számok szöveg - dupla aposztrofok között karaktersorozat 5.2 A DEBUG indı́tása • D:DEBUG <ENTER> : A program elindul és egy minusz jel jelzi, hogy a program

várja a felhasználó parancsait • D:DEBUG file<ENTER> : Betölti a file programot és belép a DEBUG programba 5.3 A DEBUG parancsai q - (Quit) kilépés a programból h val1 val2 - (Hex) kiı́rja a két érték összegét és különbségét 41 -h 9 000A -h 1 000A 1 0008 9 FFF8 d tartomány - (Dump) memória tartalmának kiı́rása a képernyőre -d c000:0010 C000:0010 24 C000:0020 4D C000:0030 52 C000:0040 2F C000:0050 29 C000:0060 50 C000:0070 40 C000:0080 E8 - 12 20 4F 56 00 43 00 26 FF 43 58 42 87 49 12 56 FF 4F 2F 45 DB 52 10 8B 00 4D 4D 20 87 2B 00 D8 00 50 47 42 DB 10 80 E8 00 41 41 49 87 01 00 C6 00-60 54-49 2D-47 4F-53 DB-87 10-00 00-38 56-74 00 42 31 20 DB 00 37 22 00 4C 30 28 87 18 34 8C 00 45 30 56 DB 00 2D C8 00 20 20 31 87 00 32 3D 20 4D 56 2E DB 00 00 00 49 41 47 32 87 00 FF C0 42 54 41 20 DB 03 FF 74 $.‘ IB M COMPATIBLE MAT ROX/MGA-G100 VGA /VBE BIOS (V1.2 ). PCIR+. @.874-2 .&VVt"=t -d 100 130

xxxx:0100 EB 24 0D 0A 54 68 69 73-20 69 73 20 6D 79 20 66 xxxx:0110 69 72 73 74 20 44 45 42-55 47 20 70 72 6F 67 72 xxxx:0120 61 6D 21 0D 0A 24 B4 09-BA 02 01 CD 21 B4 00 CD xxxx:0130 21 - .$This is my f irst DEBUG progr am!.$! ! s tartomány szöveg - (Search) memória tartományban megkeresi a szöveg valamennyi előfordulását -s fe00:0 ffff "BIOS" FE00:0021 FE00:006F -d fe00:0 FE00:0000 FE00:0010 FE00:0020 FE00:0030 FE00:0040 FE00:0050 FE00:0060 FE00:0070 41 4D 20 41 6E 41 1B 49 77 20 42 77 63 77 41 4F 61 43 49 61 2E 03 77 53 72 4F 4F 72 6F 0C 61 20 64 4D 53 64 66 04 72 76 20 50 20 20 74 01 64 34 53 41 43 53 77 01 20 2E 6F-66 54-49 4F-50 6F-66 61-72 6F-66 4D-6F 35-31 74 42 59 74 65 74 64 50 77 4C 52 77 20 77 75 47 61 45 49 61 49 E9 6C 00 72 20 47 72 6E 12 61 DB 65 34 48 65 63 14 72 32 49 38 54 20 2E 20 20 EC 42 36 20 49 20 43 42 33 Award SoftwareIB M COMPATIBLE 486 BIOS COPYRIGHT Award Software I nc.oftware Inc Aw.oftw C .Award Modular B IOS

v4.51PG23 c tartomány cı́m - (Compare) összehasonlı́t két memória tartományt f tartomány szöveg - (Fill) memória tartomány feltöltése a szöveggel -f 100 12f -d 100 12f xxxx:0100 xxxx:0110 xxxx:0120 ’BUFFER’ 42 55 46 46 45 52 42 55-46 46 45 52 42 55 46 46 BUFFERBUFFERBUFF 45 52 42 55 46 46 45 52-42 55 46 46 45 52 42 55 ERBUFFERBUFFERBU 46 46 45 52 42 55 46 46-45 52 42 55 46 46 45 52 FFERBUFFERBUFFER e cı́m lista - (Enter) értékek bevitele a memóriába. Ezzel a paranccsal byte sorozatot lehet beı́rni a memóriába.1 -e 100 B4 09 BA 0B 01 CD 21 B4 00 CD 21 g [cı́m] - (Go) programvégrehajtás folytatása. Ha a cı́m is adva van akkor a megadott cı́mre egy töréspontot tesz a debugger és az IP regiszter által megadott cı́mtől folytatja a végrehajtást. A töréspont azt jelenti, hogy ha a végrehajtás során a töréspont cı́mét elérjük, akkor a végrehajtás 1 Mivel a gépi kód is csak egy byte

sorozat, ezért amit ı́gy beı́runk a memóriába az lehet egyszerűen adat, de lehet program is! 42 leáll (megtörik) és egy parancssor jelenik meg aminek segı́tségével szétnézhetünk a rendszerben. Megvizsgálhatjuk a regiszterek állapotát vagy a memória tartalmát. Persze az is előfordulhat, hogy a végrehajtás során soha nem jutunk el a töréspontig. Ebben az esetben a “program” végigfut és végül vagy hibával vagy sikeresen leáll a futás. a [cı́m] - (Assemble) az opcionálisan megadott cı́mtől kezdve assembly parancsokat gépelhetünk be. Ebben az esetben a DEBUG program, mint egy assembler működik. -a 100 xxxx:0100 xxxx:0102 xxxx:0123 xxxx:0126 xxxx:0128 xxxx:012B xxxx:012D xxxx:012F jmp 126 ; adat átugrása db 0d,0a,"This is my first DEBUG program!" db 0d,0a,"$" mov ah,9 ; 09-es funkcionalitás mov dx,102 ; DS:DX -en a $-al lezárt string int 21 ; string kiı́rása int 20 ;

kilépés u [tartomány] vagy u [cı́m] - (Unassemble) az aktuális vagy a megadott cı́mtől az opcionálisan megadott tartományban assembly mnemonikra fordı́tja a gépi kódot. -u 126 12F xxxx:0126 B409 xxxx:0128 BA0201 xxxx:012B CD21 xxxx:012D B400 xxxx:012F CD21 - MOV MOV INT MOV INT AH,09 DX,0102 21 AH,00 21 i port - (Input) a megadott port-ról beolvas egy byte-ot o port byte - (Output) a megadott port-ra kiı́r egy byte-ot Portra való kiı́rás, vagy portból való beolvasás közvetlen kommunikációt jelent a hardware-rel. -o -i 18 -o -i 55 70 04 71 70 02 71 ; ; ; ; ; ; Kérdezzük le az órát Olvassuk vissza az értéket 18 óra Kérdezzük le a percet Olvassuk vissza az értéket 55 perc n filenév - (Name) a file nevének megadása. Erre a parancsra akkor van szükség, ha a memória egy darabját mint programot szeretnénk kiı́rni. p - egy függvény hı́vás vagy megszakı́tás végrehajtása egészben.

Ebben az esetben a függvény utası́tásait nem lépésről-lépésre hajtjuk végre, hanem egyben. r [reg] - (Register) alapesetben a regiszterek tartalmát ı́rja ki a képernyőre. A státusz bitek szövegesen jelennek meg, melyek értelmezését a 5.1 táblázatban jelennek meg Ha a regiszter is meg van adva, akkor lehetővé teszi a megadott regiszter értékének megadását. -r cx CX 0100 :273 t - (Trace) egy utası́tás végrehajtása w - (Write) a BX és CX regiszterekben együttesen megadott byte-nyi adatot ı́r ki az ‘n’ paranccsal megnevezett file-ba. Ha a file már létezett akkor a DEBUG felülı́rja! 43 Státusz bit Carry Parity Aux. carry Zero Sign Trap Direction Interrupt Overflow 1 CY PO AU ZR PL 0 NC NE NA NZ NG UP EI OV DW DI NV 5.1 tábla: A státusz bitek szöveges megjelenése 5.4 Példák Nézzünk néhány példát a DEBUG program használatára. A példákban a szegmens cı́met négy

darab ‘x’ jelöli (xxxx), mivel a memóriában bárhova betöltődhetnek a programok. A példákban a DEBUG programot kell elindı́tani a megadott módon, illetve a minusz (‘-’) jel utáni részt kell begépelni. 5.41 1 Példa Írjunk egy programot mely egy csillag karaktert nyomtat ki. A programot assembly mnemonikok segı́tségével adjuk meg. Utána a programot lefuttatjuk a DEBUG programban, majd kiı́rjuk a merev lemezre, az aktuális könyvtárba. C:> DEBUG -a 100 xxxx:100 mov ah,02 xxxx:102 mov dl,2a xxxx:104 int 21 xxxx:106 int 20 xxxx:108 ; csak ENTERT nyomjunk -r AX=0000 BX=0000 CX=0000 DX=0000 SP=FFEE BP=0000 SI=0000 DI=0000 DS=xxxx ES=xxxx SS=xxxx CS=xxxx IP=0100 NV UP EI PL NZ NA PO NC xxxx:0100 MOV AH,02 -g * Program terminated normally -r cx :8 -n csillag.com -w -q C:>csillag.com * C:> 5.42 2 Példa Használjuk a DEBUG programot arra, hogy megnézzük az előző program futását lépésről-lépésre. Az

“egyszerű” utası́tásoknál a ‘t parancsot, a megszakı́tások végrehajtásánál a ‘p’ parancsot használjuk. A megszakı́tásoknál azért kell a ’p‘ parancsot használni, hogy a megszakı́tás során végrehajtandó utası́tásokat ne lépésenként, hanem egyszerre hajtsuk végre. C:> DEBUG csillag.com 44 -r AX=0000 BX=0000 DS=xxxx ES=xxxx xxxx:0100 B402 -u xxxx:0100 B402 xxxx:0102 B22A xxxx:0104 CD21 xxxx:0106 CD20 xxxx:0108 0000 xxxx:010A 0000 xxxx:010C 0000 xxxx:010E 0000 xxxx:0110 0000 xxxx:0112 0000 xxxx:0114 0000 xxxx:0116 0000 xxxx:0118 0000 xxxx:011A 0000 xxxx:011C 0000 xxxx:011E 0000 -t AX=0200 BX=0000 DS=xxxx ES=xxxx xxxx:0102 B402 -t AX=0200 BX=0000 DS=xxxx ES=xxxx xxxx:0104 CD21 -p * AX=022A BX=0000 DS=xxxx ES=xxxx xxxx:0106 CD20 -p CX=0008 DX=0000 SP=FFFE SS=xxxx CS=xxxx IP=0100 MOV AH,02 MOV MOV INT INT ADD ADD ADD ADD ADD ADD ADD ADD ADD ADD ADD ADD BP=0000 SI=0000 DI=0000 NV UP EI PL NZ NA PO NC AH,02 DL,2A 21

20 [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL CX=0008 DX=0000 SP=FFFE SS=xxxx CS=xxxx IP=0100 MOV DL,2A BP=0000 SI=0000 DI=0000 NV UP EI PL NZ NA PO NC CX=0008 DX=002A SS=xxxx CS=xxxx INT 21 SP=FFFE IP=0100 BP=0000 SI=0000 DI=0000 NV UP EI PL NZ NA PO NC CX=0008 DX=002A SS=xxxx CS=xxxx INT 20 SP=FFFE IP=0100 BP=0000 SI=0000 DI=0000 NV UP EI PL NZ NA PO NC Program terminated normally -q C:> 5.43 3 Példa Írjuk meg az első példában szereplő programot gépi kódban. Ebben az esetben a programot mint byte sorozatot visszük be. C:> DEBUG -e 100 b4 02 b2 2a cd 21 cd 20 -u xxxx:0100 B402 MOV AH,02 xxxx:0102 B22A MOV DL,2A xxxx:0104 CD21 INT 21 xxxx:0106 CD20 INT 20 xxxx:0108 0000 ADD [BX+SI],AL xxxx:010A 0000 ADD [BX+SI],AL xxxx:010C 0000 ADD [BX+SI],AL xxxx:010E 0000 ADD [BX+SI],AL xxxx:0110 0000 ADD [BX+SI],AL xxxx:0112 0000 ADD [BX+SI],AL xxxx:0114 0000 ADD [BX+SI],AL

xxxx:0116 0000 ADD [BX+SI],AL xxxx:0118 0000 ADD [BX+SI],AL xxxx:011A 0000 ADD [BX+SI],AL xxxx:011C 0000 ADD [BX+SI],AL xxxx:011E 0000 ADD [BX+SI],AL -q 45 C:> 46 6. Fejezet Első programok Ez a fejezet néhány egyszerű programot mutat be részletes magyarázattal. A magyarázat néha nagyon részletes és több különböző variációt mutat be, hogy a teljesen kezdők is megszerezzék a szükséges alapokat bonyolultabb programok megı́rásához. 6.1 Első program Nézzük meg az első assembly programot NASM assemblerre ı́rva. A program az 61 táblán látható Ez a program az egyik legkisebb program amit ı́rni lehet Microsoft Window alatt.1 1 2 org 100h INT 20h 6.1 tábla: Első program Az 1. sor nem assembly utası́tás, hanem azt jelöli, hogy a program a 100-as hexadecimális cı́men kezdődik. A hexidecimális számot a szám után ı́rt kis ‘h’ betű jelenti Ha a ‘h’ betű nem szerepel 100-as szám

után, akkor a program a 100-as decimális cı́men kezdődik, ami 64 hexadecimális számnak felelne meg és ez komoly hiba! A magyarázat arra, hogy miért a 100-as hexadecimális cı́men kell kezdődjön a program a 8.4 fejezetben található A 2. sor egy szoftveres megszakı́tást hı́v meg Az INT az utası́tás mı́g a “20h” a megszakı́tás számát jelenti. Ez a szám is hexadecimálisan van megadva Természetesen, ha akarjuk, decimálisan is megadható a megszakı́tás száma. Ez a példa a 62 táblán látható Az “INT 20h” megszakı́tás arra való, hogy egy COM programból kilépjünk. A kilépés azt jelenti, hogy visszatérünk az operációs rendszerhez. 1 2 org 100h INT 32 6.2 tábla: Első program egy változata Ha a programot az elso.asm file-ba mentettük, akkor a lefordı́tása a NASM segı́tségével a következő sor begépelésével lehetséges: 1 Lehet kisebb programot is ı́rni, de ennek

most nincs jelentősége. 47 C:> nasm -o elso.com elsoasm A NASM alap esetben “COM” programokat fordı́t, ı́gy a tı́pust nem kell megadni. A -o opcióval azt adjuk meg, hogy a fordı́tás eredményét milyen file-ba ı́rjuk. Az utolsó paraméter adja meg, hogy melyik assembly forrás file-t kell lefordı́tani. A NASM program paramétereinek részletes listáját a 4 fejezet tartalmazza. A fordı́tás eredménye egy bináris file lesz, mely csak két byte-ot (!) fog tartalmazni. A file tartalma hexadecimális formában: CD 20 Ez a példa azt mutatja, hogy az INT utası́tás gépi kódja a CD hexadecimális érték. Az is látható, hogy az “org 100h” sorból nem generálódik bináris kód, hiszen ez a sor csak azt jelöli, hogy a program milyen cı́men kezdődjön a memóriában. Mivel minden COM program a 100h cı́men kezdődik a memóriában, ezért semmilyen extra utası́tásra nincs szükség a bináris

programban. Mit jelent az, hogy a program a 100 hexadecimális cı́men kezdődik? Nézzük meg a programot a DEBUG program segı́tségével. (A DEBUG program használatát a 5 fejezetben tárgyaltuk) C:> DEBUG elso.com -r AX=0000 BX=0000 CX=0002 DX=0000 DS=1481 ES=1481 SS=1481 CS=1481 1481:0100 CD20 INT 20 -q SP=FFFE IP=0100 BP=0000 SI=0000 DI=0000 NV UP EI PL NZ NA PO NC A példában az látható, hogy a programot az 1481 szegmensre tölti be az operációs rendszer. A szegmens cı́m lehet más is! Ami ennél fontosabb, hogy az offszet cı́m éppen a 100 hexadecimális cı́m! 6.2 Egy karakter kinyomtatása A következő program egy csillag karaktert nyomtat ki. A program listája az 63 táblán látható 1 2 3 4 5 org 100h MOV AH, 2 MOV DL, 2ah INT 21h INT 20h 6.3 tábla: Egy karakter kinyomtatására szolgáló program A program nagyon egyszerű, mivel az 2. és 3 sor az INT 21h szoftveres megszakı́tás paramétereit állı́tja

be. Ebben az esetben az AH regiszter határozza meg a megszakı́tás által végrehajtandó műveletet és a DL regiszter adja a kinyomtatandó karakter ASCII kódját. A MOV utası́tás a jobb oldali argumentum értékét átmásolja a bal oldali argumentumba. A 2 sorban azt adjuk meg, hogy az AH regiszter értéke a 2-es szám legyen. Ez lényegében megfelel az értékadás műveletnek más programozási nyelvben. A 3 sorban a DL regiszternek a 2A hexadecimális számot adjuk meg. A 2A hexadecimális szám a csillag (‘*’) karakternek felel meg. (Lásd az A függelék) A 4.21 bekezdésben azt láttuk, hogy egy byte adatot számmal és karakterrel is megadhatunk Ráadásul a karaktert egyszeres (’) vagy kétszeres (”) aposztrofok között is megadhatjuk. A 64 táblán látható programban a nyomtatandó karakter nem számmal, hanem ténylegesen karakterként van megadva. Ezt az utóbbi ı́rásmódot érdemes

használni, mert ebben az esetben egyértelmű, ASCII táblázat használata nélkül, hogy melyik karaktert akarjuk kinyomtatni. 48 1 2 3 4 5 org 100h MOV AH, 2 MOV DL, ’*’ INT 21h INT 20h 6.4 tábla: Alternatı́va a második programra 6.3 Egy szöveg kinyomtatása A harmadik program egy szöveget nyomtat ki a képernyőre. A program listája az 65 táblán látható 1 2 3 4 5 6 org 100h MOV AH, 9 MOV DX, adat INT 21h INT 20h adat: db ’HELLO$’ 6.5 tábla: Egy szöveg kinyomtatására szolgáló program Ebben a programban is az INT 21h szoftveres megszakı́tást kell használni. Az AH regiszter most is megszakı́tás által végrehajtandó műveletet határozza meg. Mivel most egy egész sor karaktert kell kinyomtatni a DL regiszter nem elegendő, de a DX regiszter is csak két byte-nyi karaktert tud tárolni. Ebben az esetben a DX regiszter a karaktersorozat cı́mét tartalmazza. Az assembly programban szerencsére nem kell

pontosan megadni a cı́met Miért szerencse? Mert ahhoz, hogy pontosan megadjuk az adat cı́mét minden assembly utası́tás esetén tudnunk kellene, hogy hány byte-os gépi kód generálódik belőle és ezek segı́tségével kellene kiszámolnunk az aktuális cı́met. A programban szimbólikusan lehet megadni a karaktersorozat cı́mét. Maga a karaktersorozat a program végére került A karaktersorozat a 4.21 bekezdésnek megfelelően van definiálva: egy cı́m, utána egy kettőspont, a db kulcsszó és egyszeres aposztrofok között maguk a karakterek Az utolsó karakternek a dollár jelnek (‘$’) kell lennie Ez a dollár jel zárja le a szöveget.2 Ennek a speciális karakternek a segı́tségével állapı́tja meg a rendszert, hogy meddig kell a byte-okat kinyomtatni.3 Ha a dollár jelet nem adnánk meg, akkor a rendszer addig nyomtatná a karaktereket amı́g el nem ér egy dollár jelet. Elvileg előfordulhat, ha nincs

dollár jel a memóriában, hogy az egész memóriát kinyomtatja a program és soha nem áll le. Ezt a programot is érdemes megnézni a DEBUG programban, hogy több dolgot is megnézzünk: C:> DEBUG hello.com -u xxxx:0100 B409 xxxx:0102 BA0901 xxxx:0105 CD21 xxxx:0107 CD20 xxxx:0109 48 xxxx:010A 45 xxxx:010B 4C xxxx:010C 4C xxxx:010D 4D MOV MOV INT INT DEC INC DEC DEC DEC AH,02 DX,109 21 20 AX BP SP SP DI 2 Korábbi tanulmányokból ismert lehet, hogy a C programozási nyelvben zéró áll a szöveg végén. másik stratégia, hogy megadjuk a karaktereket és a karakterek számát. Ezt módszert a Pascal programozási nyelv használja. 3A 49 xxxx:010E xxxx:0110 xxxx:0112 xxxx:0114 xxxx:0116 xxxx:0118 xxxx:011A xxxx:011C xxxx:011E -d 100 xxxx:0010 xxxx:0020 xxxx:0030 xxxx:0040 xxxx:0050 xxxx:0060 xxxx:0070 xxxx:0080 -q 2400 0000 0000 0000 0000 0000 0000 0000 0000 B4 00 00 00 00 00 00 00 09 00 00 00 00 00 00 00 AND ADD ADD ADD ADD ADD ADD

ADD ADD BA 00 00 00 00 00 00 00 09 00 00 00 00 00 00 00 01 00 00 00 00 00 00 00 CD 00 00 00 00 00 00 00 AL,00 [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL 21 00 00 00 00 00 00 00 CD-20 00-00 00-00 00-00 00-00 00-00 00-00 00-00 48 00 00 00 00 00 00 00 45 00 00 00 00 00 00 00 4C 00 00 00 00 00 00 00 4C 00 00 00 00 00 00 00 4D 00 00 00 00 00 00 00 24 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 .! HELLO$ . . . . . . . A következő észrevételeket tehetjük: • Az assembler a fordı́tás során kiszámolta a karaktersorozat cı́mét, ami jelenleg a 109h cı́mtől indul. • A cı́m két byte-ból áll és ezt a rendszer “little-endian” módon tárolja: BA 09 01. • A DEBUG program teljesen azonos módon kezeli az adatot és a programot is. Igazából nincs is különbség, hiszen mind a kettő egy byte sorozat. Például látható, hogy az “unassemble” parancs során a karaktersorozatot is

utası́tásként értelmezi a DEBUG program. Ezért van az, hogy az adatokat és a programot nem szabad keverni. Erre a hibára egy példát mutat az 66 tábla Ha ezt a programot megnézzük a DEBUG programban, akkor azt fogjuk tapasztalni, hogy az adatot is mint utası́tásokat fogja értelmezni a DEBUG és ráadásul értelmetlen kódot kapunk. A példa azt mutatja, hogy az adatokat és a programot nem szabad összekeverni! 1 2 3 4 5 6 org 100h adat: db ’HELLO$’ MOV AH, 9 MOV DX, adat INT 21h INT 20h 6.6 tábla: Hibás program C:> DEBUG hello.com -u xxxx:0100 48 xxxx:0101 45 xxxx:0102 4C xxxx:0103 4C xxxx:0104 4D xxxx:0105 24B4 xxxx:0107 09BA0001 xxxx:010B CD21 xxxx:010D CD20 xxxx:010F 0000 xxxx:0111 0000 xxxx:0113 0000 DEC INC DEC DEC DEC AND OR INT INT ADD ADD ADD AX BP SP SP DI AL,B4 [BP+SI+0100],DI 21 20 [BX+SI],AL [BX+SI],AL [BX+SI],AL 50 xxxx:0115 xxxx:0117 xxxx:0119 xxxx:011B xxxx:011D xxxx:011F -q 0000 0000 0000 0000 0000 0000 ADD

ADD ADD ADD ADD ADD [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL [BX+SI],AL 6.4 Egy karakter beolvasása A 6.7 táblázat egy nagyon egyszerű programot mutat, ami beolvas egy karaktert a felhasználótól és újra kinyomtatja. A karakter beolvasásra is használható az operációs rendszer megszakı́tása és ekkor a funkció kódnak 1-nek kell lennie. A funkicó kódot a 2 sorban állı́tjuk be A 3 sorban az INT 21h megszakı́tás lefutása után a beolvasott karakter ASCII kódja az AL regiszterben lesz. Ezt akarjuk újra kinyomtatni, ezért másoljuk át a DL regiszterbe a 4. sorban, majd az 5 sorban az új funkció kódot is beállı́tjuk Végül az INT 21h megszakı́tás meghı́vásával végezzük a nyomtatást a 6. sorban 1 2 3 4 5 6 7 org 100h MOV AH, 1 INT 21h MOV DL, AL MOV AH, 2 INT 21h INT 20h 6.7 tábla: Egy karakter beolvasása és kinyomtatása 51 52 7. Fejezet Assembly nyelv utası́tásai

Ebben a fejezetben az assembly utası́tások közül a legfontosabbakat tekintjük át. A fontossági sorrendet úgy próbáltam megállapı́tani, hogy amelyeket a leggyakrabban használjuk a programokban, vagy amelyekre leginkább szükség lehet a tanulás során. Azt is meg kell jegyezni, hogy a fejezetben csak a 8086 processzor utası́táskészletéből kerültek kiválasztásra az itt felsorolt utası́tások. Ennek az a magyarázata, hogy véleményem szerint ezek az utası́tások elegendőek a fontosabb koncepciók bemutatására. A fejezet végén a be nem mutatott parancsokat azért felsoroljuk Szintakszis: • mem: memória cı́m • reg: regiszter • op: memória cı́m vagy regiszter 53 7.1 Adatmozgató utası́tások 7.11 MOV Szintakszis MOV op1, op2 Az op2 tartalmát az op1-be ı́rja, felülı́rva annak korábbi értékét. Az utası́tás operandusai a következők lehetnek: MOV MOV MOV MOV MOV regiszter,

számadat regiszter, regiszter regiszter, memória memória, számadat memória, regiszter Mint látható, az nem fordulhat elő, hogy egy utası́tás mindkét operandusa a memóriára hivatkozzon! Egy utası́tás csak egyszer hivatkozhat a memóriára! Szintén fontos, hogy közvetlenül nem lehet egyik szegmens regiszterbe sem ı́rni, csak áttételesen, például: MOV AX, 1234h MOV DS, AX Példák MOV MOV MOV MOV MOV MOV MOV MOV MOV MOV MOV MOV AX, 1234 AX, ES ES, AX AL, 0ffH AH, AL AL, [BX] [SI], DL AX, [BX] [DI], BP AX, [0ffffh] [0200h], DX [ES:0100h], CX 7.12 XCHG Szintakszis XCHG op1, op2 Az op1 és op2 tartalmát felcseréli. Mind a két operandusnak azonos méretűnek kell lennie, 8 vagy 16 bitesnek. Az utası́tás előnye, hogy a cserét segédváltozó nélkül hajtja végre Az operandusok cseréje általában a következőképpen történik: MOV temp, op2 MOV op2, op1 MOV op1, temp 54 Példák XCHG XCHG XCHG XCHG

AL, BL CX, DX DH, [4351h] [DS:3333h], BP 7.13 XLAT Szintakszis XLAT A BX regiszter egy maximum 256 bytes táblázatra mutat és az AL regiszterben levő értéknek megfelelő elemet veszi ki a táblázatból és tölti be az AL regiszterbe. Az utası́tás tulajdonképpen egy konverziót hajt végre. Példák MOV BX, tabla MOV AL, 0fh XLAT MOV DL, AL MOV AH, 2 INT 21h . . tabla: db ’0123456789ABCDEF’ 7.14 LDS Szintakszis LDS reg, mem A utası́tás második operandusa által megadott memóriahelyen található 4 byte-os mutatót betölti a DS szegmens regiszterbe és az első operandusként megadott regiszterbe. Ilyen módon egyetlen utası́tással lehet betölteni egy másik szegmensben levő változó cı́mét. Az utası́tás végrehajtása után azonnal cı́mezhető a memórapozı́ció. Példák LDS BX, [valtozo] MOV AX, [DS:BX] 7.15 LES Szintakszis LES reg, mem 55 A utası́tás második operandusa által megadott

memóriahelyen található 4 byte-os mutatót betölti az ES szegmens regiszterbe és az első operandusként megadott regiszterbe. Ilyen módon egyetlen utası́tással lehet betölteni egy másik szegmensben levő változó cı́mét. Az utası́tás végrehajtása után azonnal cı́mezhető a memórapozı́ció. Példák LES BX, [valtozo] MOV AX, [ES:BX] 7.16 LEA Szintakszis LEA reg, mem Az utası́tás első operandusaként megadott regiszterbe betölti a második operandus offszet cı́mét. A cı́met futás közben számolja ki, nem előre, illetve bármilyen cı́mzési mód használható. Példák LEA BX, [valtozo+BX] LEA DI, [BX+4] LEA DI, [AX+CX] 7.17 PUSH Szintakszis PUSH op A két byte-os operandust a veremre helyezi az utası́tás. Az utası́tás egyenértékű a következő két utası́tással: SUB SP, 2 MOV [SS:SP], op Az operandus lehet szegmens regiszter vagy bármilyen 16 bites regiszter, memória cı́m

vagy konstans szám adat. Az utası́tás fordı́tottja a POP utası́tás Példák PUSH PUSH PUSH PUSH AX DS [0003h] 7 ; [DS:0003] tartalma a veremre ; 0007h word a veremre 7.18 PUSHF Szintakszis PUSHF 56 A státusz regiszter teljes tartalmát a verem tetejére másolja. Az utası́tás egyenértékű a következő két utası́tással: SUB SP, 2 MOV [SS:SP], statusz-regiszter Az utası́tás fordı́tottja a POPF utası́tás, mellyel együtt jól használható olyan esetekben, amikor a státusz regiszter egy-egy vagy több bitjét akarjuk módosı́tani vagy lekérdezni. Példák PUSHF AND [SS:SP], 1 POPF ; statusz regiszter elmentése ; csak az 1-es bitet tartjuk meg, maszkoljuk ; az új értéket a statusz regiszterbe ı́rjuk Tegyük fel, hogy azt szeretnénk megállapı́tani, hogy a carry bit értéke nulla vagy egy: PUSHF POP AX AND AL, 00000001b JZ nulla volt egy volt: . Az első sor elmenti a státusz biteket a vermen, amit

ezután letöltünk az AX regiszterbe. Az AX regiszter alsó byte-jának a nulladik bitje felel meg a carry bitnek ı́gy a harmadik sorban ezt a bitet maszkoljuk. Ezután ugró utası́tást végzünk attól függően, hogy a maszkolás eredménye zérus vagy nem zérus volt. Persze ez a “komplikált” utası́tás sorozat egyszerűen helyettesı́thető a JC cim és az JNC cim utası́tásokkal, melyek attól függően ugranak a megadott cı́mre, hogy a carry bit egy vagy éppen nulla volt. 7.19 PUSHA Szintakszis PUSHA Az utası́tás 8 regisztert tölt fel a veremre. A veremmutatót (SP) 16-al csökkenti, majd a következő sorrendben a regiszterek tartalmát felmásolja a veremre: AX, CX, DX, BX, SP, BP, SI, DI. Az SP regiszter esetén az utası́tás végrehajtása előtti értéket menti el! Az utası́tás fordı́tottja a POPA utası́tás. 7.110 POP Szintakszis POP op Az utası́tás a veremmutató (SP) regiszter által

mutatott word értéket az op operandusba ı́rja bele. Az utası́tás egyenértékű a következő két utası́tással: MOV op, [SS:SP] ADD SP, 2 57 Az operandus lehet szegmens regiszter, bármilyen 16 bites regiszter vagy memória cı́m. Fontos, hogy az operandus nem lehet a CS regiszter. Ez azért van, mert ha ilyen módon engednénk felülı́rni a CS regisztert akkor ezzel áttételesen szegmensek közötti ugró utası́tást engednénk meg, hiszen a következő utası́tásra a CS:IP regiszter páros mutat. Példák POP POP POP POP AX DS [0003h] [ES:0003h] 7.111 POPF Szintakszis POPF A státusz regiszter teljes tartalmát felülı́rja a verem tetején tárolt 16 bites értékkel. Az utası́tás egyenértékű a következő két utası́tással: MOV statusz-regiszter, [SS:SP] ADD SP, 2 Az utası́tás a PUSHF utası́tással együtt használható jól olyan esetben, amikor a státusz regiszter egy-egy vagy több

bitjét akarjuk módosı́tani vagy lekérdezni. Példák PUSHF AND [SS:SP], 1 POPF ; statusz regiszter elmentése ; csak az 1-es bitet tartjuk meg, maszkoljuk ; az új értéket a statusz regiszterbe ı́rjuk 7.112 POPA Szintakszis POPA Az utası́tás 8 regisztert állı́t helyre a vermen eltárolt értékekből. Az utası́tás a PUSHA fordı́tottja és megfelel a következő utası́tásoknak: POP POP POP ADD POP POP POP POP DI SI BP SP, 2 BX DX CX AX 58 7.113 LAHF Szintakszis LAHF Az utası́tás betölti az AH regiszter megfelelő pozı́ciójába a SF, ZF, AF, PF és CF státusz biteket. A 71 tábla mutatja a bitek helyét az AH regiszterben. 7. SF 6. ZF 5. 4. AF 3. 2. PF 1. 0. CF 7.1 tábla: LAHF utası́tás után az AH regiszter tartalma Példák LAHF SHR AH, 6 AND AH, 1 ; AH értéke 1 vagy 0 a ZF bittol fuggoen 7.114 SAHF Szintakszis SAHF Az utası́tás az AH regiszter megfelelő bitjeivel felülı́rja a SF, ZF,

AF, PF és CF státusz biteket. A 71 tábla mutatja a bitek helyét az AH regiszterben. 59 7.2 Matematikai utası́tások Az ebben a fejezetben tárgyalt utası́tások esetén az is feltüntetésre kerül, hogy az utası́tás hogyan befolyásolja a státusz regiszter egyes bitjeit. A táblázatokban az ‘x’ jelzi a megváltoztatott biteket, mı́g a ‘?’ jel azt jelenti, hogy a bit meghatározatlan, vagyis lehet 1 és 0 is. 7.21 INC Szintakszis INC op Az utası́tás az operandus értékéhez 1-et ad hozzá a CF státusz bit megváltoztatása nélkül. Érintett státusz bitek OF DF IF x TF SF ZF x x AF x PF x CF Példák INC INC INC INC AX BL [100h] [ES:220h] 7.22 DEC Szintakszis DEC op Az utası́tás az operandus értékéből 1-et von le a CF státusz bit megváltoztatása nélkül. Érintett státusz bitek OF DF IF x TF SF ZF x x Példák DEC DEC DEC DEC AX BL [100h] [ES:220h] 7.23 ADD Szintakszis ADD op1, op2

60 AF x PF x CF Az utası́tás az op1 operandushoz adja az op2 operandus értékét és az eredményt az op1-be ı́rja. Az operandusok méretének meg kell egyeznie, két 8 bites vagy két 16 bites értéket lehet csak összeadni. Érintett státusz bitek OF DF IF x TF SF ZF x x AF x PF x CF x Példák ADD ADD ADD ADD ADD AX, BX [adat], CX CX, [valtozo] BL, 4 SI, [BP+8] 7.24 ADC Szintakszis ADC op1, op2 Az utası́tás az op1 operandushoz adja az op2 operandus értékét és a Carry flag (CF) értékét is, majd az eredményt az op1-be ı́rja. Az operandusok méretének meg kell egyeznie, két 8 bites vagy két 16 bites értéket lehet csak összeadni. Érintett státusz bitek OF DF IF x TF SF ZF x x AF x Példák ADC AX, BX ADC [adat], CX ADC CX, [valtozo] ADC BL, 4 ADC SI, [BP+8] . ; összeadás átvitellel MOV CX, 0 MOV AL, 80h MOV AH, 80h MOV CL, AL ADD CL, AH ADC CH, 0 ; eredmény: CX tartalma 100h lesz 7.25 SUB

Szintakszis SUB op1, op2 61 PF x CF x Az utası́tás az op1 operandusból kivonja az op2 operandus értékét és az eredményt az op1-be ı́rja. Az operandusok méretének meg kell egyeznie, két 8 bites vagy két 16 bites értéket lehet csak összeadni. Érintett státusz bitek OF DF IF x TF SF ZF x x AF x PF x CF x Példák SUB SUB SUB SUB SUB AX, BX [adat], CX CX, [valtozo] BL, 4 SI, [BP+8] 7.26 SBB Szintakszis SBB op1, op2 Az utası́tás az op1 operandusból kivonja az op2 operandus értékét és a Carry flag (CF) értékét is, majd az eredményt az op1-be ı́rja. Az operandusok méretének meg kell egyeznie, két 8 bites vagy két 16 bites értéket lehet csak összeadni. Érintett státusz bitek OF DF IF x TF SF ZF x x AF x PF x CF x Példák SBB SBB SBB SBB SBB AX, BX [adat], CX CX, [valtozo] BL, 4 SI, [BP+8] 7.27 MUL Szintakszis MUL op Ez az utası́tás 8 vagy 16 bites előjel nélküli számok

közötti szorzást hajt végre. Az operandus határozza meg, hogy 8 vagy 16 bites számokat szoroz-e össze. 8 bites szorzás esetén az AL regiszter tartalmát összeszorozza az op operandussal és az eredményt az AX regiszterben tárolja el. Ha az eredményben az AH regiszter tartalma zérus akkor a CF és OF státusz bitek értéke zérus lesz, egyébként 1. 16 bites szorzás esetén az AX regiszter tartalmát összeszorozza az op operandussal és az eredményt az DX:AX regiszterekben tárolja el. Az operandusok előjel nélküli számok és bármilyen cı́mzési mód használható Ha az eredményben az DX regiszter tartalma zérus akkor a CF és OF státusz bitek értéke zérus lesz, egyébként 1. 62 Érintett státusz bitek OF DF IF x TF SF ZF ? ? AF ? PF ? CF x Példák MOV AL, 2 MUL 4 . adat: db 4 . MOV AL, 2 MUL [adat] ; AX tartalma 8 lesz ; AX tartalma 8 lesz 7.28 IMUL Szintakszis IMUL op Ez az

utası́tás 8 vagy 16 bites előjeles szorzást hajt végre. Az operandus határozza meg, hogy 8 vagy 16 bites számokat szoroz-e össze. 8 bites szorzás esetén az AL regiszter tartalmát összeszorozza az op operandussal és az eredményt az AX regiszterben tárolja el. Ha az eredményben az AH regiszter tartalma zérus akkor a CF és OF státusz bitek értéke zérus lesz, egyébként 1. 16 bites szorzás esetén az AX regiszter tartalmát összeszorozza az op operandussal és az eredményt az DX:AX regiszterekben tárolja el. Az operandusok előjel nélküli számok és bármilyen cı́mzési mód használható Ha az eredményben az DX regiszter tartalma zérus akkor a CF és OF státusz bitek értéke zérus lesz, egyébként 1. Érintett státusz bitek OF DF IF x TF SF ZF ? ? AF ? PF ? CF x Példák MOV AL, 2 IMUL 4 . adat: db 4 . MOV AL, 2 IMUL [adat] ; AX tartalma 8 lesz ; AX tartalma 8 lesz 7.29 DIV Szintakszis DIV

op Ez az utası́tás előjel nélküli osztást hajt végre. Ha byte, 8 bites, operandust adunk meg az utası́tásban, akkor az AX regiszter tartalmát az operandussal elosztja és a hányadost az AL regiszterben, a maradékot az AH regiszterben tárolja el. Word vagy szó méretű operandus esetén a DX:AX regisztrerek tartalmát 63 elosztja az operandussal majd a hányadost a AX regiszterben és a maradékot a DX regiszterben tárolja el. Ha az osztó zérus vagy a hányados túl nagy, hogy elférjen az AL vagy AX regiszterben, akkor az INT 0 megszakı́tás hı́vódik meg. Érintett státusz bitek OF DF IF ? TF SF ZF ? ? AF ? PF ? CF ? Példák MOV AX, 12 DIV 10 ; AL = 1, AH = 2 7.210 IDIV Szintakszis IDIV op Ez az utası́tás előjeles osztást hajt végre. Ha byte, 8 bites, operandust adunk meg az utası́tásban, akkor az AX regiszter tartalmát az operandussal elosztja és a hányadost az AL regiszterben, a maradékot az

AH regiszterben tárolja el. Word vagy szó méretű operandus esetén a DX:AX regisztrerek tartalmát elosztja az operandussal majd a hányadost a AX regiszterben és a maradékot a DX regiszterben tárolja el. Ha az osztó zérus vagy a hányados túl nagy, hogy elférjen az AL vagy AX regiszterben, akkor az INT 0 megszakı́tás hı́vódik meg. Érintett státusz bitek OF DF IF ? TF SF ZF ? ? AF ? PF ? CF ? Példák MOV AX, 12 IDIV 10 ; AL = 1, AH = 2 7.211 NEG Szintakszis NEG op Az operandust nullából kivonja és hozzáad egyet, majd az eredményt eltárolja az operandusban, felülı́rva annak korábbi értékét. Az utası́tás lényegében kettes komplemensét képzi az operandusnak Ha az eredmény operandus zérus, akkor a CF bit értéke zérus lesz, egyébként pedig 1. Érintett státusz bitek OF DF IF x TF SF ZF x x 64 AF x PF x CF x Példák NEG AX NEG BL NEG [DS:100h] 7.212 CBW Szintakszis CBW Az

utası́tás az AL regiszterben található előjeles byte-ot előjeles szóvá alakı́tja az AX regiszterben. Ez úgy történik, hogy az AL regiszter legnagyobb helyiértékű bitjét bemásolja az AH regiszter minden bitjébe. Assembly-ben ez a következő utası́tásoknak felel meg: TEST AL, 128 JNZ egy zerus: MOV AH, 00h JMP vege egy: MOV AH, 0FFh vege: Az utası́tás egy 8 bites szám előkészı́tését végzi előjeles osztáshoz. 7.213 CWD Szintakszis CWD Az utası́tás az AX regiszterben található előjeles word-ot előjeles értékké alakı́tja az DX:AX regiszterekben. Az utası́tás egy 16 bites szám előkészı́tését végzi előjeles osztáshoz 65 7.3 Bitforgató és bitléptető utası́tások Az alábbi utası́tásokban az op operandus lehet 8 vagy 16 bites és tetszőleges cı́mzési módot alkalmazhatunk. Az utası́tásoknál a “kilépő” bit minden esetben megjelenik Carry bitben Az

utası́tások két csoportba sorolhatók: • Bitforgató, rotáló utası́tások: RCL, RCR, ROL, ROR • Bitléptető, shiftelő utası́tások: SAL, SAR, SHL, SHR 7.31 RCL Szintakszis RCL op, 1 RCL op, CL RCL op, szamlalo CF Az utası́tás balra forgatja az operandus értékét olyan módon, hogy a legnagyobb helyiértékű bit a Carry bitbe kerül, a Carry bit pedig a legkisebb helyiértékű bit helyébe. Minden más bit eggyel balra tolódik Az utası́tás működését a 7.1 ábra is szemlélteti Az utası́tás képes a forgatást egyszer vagy többször végrehajtani, a második operandustól függően. 7.1 ábra: Az RCL utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF AF PF CF x Ha a CF bit az operandus magas bitjével egyenlő, akkor az OF bit értéke zérus lesz, mı́g ha nem egyenlő akkor 1 lesz. Példák RCL RCL RCL RCL AL, 1 AX, 3 BX, CL [DS:2456h], CL Az utası́tás

használatára a 9.1 fejezet mutat egy példa programot 7.32 RCR Szintakszis RCR op, 1 RCR op, CL RCR op, szamlalo 66 CF Az utası́tás jobbra forgatja az operandus értékét olyan módon, hogy a Carry bit a legnagyobb helyiértékű bitbe másolódik, a legkisebb helyiértékű bit pedig a Carry bitbe kerül. Minden más bit eggyel jobbra tolódik. Az utası́tás működését a 72 ábra is szemlélteti Az utası́tás képes a forgatást egyszer vagy többször végrehajtani, a második operandustól függően. 7.2 ábra: Az RCR utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF AF PF CF x Példák RCR RCR RCR RCR AL, 1 AX, 3 BX, CL [DS:2456h], CL 7.33 ROL Szintakszis ROL op, 1 ROL op, CL ROL op, szamlalo CF Az utası́tás az első operandust balra rotálja “önmagán” és a “kicsorgó” legmagasabb helyiértékű bit kerül a Carry bitbe. A működést a 73 ábra mutatja be Az

utası́tás képes a forgatást egyszer vagy többször végrehajtani, a második operandustól függően. 7.3 ábra: Az ROL utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF Példák ROL AL, 1 67 AF PF CF x ROL AX, 3 ROL BX, CL ROl [DS:2456h], CL 7.34 ROR Szintakszis ROR op, 1 ROR op, CL ROR op, szamlalo CF Az utası́tás az első operandust jobbra rotálja “önmagán” és a “kicsorgó” legalacsonyabb helyiértékű bit kerül a Carry bitbe. A működést a 74 ábra mutatja be Az utası́tás képes a forgatást egyszer vagy többször végrehajtani, a második operandustól függően. 7.4 ábra: Az ROR utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF AF PF CF x Példák ROR ROR ROR ROR AL, 1 AX, 3 BX, CL [DS:2456h], CL 7.35 SAL, SHL Szintakszis SAL SAL SAL SHL SHL SHL op, op, op, op, op, op, 1 CL szamlalo 1 CL szamlalo Az utası́tás balra léptet

minden bitet. A legmagasabb helyiértékű bit a Carry bitbe kerül, mı́g a legalacsonyabb helyiértékű bit törlődik Az utası́tás működését a 75 ábra mutatja be Az utası́tás képes a bit léptetést egyszer vagy többször végrehajtani, a második operandustól függően. Érdemes megjegyezni, hogy ha egyszer hajtjuk végre az utası́tást, akkor ez megfelel a 2-vel való szorzásnak. Az esetleges szorzási túlcsordulás a Carry bitben jelenik meg 68 CF 0 7.5 ábra: Az SAL utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF x x AF PF CF x Példák SHL SHL SHL SHL AL, 1 AX, 3 BX, CL [DS:2456h], CL Az utası́tás használatára a 8.7 fejezet mutat néhány példát 7.36 SAR Szintakszis SAR op, 1 SAR op, CL SAR op, szamlalo CF Az utası́tás jobbra léptet minden bitet. A legalacsonyabb helyiértékű bit a Carry bitbe kerül, mı́g a legmagasabb helyiértékű bit

ismétlődik. Az utası́tás működését a 76 ábra mutatja be Az utası́tás képes a bit léptetést egyszer vagy többször végrehajtani, a második operandustól függően. Érdemes megjegyezni, hogy ha egyszer hajtjuk végre az utası́tást, akkor ez megfelel a 2-vel való előjeles osztásnak. A hányados az operandusban marad, mı́g a maradék a Carry bitbe kerül 7.6 ábra: Az SAR utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF x x 7.37 SHR Szintakszis SHR op, 1 69 AF PF CF x SHR op, CL SHR op, szamlalo CF Az utası́tás jobbra léptet minden bitet. A legalacsonyabb helyiértékű bit a Carry bitbe kerül, mı́g a legmagasabb helyiértékű bit törlődik. Az utası́tás működését a 77 ábra mutatja be Az utası́tás képes a bit léptetést egyszer vagy többször végrehajtani, a második operandustól függően. Érdemes megjegyezni, hogy ha egyszer hajtjuk

végre az utası́tást, akkor ez megfelel a 2-vel való előjel nélküli osztásnak. A hányados az operandusban marad, mı́g a maradék a Carry bitbe kerül 0 7.7 ábra: Az SHR utası́tás működése Érintett státusz bitek OF DF IF x TF SF ZF x x AF PF CF x Példák Az alábbi programrészlet azt ellenőrzi, hogy a legalacsonyabb helyiértékű bit zérus vagy egy: . SHR AL, 1 JNC zerus ; kód végrehajtása ha a bit 1 JMP vege zerus: ; kód végrehajtása ha a bit 0 vege: . 70 7.4 Logikai utası́tások 7.41 AND A 0 1 0 1 B 0 0 1 1 A AND B 0 0 0 1 7.2 tábla: AND utası́tás igazság táblája 7.42 OR A 0 1 0 1 B 0 0 1 1 A OR B 0 1 1 1 7.3 tábla: OR utası́tás igazság táblája 7.43 XOR A 0 1 0 1 B 0 0 1 1 A XOR B 0 1 1 0 7.4 tábla: XOR utası́tás igazság táblája 7.44 NOT A 0 1 NOT A 1 0 7.5 tábla: NOT utası́tás igazság táblája 7.45 TEST 7.46 CMP 71 Feltétel = nem = >

>= < <= Előjeles JE, JZ JNE, JNZ JG, JNLE JGE, JNL JL, JNGE JLE, JNG Előjel nélkül JE, JZ JNE, JNZ JA, JNBE JAE, JNB JB, JNAE JBE, JNA 7.6 tábla: Feltételes utası́tások 7.5 Vezérlésátadó utası́tások 7.51 JMP 7.52 Feltételes utası́tások Az assembly programozási nyelvben nincsennek magasabb szintű programozási konstrukciók, például ciklus. Minden ilyen szerkezetet feltételes ugrásokkal kell megvalósı́tani A feltételes ugrás azt jelenti, hogy a program futása nem a következő utası́tással folytatódik, hanem a feltételes ugrás által megadott cı́men, ha a feltétel teljesül. Itt a feltétel nem jelenti azt, hogy az utası́tás valamilyen összehasonlı́tást végezne, csak annyit, hogy egy korábbi utası́tás által beállı́tott státusz bit értéke alapján történhet ugrás. Például a JE cı́m utası́tás azt jelenti, hogy ha a ZF (zérus státusz bit) értéke

egy (1) akkor a ’cı́m’-en folytatódik a program végrehajtása. Ha a zérus státusz bit értéke nulla (0) akkor a JE cı́m utası́tás utáni utası́tással folytatódik a program végrehajtása. A 76 táblázat sorolja fel a különböző feltételes ugró utası́tásokat. Fontos, hogy lehetőség szerint ne keverjük az előjeles és előjel néküli feltételes ugró utası́tásokat. 7.53 JCXZ 7.54 LOOP Szintakszis LOOP cim Az utası́tás 1-el csökkenti a CX regiszter értékét és ha az ı́gy kapott érték nem nulla akkor a cim cı́mre adja át a vezérlést. Ha a csökkentés után a CX értéke zérus lesz, akkor a LOOP utası́tás utáni utası́tással folytatja program a végrehajtást. Fontos megérteni, hogy ez az utası́tás egy hátul tesztelő ciklusnak felel meg. Így először mindig a csökkentés következik be és csak utána az ellenőrzés 7.55 LOOPNZ Szintakszis LOOPNZ cim

LOOPNE cim Az utası́tás angol neve: “Loop while Non Zero” vagy “Loop while Not Equal”. Az utası́tás először is megvizsgálja a ZF státusz bit értékét. Ha a státusz bit értéke nulla, akkor csökkenti a CX regiszter értékét 1-el és ha ı́gy a CX regiszter értéke még nem nulla, akkor végrehajtja az ugrást a cim cı́mre. Ellenkező esetben az utası́tás után folytatja a program a végrehajtást. 72 7.56 LOOPZ Szintakszis LOOPZ cim LOOPE cim Az utası́tás angol neve: “Loop while Zero” vagy “Loop while Equal”. Az utası́tás először is megvizsgálja a ZF státusz bit értékét. Ha a státusz bit értéke 1, akkor csökkenti a CX regiszter értékét 1-el és ha ı́gy a CX regiszter értéke még nem nulla, akkor végrehajtja az ugrást a cim cı́mre. Ellenkező esetben az utası́tás után folytatja a program a végrehajtást. Ennél az utası́tásnál a ZF státusz bit

jelöli, hogy miért ér véget a ciklus. Ha CX regiszter lett zérus, akkor a ZF státusz bit értéke 1 lesz, ha pedig az utolsó státusz bit művelet eredménye volt nullától különböző, akkor a ZF státusz bit értéke nulla lesz. 7.57 CALL Szintakszis CALL cim Az utası́tás először elmenti a CALL utası́tást követő utası́tás cı́mét a verem tetején. Ez lesz a függvény visszatérési cı́me. Ezután az argumentumként megadott cı́mre adja át a vezérlést, vagyis a cim cı́men folytatódik a vgérehajtás. Az utası́tással lehet közeli vagy távoli vezérlés átadást végrehajtani. Más szavakkal az argumentum lehet csak offszet vagy szegmens és offszet cı́m. Az utası́tást a függvények meghı́vására használjuk. A függvényből visszatérést a RET utası́tás végzi, lásd 7.58 bekezdés A függvényekről részletesebb leı́rás a 10 fejezetben található

7.58 RET Szintakszis RET vagy RET n Az utası́tás egy függvény végén szokott szerepelni. Feladata, hogy a verem tetejéről levegyen egy visszatérési cı́met, majd a vezérlést átadja erre a cı́mre Fontos megérteni, hogy az utası́tás nem vizsgálja meg a verem tetejét, akármit talál ott az utası́tás azt visszaatérési cı́mnek fogja tekinteni. Az utası́táshoz optcionálisan tartozhat egy argumentum. Ebben az esetben az argumentum egy szám n, ami megadja, hogy a visszatérési cı́m levétele után még hágy byte-ot kell levenni a veremről. Ezeket a levett értékeket eldobjuk. A különböző függvény hı́vás utáni takarı́tási stratégiákról a 1043 bekezdésben olvashatunk. 7.59 INT 73 7.6 String kezelő utası́tások A string kezelő utası́tások memóriablokkokkal végeznek műveletet. A string, tulajdonképpen szöveg, a szöveg pedig nem más mint egy karakter sorozat vagy

byte sorozat és egy byte sorozat amikor a memóriában tároljuk akkor pedig megfelel egy memóriablokknak. Az utası́tások általában a DS:SI, ES:DI és AX regisztereket használják. A regisztereken kı́vül fontos szerepet játszik még a Direction (Irány) státusz bit, mivel ez határozza meg, hogy a művelet során a cı́mekhez hozzáadunk vagy a cı́mekből kivonunk értékeket. A Direction (Irány) státusz bitet a CLD (774 bekezdés) és STD (775 bekezdés) utası́tások állı́tják be. A string kezelő parancsokat részletesen tárgyaljuk a 12. fejezetben 7.61 MOVSB, MOVSW Szintakszis MOVSB MOVSW Az utası́tások angol neve: “MOVe String Byte” illetve “MOVe String Word”. Az utası́tás a DS:SI regiszterek által megcı́mzett byte-ot átmásolja az ES:DI cı́mre. Az SI és DI regiszterek értéke 1-el növekszik ha a Direction státusz bit értéke nulla vagy a regiszterek értéke 1-el csökken, ha a

Direction státusz bit értéke egy. A MOVSW utası́tás csak annyiban különbözik, hogy két byte-ot vagyis egy szót (word) másol át és az SI és DI regiszterek értéke kettővel módosul a Direction státusz bit értékétől függően. Ezek az utası́tások a kivételek közé tartoznak, mivel egy utası́tás kétszer is hozzáfér a memóriához. A másik fontos megjegyzés, hogy ezek az utası́tások csak egy szegmensnyi adatot képesek átmásolni, mivel ha a DI regiszter értéke eléris a FFFFh értéket és 1-el megnöveljük az értékét akkor a nulla értéket kapjuk, ami a szegmens első byte-jára mutat, ı́gy “körbefordulás” következik be. Ez azért van, mert az utası́tás nem módosı́tja a szegmens regisztereket, azokat nem növeli és nem csökkenti. A 8086osnál modernebb processzorokon azért lehet több adatot átmásolni, mivel az ESI és EDI 32 bites regisztereket

használjuk a műveletben. Nagyon fontos, hogy az utası́tás a használt regiszterek kezdeti értékét nem állı́tja be, azt a programozónak kell megadni! Példák Az alábbbi kódrészlet átmásol 4 word méretű adatot: forras: dw 1111h, 2222h, 3333h, 4444h cel: dw 0000h, 0000h, 0000h, 0000h . MOV SI, forras MOV DI, cel MOV CX, 4 CLD ujra: MOVSW LOOP ujra . Ezt a példát érdemes összehasonlı́tani egy egyszerűsı́tett változattal, ami a 7.66 bekezdésben található 74 7.62 CMPSB, CMPSW Szintakszis CMPSB CMPSW Az utası́tások angol neve: “CoMPare String Byte” illetve “CoMPare String Word”. A CMPSB utası́tás a DS:SI regiszterek által megcı́mzett byte-ot összehasonlı́tja az ES:DI által megcı́mzett byte-al. Az SI és DI regiszterek értéke 1-el növekszik ha a Direction státusz bit értéke nulla vagy a regiszterek értéke 1-el csökken, ha a Direction státusz bit értéke egy. Az utası́tások a

státusz biteket is beállı́tja úgy, mintha egy CMP utası́tást (lásd 7.46 bekezdés) hajtottunk volna végre A CMPSW utası́tás hasonlóan működik, de word méretű adatokkal dolgozik, és az SI és DI regiszterek értéke is 2-vel változik. 7.63 LODSB, LODSW Szintakszis LODSB LODSW Az utası́tások angol neve: “LOaD String Byte” illetve “LOaD String Word”. A LODSB utası́tás a DS:SI regiszterek által megcı́mzett byte-ot betölti az AL regiszterbe. Az SI regiszter értéke 1-el növekszik ha a Direction státusz bit értéke nulla vagy az SI regiszter értéke 1-el csökken, ha a Direction státusz bit értéke egy. A LODSW utası́tás csak abban különbözik, hogy a DS:SI regiszterek által megadott cı́mről egy word-öt (2 byte-ot) töltünk be az AX regiszterbe. 7.64 STOSB, STOSW Szintakszis STOSB STOSW Az utası́tások angol neve: “STOre String Byte” illetve “STOre String Word”. A STOSB

utası́tás az AL regiszter értékét az ES:DI regiszterek által megadott cı́mre ı́rja. Az DI regiszter értéke 1-el növekszik ha a Direction státusz bit értéke nulla vagy az DI regiszter értéke 1-el csökken, ha a Direction státusz bit értéke egy. A STOSW utası́tás csak abban különbözik, hogy az AX regiszter tartalmát ı́rja ki az ES:DI regiszterek által megadott cı́mre. A DI regiszter értéke 2-vel változik a Directioin státusz bit értékétől függően. 7.65 SCASB, SCASW Szintakszis SCASB SCASW Az utası́tások angol neve: “SCAn String Byte” illetve “SCAn String Word”. A SCASB utası́tás az AL regiszter értékét összehasonlı́tja az ES:DI regiszterek által megcı́mzett byte-al. A státusz biteket az ‘[ES:DI] - AL’ különbség szerint lesznek beállı́tva. Az DI regiszter értéke 1-el növekszik ha a 75 Direction státusz bit értéke nulla vagy az DI regiszter értéke

1-el csökken, ha a Direction státusz bit értéke egy. A SCASW utası́tás csak abban különbözik, hogy az AX regiszter tartalmát hasonlı́tja össze az ES:DI regiszterek által megcı́mzett word-el. A DI regiszter értéke 2-vel változik a Directioin státusz bit értékétől függően. Amikor a REP prefix-el együtt használjuk, akkor ez az utası́tás, a megadott memória blokkban az AL vagy AX regiszter tartalmát keresi meg. 7.66 REP Szintakszis REP string-utası́tás Ez tulajdonképpen nem is utası́tás, hanem egy prefix, amit a string kezelő utası́tások elé tehetünk. A neve a “REPeat”, ismétlés angol szóból származik. Ennek a prefixnek az a feladata, hogy az utána megadott string kezelő utası́tást többször hajtsa végre. Az ismétlések számát a CX regiszter adja meg, amit előre be kell állı́tani. Fontos, hogy a CX értéke az adatok számát adja meg, nem pedig az adatok byte-jainak

számát Például 4 word adat másolása esetén az alább két kódrészlet egyenértékű, de figyeljük meg a különböző CX értékeket: . MOV CX, 4 REP MOVSW . egyenértékű a következő kóddal: . MOV CX, 8 REP MOVSB . Ennek a prefixnek az a nagy előnye, hogy egyetlen utası́tással akár egész szegmenst át lehet másolni (MOVSB), szegmensnyi adatokat össze lehet hasonlı́tani (CMPSB), felül lehet ı́rni (STOSB) vagy egy értéket a szegmensben megkeresni (SCASB). További részletek a 12 fejezetben található Ezzel a prefix-el sem lehet a szegmensek határát átlépni. Így például word adatokkal végzett műveletek esetén a 8086-os processzoron nincs értelme a 7FFFh értéknél nagyobb értéket adni a CX regiszternek a REP prefix esetén. Példák Az alábbbi kódrészlet átmásol 4 word méretű adatot. A programrészlet egyenértékű a 761 bekezdéssben bemutatott példával.

forras: dw 1111h, 2222h, 3333h, 4444h cel: dw 0000h, 0000h, 0000h, 0000h . MOV SI, forras MOV DI, cel MOV CX, 4 CLD REP MOVSW . 76 7.67 REPZ Szintakszis REPZ string-utası́tás REPE string-utası́tás Ennek a prefixnek a neve az “REPeat while Zero” illetve “REPeat while Equal” kifejezésekből származik. Ez a prefix is a CX regisztert használja, az értékét csökkenti amı́g el nem éri a zérust. A prefix ezen kı́vül a Zérus státusz bitet (ZF) is megvizsgálja és ha a bit értéke zérus (vagyis a művelet eredménye nem volt zérus) akkor abbahagyja az utası́tás ismétlését. Fontos, hogy a kilépés okát a Zérus (ZF) státusz bitből lehet megtudni. Ha az ismétlés azért állt le, mert az utolsó művelet eredménye nullától különbözött, akkor a ZF értéke zérus lesz, ha pedig a CX regiszter lett zérus, akkor a ZF értéke egy lesz. Érdekes, hogy a REPZ prefixnek és REP prefixnek az

operáció kódja megegyezik. Ez azt jelenti, hogy a MOVS, LODS és STOS utası́tások esetén csak a REP prefixnek van érteme. A SCAS és CMPS utası́tások esetén a prefix pedig mindig REPZ-nek felel meg. Ez azért van, mert a MOVS, LODS és STOS utası́tások nem módosı́tják a státusz biteket, ı́gy nem gond, hogy csak a REP prefixet lehet használni. 7.68 REPNZ Szintakszis REPNZ string-utası́tás REPNE string-utası́tás Ennek a prefixnek a neve az “REPeat while Non Zero” illetve “REPeat while Not Equal” kifejezésekből származik. Ez a prefix is a CX regisztert használja, az értékét csökkenti amı́g el nem éri a zérust A prefix ezen kı́vül a Zérus státusz bitet (ZF) is megvizsgálja és ha a bit értéke egy (vagyis az utolsó művelet eredménye zérus volt) akkor abbahagyja az utası́tás ismétlését. Fontos, hogy a kilépés okát a Zérus (ZF) státusz bitből lehet megtudni. Ha az

ismétlés azért állt le, mert az utolsó művelet eredménye zérus volt, akkor a ZF értéke egy lesz, ha pedig a CX regiszter lett zérus, akkor a ZF értéke zérus lesz. 77 7.7 Processzor vezérlő utası́tások 7.71 CLC Szintakszis CLC Az utası́tás angol neve: “CLear Carry”. Az utası́tás nullára állı́tja a Carry státusz bit értékét 7.72 STC Szintakszis STC Az utası́tás angol neve: “SeT Carry”. Az utası́tás 1-re állı́tja a Carry státusz bit értékét 7.73 CMC Szintakszis CMC Az utası́tás angol neve: “CoMplement Carry”. Az utası́tás nullára állı́tja a Carry státusz bit értékét 7.74 CLD Szintakszis CLD Az utası́tás angol neve: “CLear Direction”. Az utası́tás 0-ra állı́tja a Direction (Irány) státusz bitet, aminek a string kezelő utası́tások esetén van jelentősége. Ebben az esetben a MOVS, LODS, STOS, SCAS és CMPS parancsok növelik a DI és/vagy

SI regiszter értékét. 7.75 STD Szintakszis STD Az utası́tás angol neve: “SeT Direction”. Az utası́tás 1-re állı́tja a Direction (Irány) státusz bitet, aminek a string kezelő utası́tások esetén van jelentősége. Ebben az esetben a MOVS, LODS, STOS, SCAS és CMPS parancsok csökkentik a DI és/vagy SI regiszter értékét. 7.76 CLI Szintakszis CLI Az utası́tás angol neve: “CLear Interrupt”. Az utası́tás nullára állı́tja az Interrupt státusz bit értékét Ez az utası́tás letı́ltja a hardware megszakı́tások fogadását. 78 7.77 STI Szintakszis STI Az utası́tás angol neve: “SeT Interrupt”. Az utası́tás 1-re állı́tja az Interrupt státusz bit értékét Ez az utası́tás engedélyezi a hardware megszakı́tások fogadását. 79 7.8 Egyéb utası́tások 7.81 NOP Szintakszis NOP Ez egy nagyon egyszerű utası́tás, mivel nem csinál semmit. Angol nevén: “No

OPeration” 7.82 IN 7.83 OUT 80 7.9 Ellenőrző kérdések 1. Tegyük fel, hogy az Intel processzorokon nem lenne LDS utası́tás Hogyan implementálná ezt az utası́tást? Írja le a kódot ami egyenértékű az LDS utası́tással. 2. Tegyük fel, hogy a következő adatok vannak definiálva: num1 DW 100 num2 DB 225 char1 DB ’Y’ num3 DD 0 Érvényesek-e az alábbi utası́tások: (a) MOV AX, BX (b) MOV AX, num2 (c) MOV BL, num1 (d) MOV BL, [num1] (e) MOV DH, char1 (f) MOV char1, num2 (g) MOV [char1], [num2] (h) MOV IP, num1 (i) ADD 75, AX (j) CMP 75, AX (k) SUB char1, ’A’ (l) SUB [char1], ’A’ (m) XCHG AL, num2 (n) XCHG AL, [num2] (o) XCHG AL, 23d (p) XCHG AL, [23d] (q) INC num3 (r) INC [num3] 3. Az alábbi kódrészletekben a ‘MOV AX, 1’ vagy az ‘MOV BX, 1’ utası́tás fog lefutni: (a) (b) mov CX,5 sub DX,DX cmp DX,CX jge jump1 mov BX,1 jmp skip1 jump1: mov AX,10 skip1: . mov mov shr cmp CX,5 DX,10 DX,1 CX,DX 81 je

jump1 mov BX,1 jmp skip1 jump1: mov AX,10 skip1: . 4. Magyarázza el szövegesen, hogy mit csinál a következő kód részlet: (a) NOT AX ADD AX, 1 (b) NOT BX ADD BX, 1 (c) SUB SUB MOV ADD ADD ADD ADD AH, DH, DL, DX, DX, DX, DX, AH DH AL DX DX AX DX (d) SUB SUB MOV MOV SHL SHL ADD AH, DH, DL, CL, DX, AX, DX, AH DH AL 3 CL 1 AX 5. Kell-e tudni az AX regiszter kezdeti tartalmát ahhoz, hogy megállapı́tsuk az AX regiszter tartalmát az alábbi kódrészlet lefutása után? Ha igen, magyarázza meg miért! Ha nem, magyarázza el mi lesz az AX regiszter tartalma? (a) MOV DX, AX NOT AX OR AX, DX (b) MOV DX, AX NOT AX AND AX, DX 82 8. Fejezet Assembly programokról Talán csodálkozunk, hogy az eddigi fejezetek miért kellettek. Ahhoz, hogy assembly nyelven programot tudjunk ı́rni, szükséges tudni: • a CPU regiszterek neveit • a verem hogyan működik • hogyan lépjünk ki • hogyan definiáljunk szimbólumokat, lokális és

globális • hogyan használjuk az eszközöket (fordı́tókat, linkereket) 8.1 Programozási módszer Az assembly programozásra jellemző, hogy mindent explicit módon meg kell adni a programban. Nincsennek magas szintű programozási konstrukciók, azokat magunknak kell létrehoznunk A 8.1 táblán látható egy elöltesztelő ciklus megvalósı́tása A táblán látható hogyan “alakul át” az elöltesztelő ciklus feltételes ugró utası́tásokká, hiszen csak ezek állnak rendelkezésre az assembly programozási nyelvben. Ugyanakkor az is látható, hogy a magas szintű programban a feltételben az szerepel, hogy ismételjük meg az utası́tásokat ha az AX regiszter nem egyenlő a zérus értékkel. Ezzel szemben az assembly kódban a feltételes ugrás akkor ugrik a ciklus végére, ha az utolsó műveletben a zérus státusz bit be lett állı́tva, vagyis az összehasonlı́tásnál az AX regisztert

zérusnak találtuk. Vagyis a feltétel megfordult az assembly kódban. Valójában nem kell ennek ı́gy lenni, lehetőségünk van arra, hogy ugyanazt a feltételt használjuk az assembly-ben, mint a magasabb szintű programozási nyelvben. Lényegében arról van szó, hogy a feltételes assembly utası́tások “megfordı́thatók”. Ez látható a 82 táblán Így a program egy kicsit komplikáltabb. ujra: CMP AX, 0 JZ vege . JMP ujra vege: while(AX != 0) { . } 8.1 tábla: Elöltesztelő ciklus megvalósı́tása 83 ujra: CMP JNZ JMP tovabb: . JMP vege: while(AX != 0) { . } AX, 0 tovabb vege ujra 8.2 tábla: Alternatı́v megvalósı́tása az elöltesztelő ciklusnak 8.1 ábra: A megszakı́tások osztályozása 8.2 Megszakı́tások A megszakı́tás, vagy angol nevén interrupt, egy mechanizmus ami által a program végrehajtásának folyamata megváltozhat. Ilyen mechanizmus az ugró utası́tások és ide

tartozik a függvény is (lásd 10. fejezet) Lényegében a megszakı́tás felfüggeszti a jelenlegi program futását és a vezérlést átadja egy megszakı́tás kezelőnek (interrupt service routine, ISR). Amikor a megszakı́tás kezelő befejezte a műveleteit, visszaadja a vezérlés arra a pontra, ahol a programot megszakı́tottuk, úgy mintha a programot meg sem szakı́tottuk volna. A fő különbség a függvények és a megszakı́tások között, hogy a megszakı́tást szoftver is meghı́vhatja és hardware esemény is kiválthatja, mı́g egy függvényt csak szoftver hı́vhatja meg. Tulajdonképpen ez a különbség nagyon fontos, mivel amikor egy hardware-s esemény bekövetkezik, akkor a hardware csak megszakı́tás segı́tségével tud a processzortól számı́tási időt “szerezni”, hogy az adott eseményt lekezeljük. Így a megszakı́tások egy hatékony lehetőséget biztosı́tanak nem várt

események kezelésére is. A másik nagyon fontos különbség a függvények és a megszakı́tások között, hogy a megszakı́tás kezelők memória rezidensek (állandóan a memóriában vannak), mı́g a függvényeket a programmal együtt töltünk be a memóriába csak egy “időre”. A szoftveres megszakı́tások “kiváltására” az INT utası́tást lehet használni. Például amikor a felhasználótól szeretnénk egy karaktert beolvasni, akkor a megfelelő INT utası́tás végrehajtásával a megfelelő megszakı́tás indul el, amely a billentyűzetről beolvassa a karaktert. Valójában a szoftveres és hardware-es magszakı́tásokon kı́vűl van egy harmadik tı́pusú megszakı́tás is, az úgynevezett kivételek (exception). A kivételek az utası́tás hibákat kezelik, mint például a zérussal való osztás. A 81 ábra mutatja a megszakı́tások osztályozását 8.21 Hardware-es

megszakı́tások A hardware-es megszakı́tások is két csoportba sorolhatók: • maszkólható és 84 • nem maszkolható hardware-es megszakı́tások. A nem maszkolható megszakı́tásokat (Non-maskable Interrupt, NMI) a processzor mindig azonnal kezeli. Ilyen megszakı́tás generálódik például a RAM paritás hiba esetén ami memória hibát jelöl. A maszkolható megszakı́tások esetén a megszakı́tás végrehajtása késleltethető addig, amı́g a végrehajtás egy “kedvezőbb” pontot ér el. A maszkolható megszakı́tások működésére a következő példával mutatható be. Egy program futása során egy megszakı́tás következik be. Ekkor a program futása felfüggesztődik és elindul a megszakı́tás kezelő futása. Ha a megszakı́tás nem akarja, hogy egy újabb megszakı́tás beavatkozhasson akkor a processzor maszkolhatja a megszakı́tásokat. Ha a megszakı́tásokat maszkoljuk,

akkor egy újabb megszakı́tásnak várnia kell. (Kivéve a nem maszkolható megszakı́tások!) 8.22 Megszakı́tások 8086-os processzorokon Ez a fejezet csak a 8086-os processzorok megszakı́tás kezelésével foglalkozik. Ez a modern processzorokon a “valós modú” (real mode) megszakı́tás kezelésnek felel meg A “védett modú” (protected mode) megszakı́tás kezeléssel itt nem foglalkozunk. A processzor 256 megszakı́tást támogat, amelyek száma nullától 255-ig tart. A megszakı́tás száma nagyon fontos mivel ezzel azonosı́thatjuk a megszakı́tásokat és ez a szám a megszakı́tás tábla indexét is megadja. A megszakı́tás tábla a nullás fizikai cı́men található A megszakı́tás táblában minden bejegyzés 4 byte-ból áll. Egy ilyen bejegyzést megszakı́tás vektornak szoktunk nevezni Egy bejegyzés egy CS:IP regiszter párost ad meg, 2 byte a CS regiszternek és 2 byte az IP regiszternek.

Ezek után ha egy megszakı́tás cı́mét szeretnénk megtalálni a megszakı́tás táblában, akkor a megszakı́tás indexét szorozni kell 4-el és a kapott hexadecimális szám adja meg az offszetet. Például az INT 10h megszakı́tás cı́me: 10h × 4 = 40h, ami a 0000:0040h cı́mnek felel meg. Ha már ki tudjuk számolni egy megszakı́tás cı́mét, akkor az INT 10h megszakı́tást másképpen is meg tudjuk hı́vni: mov bx,0h mov es,bx mov bx,40h mov ah,0eh ; megszakı́tás paraméterei mov al, 1 pushf call far es:[bx] popf Részletesen a következő történik egy megszakı́tás végrehajtása során: 1. Először a státusz biteket elmentjük a vermen 2. Töröljük a TRAP és INTERRUPT státusz biteket, hogy más megszakı́tás ne szakı́thassa meg az aktuális megszakı́tás kezelő végrehajtását 3. A CS és IP regisztereket feltöltjük a veremre 4. A megszakı́tás táblából betöltjük a CS

regiszter értékét: (index × 4) + 2 5. A megszakı́tás táblából betöltjük az IP regiszter értékét: (index × 4) 6. Megszakı́tás kezelése 7. Helyreállı́tjuk az IP regisztert a veremből 85 8.2 ábra: Kommunikációs lehetőségek alkalmazások és a hardware között 8. Helyreállı́tjuk a CS regisztert a veremből 9. Helyreállı́tjuk a státusz regisztert a veremből Az utolsó három műveletet az IRET utası́tás végzi el 8.23 INT 21h megszakı́tás A szoftveres megszakı́tásokat az INT utası́tás kiadásával lehet elindı́tani. A DOS rendszereken (lényegében a Windows alatt is) az INT 21h szoftveres megszakı́tás nagyon sokféle szolgáltatást biztosı́t a programozó számára. A 8.2 ábra mutatja, hogy egy alkalmazásnak több lehetősége is a hardware eszközökkel való kommunikációra. A legmagasabb szintű szolgáltatásokat az INT 21h adja, például file kezelés A

BIOS szolgáltatás azt jelenti, hogy olyan megszakı́tásokat hı́vunk meg amelyek közvetlenebbül kommunikálnak a hardware-el. Ilyen megszakı́tás az INT 10h amelyik a grafikus megjelenı́tő kártyával és az INT 16h amelyik a billentyűzettel kommunikál. Egy harmadik lehetőség, amikor közvetlenül egy porton keresztül küldünk ki adatokat a hardware-re és ugyanı́gy a portból olvasunk adatokat. Ez a legalacsonyabb szintű hardware vezérlés, amihez már az adott hardware eszköz kézikönyve is szükséges, hiszen tudnunk kell, hogy milyen byte-okat küldjünk, milyen sorrendben és milyen időzı́téssel. 8.24 Kivételek A kivételeket három csoportja soroljuk: 1. faults (hibák), 2. traps (csapdák) és 3. aborts (kilépések) A faults és traps kivételek utası́tás határon jelennek meg. A faults kivételek az utası́tás végrehajtása előtti állapotot használják a bekövetkeztük során.

Ilyen például a nullával való osztás, ami a DIV és IDIV utası́tások végrehajtása során következhet be. Így ha ilyen hiba következik be a kivétel a hiba végrehajtása előtti állapotra fogja visszaállı́tani a processzort. Másik tipikus fault kivétel a “segmentnot-present” hiba, ami azt jelenti, hogy az adott szegmens nincs a memóriában A hiba bekövetkezte után a hiányzó szegmenst be kell tölteni és a program végrehajtása ezután folytatódhat. Itt is az utası́tás 86 előtti állapottól folytatódik a végrehajtás, hiszen az utası́táshoz szükséges szegmens már jelen van a memórában és ı́gy újra végrehajtható az utası́tás. Traps kivételek ezzel szemben az utası́tást követő “határon” hajtódnak végre, vagyis ebben az esetben nincs utası́tás újravégrehajtás. Például a túlcsordulás (overflow) megszakı́tás egy ilyen trap-nek felel meg. A

felhasználó által definiált megszakı́tások is trap-nek felelnek meg Az abort megszakı́tások hibákat jelentenek, például hardware hibákat vagy nem konzisztens rendszer táblákról jelentenek a felhasználó felé. 8.3 Kitérő Linux-ra Bár eddig nem sok szó esett a Linuxról de egy rövid bekezdésig itt megemlı́teném. A Linux rendszer nagyon sok szolgáltatást biztosı́t a 80h megszakı́táson keresztül. Valójában 180 különböző rendszer hı́vást biztosı́t ez a megszakı́tás. A szolgáltatást itt is az EAX regiszter értékével lehet beállı́tani 8.4 COM programok A DOS 1.0 ”operációs rendszer” csak COM tı́pusú programokat használt Az utána következő DOS 20 során vezették csak be az EXE programokat. A DOS 10 rendszer alatt egy igen egyszerű szabály szerint működtek a programok: miután elindult a program a teljes memóriát kezelhette a program. Ebben az időben az

”operációs rendszer” még nem használt memória menedzselést (memory management), ı́gy egy program bármit csinálhatott a teljes memóriában. Az ”operációs rendszer” csak azt tartotta nyilván, hogy hol van az első szabad hely ahova a következő programot betöltheti. Amikor a DOS egy új programot akart elindı́tani, akkor előkészı́tett egy speciális területet a program számára a szabad terület első 256 byte-nyi helyén. A speciális terület neve: Program Segment Prefix (PSP) Az előkészı́tés után a DOS egyszerűen betöltötte a programot a 256 byte-nyi PSP utáni területre. Mindenféle ellenőrzés és további feldolgozás nélkül. A betöltés után még egy-két regisztert előkészı́tett a rendszer, beállı́tott egy visszatérési cı́met, majd a program elejére ugorva elindı́totta azt. Mivel 256 byte egyenlő 100h hexadecimális értékkel ezért van az, hogy a COM

programok a 100h cı́men kezdődnek. Mindig! A DOS által elvégzett beállı́tások egy COM programhoz: • A CS, DS, ES, SS regisztereket beállı́tja a PSP elejére. • Az IP regiszternek a 100h értéket adja, ahol majd a program futása elkezdődik. • Az SP regiszter a verem tetejére van állı́tva. Ez általában az FFFEh értéknek felel meg (Ez a szegmens tetejének cı́me.) • A BX:CX regiszter pár a COM program méretét fogja tükrözni. A BX regiszter a 32 bites értéknek a felső 16 bitjét mı́g a CX az alsó 16 bitjét tárolja. Így egy 256d byte méretű program esetén: BX = 0000h CX = 0100h • Az AX, DX, SI és DI regiszterek értéke zérus lesz. 87 8.41 Program Segment Prefix 8.5 EXE programok 8.6 XOR használata 8.7 Assembly integer aritmetika 8.71 BCD aritmetika 88 8.8 Ellenőrző kérdések 1. Mik a különbségek függvények és megszakı́tások között? 2. Amikor egy

megszakı́tás végrehajtódik, akkor a státusz bitek automatikusan elmentődnek Ugyanakkor egy függvényhı́vás során a státusz bitek nem mentődnek el automatikusan. Magyarázza meg miért van ez ı́gy? 3. Hogyan lehet “kikapcsolni” a maszkolható megszakı́tásokat? 4. Hogyan csoportosı́tjuk a megszakı́tásokat? 89 90 9. Fejezet Példa programok Ebben a fejezetben néhány példa program kerül bemutatásra, melyek remélhetőleg elősegı́tik az assembly programozás elsajátı́tását. A programok nincsennek optimalizálva és ebben a fejezetben a lehető legegyszerűbb változatban kerülnek bemutatásra. A későbbi fejezetek átolvasása után arra biztatnám az olvasót, hogy térjen vissza ezekhez a programokhoz és próbálja meg őket átalakı́tani, rövidebb, más módon is megı́rni. 9.1 Egy byte bináris kinyomtatása Ez a program egy szokásos gyakorlat az assembly nyelv tanulás

során. A program azt mutatja be, hogy egy byte hogyan épül fel bitekből, és a biteket hogyan lehet megfelelő sorrendben kinyomtatni. A 91 tábla mutatja a program listáját. 1 org 100h 2 MOV BL, [adat] 3 MOV AH, 02 4 MOV CX, 0008 5 ujra: 6 MOV DL, 0 7 RCL BL, 1 8 ADC DL, 30h 9 INT 21h 10 LOOP ujra 11 INT 20h 12 adat: 13 db 10100011b 9.1 tábla: Egy byte bináris kinyomtatására szolgáló program A 2. sorban betöltjük az adat cı́m alatt tárolt értéket Az adat a program végén van tárolva és bináris formátumban van megadva. A 3 sorban előkészı́tjük a nyomtatást, vagyis megadjuk az INT 21h megszakı́tás funkció kódját. A 4 sorban a CX regiszterbe betöltünk 8-at, mivel egy byte-ban 8 bit van és a nyomtatást nyolcszor kell megismételni, vagyis nyolcszor kell 1-et vagy 0-át nyomtatni. Mivel egy karaktert fogunk kinyomtatni, ezért a nyomtatandó karakternek végül a DL regiszterben kell lennie, ı́gy a 6.

sorban nullával inicializáljuk a DL regisztert A 7 sorban az RCL utası́tást használjuk (Lásd 7.31 fejezet) Miért? Először is az L betű az utası́tás nevének végén azt jelenti, hogy balra 91 Lépés Kezdeti 1. 2. 3. 4. 5. 6. 7. 8. CF ?? 1 1 0 1 0 1 1 0 128 1 1 0 1 0 1 1 0 ?? 64 1 0 1 0 1 1 0 ?? 1 32 0 1 0 1 1 0 ?? 1 1 Byte 16 8 1 0 0 1 1 1 1 0 0 ?? ?? 1 1 1 1 0 0 1 4 1 1 0 ?? 1 1 0 1 0 2 1 0 ?? 1 1 0 1 0 1 1 0 ?? 1 1 0 1 0 1 1 9.2 tábla: Egy byte balra forgatása a Carry biten keresztül végezzük a bit léptetést vagy bit forgtást. Ez azért fontos, mert a legmagasabb helyiértékű bit a byte bal oldalán található (lásd ??. ábra) és a képernyőre is balról-jobbra végezzük a nyomtatást, vagyis először a legmagasabb helyiértékű bitet kell kinyomtatni. Ha megnézzük a 71 vagy 75 ábrákat, akkor azt látjuk, hogy egy léptetés vagy forgatás során a legmagasabb helyiértékű bit

a Carry bitbe kerül. A Carry bitet a CF doboz jelöli Amikor egy bitet ilyen módon betöltünk a Carry bitbe, akkor később használhatjuk ezt a bitet egy feltételes ugrásnál, lásd JC (7.52 fejezet) és JNC (752 fejezet) utası́tásokat. Ugyanakkor ebben a programban a Carry bitet másképp használjuk A programnak végül vagy az ‘0’ vagy a ‘1’ karaktert kell kinyomtatnia amelyek ASCII kódja 30h és 31h. Ez azt jelenti, hogy a DL regiszterhez hozzá kell adni 30h és még a Carry bit értékét Erre szerencsére van külön utası́tás, az ADC utası́tás (lásd 7.24 fejezetet) Mivel ez az utası́tás hozzáadja az értékeket a DL regiszterhez, ezért kellett a 6. sorban nullát tölteni a DL regiszterbe Végül a 9. sorban az INT 21h megszakı́tás segı́tségével kinyomtatjuk a karaktert A 10 sorban a LOOP utası́tás (lásd 7.54fejezet) csökkenti a CX regiszter tartalmát eggyel és ha a CX regiszter

értéke nem zérus, akkor a megadott cı́mre ugrik. Ez azt jelenti, hogy a legbaloldalibb bit nyomtatása után ismét a legbaloldalibb bitet fogja nyomtatni, hiszen a byte-ot mindig balra forgatjuk. A 92 táblázat mutat egy példát arra, hogy hogyan alakul a byte és a Carry bit értéke az egyes lépések, forgatás során. 92 9.2 Egy hexadecimális szám kinyomtatása Egy hexadecimális szám 0 és 16 közötti érték lehet. Ezeket az értékeket 4 biten lehet reprezentálni, ı́gy ez a program csak egy byte (8 bit) felét tudja kinyomtatni. A hexadecimális számrendszerben 16 számjegy van: • 0 - 9 számjegyek ASCII kódja: 30h - 39h • A - F számjegyek ASCII kódja: 41h - 46h A programban feltételezzük, hogy a hexadecimális szám a BL 8 bites regiszterben van eltárolva. Ez azt jelenti, hogy a byte értéket meg kell vizsgálni, hogy a fenti tartományokból melyikbe esik és aszerint kell hozzáadni a

megfelelő értéket, hogy számjegy ASCII kódját kapjuk meg. A pszeudo kódban az algoritmus a következőképpen néz ki: IF BL < 0Ah THEN BL = BL + 30h ELSE BL = BL + 37h Ez azt jelenti, hogy ha a BL regiszter tartalma kisebb mint 10, akkor csak 30h értékkel kell módosı́tani, egyébként 37h értéket kell a BL regiszter tartalmához hozzáadni. Bár az assembly programozási nyelvben megvalósı́tható a feltételes utası́tás, de közvetlen ELSE ág nincs. (Az ELSE ágba eső utası́tások akkor hajtódnak végre, ha a feltétel hamis volt.) Ennek következtében a kódot egy kicsit át kell szervezni, ami pszeudo kódban ez lesz: BL = BL + 30h IF BL >= 03Ah THEN BL = BL + 07h Az előző változatban 30h vagy 37h értéket kellett a regiszterhez hozzáadni, ı́gy ebben a változatban 30h-at mindenképpen hozzáadunk és 07h-et már csak akkor kell hozzáadni, ha a kapott érték nagyobb vagy egyenlő mint 3Ah.

(Számoljuk végig, hogy a nulla szám ASCII karakterének száma 30h, az egy számé 31h és ı́gy tovább. Végül a kilences szám karakterének száma 39h, vagyis a 3Ah már a tizes számjegynek felelne meg, de a tizes számjegyet már az A betű jelöli aminek az ASCII kódja már 41h.) Az assembly program listája az 9.3 táblán látható A hexadecimális érték a programban van definiálva a szam cı́men, és ezt az értéket töltjük be a BL regiszterbe. A program végül kinyomtatja a hexadecimális számjegyet, ebben az esetben a B betűt. Az 9.3 táblán látható programban a második sorban a BL regiszterbe töltjük a szam cı́men tárolt byte értéket. A harmadik sorban az AH regiszterbe a 2-es értéket töltjük Ennek az értéknek csa később van jelentősége de mivel a későbbi utası́tások nem módosı́tják az AH regiszter tartalmát ezért itt is nyugodtan beállı́thatjuk ezt az

értékét. A negyedik sorban a BL regiszter tartalmát átmásoljuk a DL regiszterbe. Most már feltűnhet, hogy valójában arra törekszünk, hogy a program végén az INT 21h megszakı́tást használjuk a karakter kinyomtatására. (Ha egy karaktert akarunk kinyomtatni a INT 21h megszakı́tással, akkor az AH adja meg a funkcó kódot – 02h – és a DL regiszter fogja tartalmazni a kinyomtatandó karakter ASCII kódját. Lásd 62 bekezdést) Az 5-8 sorok valósı́tják meg az előbb tárgyalt pszeudo kódot. Először a DL regiszterhez hozzáadunk 30h értéket, majd az ı́gy kapott értéket a következő sorban összehasonlı́tjuk a 3Ah értékkel. A CMP utası́tás csak összehasonlı́tást végez és beállı́tja a státusz regisztert. A JL utası́tás a feltételes ugrás és a státusz bitek értékétől függően folytatódik a végrehajtés. Ez aztjelenti, hogy ha a DL regiszter értéke kisebb

mint 3Ah akkor átugorjuk a 8. sort Ha nagyobb, akkkor a 8 sorban folytatódik a végrehajtás és még hozzáadunk 7-et, hogy az A karakter ASCII kódjátólinduló értékeket kapjunk. A karakter kinyomtatása a 10. sorban történik az INT 21h megszakı́tással 93 1 org 100h 2 MOV BL, [szam] 3 MOV AH, 02 4 MOV DL, BL 5 ADD DL, 30h 6 CMP DL, 3ah 7 JL szamjegy 8 ADD DL, 07 9 szamjegy: 10 INT 21h 11 INT 20h 12 szam: 13 db 0bh ; DL < 3ah 9.3 tábla: Egy hexadecimális szám kinyomtatására szolgáló program 94 9.3 Egy byte hexadecimális kinyomtatása Ez a program annyiban különbözik az előző programtól, hogy ez a program 2 hexadecimális számot fog kinyomtatni. Miért? Egy byte 8 bitet vagy kétszer 4 bitet tartalmaz 4 biten pedig pontosan 16 féle számot lehet ábrázolni ami megfelel egy hexadecimális számjegynek. Bár mostanra már egyértelműnek kell lennie hogyan lehet 4 biten 16 számot ábrázolni, de

a teljesség kedvéért a 9.4 táblázat felsorolja a 4 biten tárolható számokat decimális és bináris alakban. Ez azt jelenti, hogy egy byte-ban az alsó négy bit és a felső négy bit is megfelel egy hexadecimális számjegynek, vagyis ha egy byte-ot headecimálisan akarunk kinyomtatni, akkor két hexadecimális számjegyet kell kinyomtatni. A 9.5 tábla tartalmazza az assembly program listáját Ez a program a 93 programot kétszer tartalmazza. (Igazából függvényeket kellene használni, hogy kevesebb legyen a kód ismétlés, de a függvényekről majd a 10. fejezetben tanulunk) Az extra utası́tások a 95 táblán látható programhoz képest azt biztosı́tják, hogy mindig az alsó 4 bit tartalmazza a hexadecimális számot és a felső 4 bit pedig mindig zérus legyen! A második sorban betöltjük a byte-ot a BL regiszterbe, majd a harmadik sorban az INT 21h megszakı́tás funkció kódját állı́tjuk be

az AH regizterben. Mivel kétszer kell kezelnünk a BL regisztert (alsó és felső négy bit) ezért az eredeti értéket a BL regiszterben tároljuk és majd a DL regisztert módosı́tjuk. Ezért a BL regiszter tartalmát átmásoljuk a DL regiszterbe a 4 sorban Mivel a számokat balról jobbra ı́rjuk, ezért először a magasabb helyiértékű biteket kell figyelembe venni, vagyis a felső 4 bitnek megfelelő számot kell kinyomtatni. Bár ez igaz, de azt is figyelembe kell venni, hogy a 93 program az alsó négy bittel dolgozott. Ezért nincs más teendőnk, mint a felső négy bitet “eltolni” az alsó négy bitbe. Sokféleképpen lehet ezt megtenni, de a legegyszerűbb bitléptető utası́tást használni A bitléptető utası́tások közül az SHR utası́tás diagramja a 7.7 ábrán látható Fontos, hogy ez az utası́tás a jobbra léptetés során balról nullákat léptet be, vagyis a felső 4 bitet

lenullázza. Miután az alsó 4 biten van a kinyomtatandó hexadecimális számjegy, a 9.3 programot lehet használni a nyomtatásra (A 93 program jelölve van a 9.5 táblán) A 13. sorban helyreállı́tjuk a DL regiszter értékét a BL regiszterből (Itt kell megjegyezni, hogy természetesen a szam cimről újra betölthetnénk az értéket, de itt néhány órajel ciklust megtakarı́tva a BL regisztert használjuk mint gyors, időleges tárolóhely. Ha valamiért mégis szükségünk lenne a BX regiszterre a programban, például cı́mzésnél, akkor természetesen célszerűbb lenne a szam cı́mről betölteni az értéket a DL regiszterbe.) A második szám kinyomtatásánál csak az alsó 4 bitre van szükségünk. Igen ám, de figyelni kell arra, hogy a felső 4 bit is ott van byte-ban A 93 program feltételezi, hogy a felső 4 bit zérus. Ennek elérésére “maszkolást” fogunk használni, vagyis a felső

4 bitet ki kell nullázni, úgy hogy az alsó 4 bit értéke ne változzon. A maszkolás a 14 sorban az AND utası́tással valósı́tsjuk meg. A 0Fh hexadecimális szám binárisan 00001111b és ezt használjuk az AND utası́tással, vagyis ahol a bit értéke 1 ott a DL regiszter tartalma változatlan marad, ahol pedig nulla, ott a DL regiszter bitje biztos hogy zérus lesz. (Ez elég egyszerűen belátható, ha megnézzük az AND utası́tás igazság tábláját, lásd 7.2 tábla) Miután a DL regiszter megfelelően be van állı́tva, nincs más hátra mint kinyomtatni a 9.3 program szerint. Ez is jelölve van a 95 táblán) 95 Decimális 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Bináris 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 9.4 tábla: 4 biten ábrázolható számok bináris alakban 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 org 100h MOV BL, [szam] MOV AH, 02 MOV DL,

BL MOV CL, 4 SHR DL, CL ; ADD DL, 30h ; CMP DL, 3ah ; JL szam1 ; ADD DL, 07 ; szam1: ; INT 21h ; MOV DL, BL ; AND DL, 0Fh ; ADD DL, 30h ; CMP DL, 3ah ; JL szam2 ; ADD DL, 07 ; szam2: ; INT 21h ; INT 20h szam: db 0FFh bit léptetés jobbra --| | | elozo program | | --| DL helyreallitasa maszkolás --| | | elozo program | | --| 9.5 tábla: Egy byte hexadecimális formátumú kinyomtatására szolgáló program 96 9.4 Egy decimális számjegy ellenőrzött beolvasása és kinyomtatása A 9.6 program azt mutatja be, hogyan lehet megvizsgálni, hogy a beolvasott karakter számjegy-e Az érvényes karakterek tartománya: 0-9, melyek ASCII kódja egymás utáni az ASCII táblában, lásd A.1 táblázat. Bár a program számjegyeket fogad csak el, természetesen a programot könnyű úgy átı́rni, hogy más, egymás utáni karaktereket fogadjon el. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 org 100h ujra: MOV MOV INT MOV

INT CMP JB CMP JA MOV MOV INT INT AH, 9 DX, uzenet 21h AH,1 21h ; beolvasott karakter AL-ben AL, ’0’ ; also korlat hiba AL, ’9’ ; felso korlat hiba DL, AL ; nyomtatas elokeszitese AH, 2 21h 20h MOV MOV INT JMP DX, hiba str AH, 9 21h ujra hiba: uzenet: db 0Dh,0Ah,’Adjon meg egy szamot: $’ hiba str: db 0Dh,0Ah,’Ervenytelen karakter!$’ 9.6 tábla: Egy számjegy beolvasása és kinyomtatása A 3-5. sorokban egy üzenetet ı́runk ki a képernyőre a felhasználó számára A 6 és 7 sorban a INT 21h megszakı́tást használjuk, hogy egy karaktert beolvassunk a felhasználótól. A beolvasott karakter az AL regiszterbe kerül. A 8 sorban az AL regiszter tartalmát összehasonlı́tjuk a ‘0’ karakter ASCII kódjával. A CMP utastás beállı́tja a státusz regiszter bitjeit a két érték egymáshoz való viszonya alapján. Ezeknek a biteknek az állapotát vizsgálja meg a 9 sorban a JB utası́tás és ha az AL regiszter

tartalma kisebb mint a ‘0’ karakter ASCII kódja, akkor a hiba cı́mre ugrik a program. Ellenkező esetben a következő, 10., sorban folytatódik a program A 10 és 11 sorban az AL regiszter tartalmát a ‘9’ karakter ASCII kódjával hasonlı́tjuk össze és ha az AL regiszter tartalma nagyobb akkor szintén a hiba cı́mre ugrik a program. Ha az AL regiszter tartalma a megfelelő tartományban van, akkor a program a 12. sorban folytatódik A 12-14 sorok között csak annyi történik, hogy a megfelelő regiszterek tartalmát beállı́tjuk, olyan módon, hogy egy karaktert ki tudjunk nyomtatni a képernyőre. A 15. sorban kilépünk a programból A 16-19 sorok közötti utası́tások egy hiba üzenetet ı́rnak ki a képernyőre. A 20 sorban egy feltétel nélküli ugrással a program elejére ugrunk, hogy újra be lehessen olvasni egy karaktert. A 22 és 24 ssorban a karaktersorozat elején a 0Dh és 0Ah byte-ok azért vannak

megadva, hogy egy “sort emeljenek a képernyőn”, vagyis a következő sorba nyomtassuk ki a szöveget. (Próbáljuk ki a programot úgy, hogy ezeket a byte-okat kitöröljük.) 97 9.5 Egy karakter beolvasása és módosı́tása Ez a program egy karaktert olvas be és az utána következő karaktert nyomtatja ki. Az “a” betű helyett a “b” betűt, a “b” betű helyett a “c” beűt és ı́gy tovább. 1 2 3 4 5 6 7 8 org 100h MOV AH, 1 INT 21h MOV DL, AL INC DL MOV AH, 2 INT 21h INT 20h 9.7 tábla: Egy karakter beolvasása és az utána következő kinyomtatása A fenti programban semmilyen ellenőrzés nincs ı́gy a programot most kiegészı́tjük annak vizsgálatval hogy a bolvasott karakter tényleg kis betű-e. A programnak van még egy “rejtett” hibája: Mi történik ha a “z” betűt adjuk meg? Mivel a karakter számszerű értékéhez hozzáadunk egyet és a “z” betű ASCII kódja (ASCII

száma) 122 decimális vagy 7A hexadecimális ezért a program a 123-as ASCII kódú karaktert nyomtatja ki, a “{ karaktert. A 98 program ezt a problémát is kijavı́tja 98 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 org 100h MOV AH, 1 INT 21h MOV DL, AL CMP DL, ’a’ JB nem betu CMP DL, ’z’ JA nem betu JNE novel MOV DL, ’a’ JMP nyomtat novel: INC DL nyomtat: MOV AH, 2 INT 21h vege: INT 20h nem betu: MOV AH, 9 MOV DX, nem betu szoveg INT 21h JMP vege nem betu szoveg: db 10,13,’Nem betut adtal meg!$’ 9.8 tábla: Egy karakter beolvasása és az utána következő kinyomtatása 99 9.6 Öt karakter bolvasása és kinyomtatása fordı́tott sorrendben A 9.9 táblán látható program beolvas öt karaktert, ezeket eltárolja, majd fordı́tott sorrendben kinyomtatja a beolvasott karaktereket A program jó példa az regiszteres cı́mzésre (A cı́mzési módokat a 3.3 fejezet tárgyalja) A 2. sorban a CX

regiszter értékét 5-re állı́tjuk, mivel egy ciklusban fogjuk beolvasni a karaktereket és a CX regiszter lesz a ciklus változó. A 3 sorban a DI regiszterbe a tárolásra használt hely cı́mét töltjük be. Az 5 és 6 sorban az INT 21h megszakı́tással beolvasunk egy karaktert az AL regiszterbe A 7. sorban eltároljuk a beolvasott karaktert a DI regiszter által megadott cı́mre (Bár nincs megadva szegmens regiszter, de adat esetén automatikusan feltételezhetjük a DS szegmens regisztert, ı́gy a 7. sor a következő is lehetne: MOV [DS:DI], AL A 8. sorban a DI regiszter értékét 1-el növeljük meg, mivel minden karakter 1 byte méretű, ı́gy a következő karaktert majd a következő byte-on kell eltárolni. A 9 sorban található LOOP utası́tással valósı́tjuk meg a ciklust. Az utası́tás csökkenti a CX regiszter értékét 1-el és ha a regiszter nem nulla, akkor a megadott cı́mre ugrik, jelen esetben

újabb karaktert olvas be. A ciklus végén a 10. sor fog végrehajtódni, ahol a DI regiszter értékét 1-el csökkentjük Erre azért van szükség, mert az 5. karakter eltárolása után is megnöveljük a DI regiszter tartalmát, ı́gy az már egy hatodik karakterre mutatna, ami nem definiált a programban. Így a 10 sorban végrehajtott csökkentés után a DI regiszter megint az 5. karakterre fog mutatni, amit majd kinyomtatunk először A 11 sorban ismét a ciklus változót állı́tjuk be, mı́g a 12. sorban az INT 21h megszakı́tás funkciókódját adjuk meg. A cikluson belül a 14 sorban a DL regiszterbe töltjük be a karaktert amit a 15 sorban nyomtatunk ki. A 16 sorban a DI regisztert ismét csökkentjük, mivel fordı́tott sorrendben akarjuk kinyomtatni a karaktereket mint ahogy beolvastuk őket. A ciklust itt is a LOOP utası́tással valósı́tjuk meg 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 org 100h MOV

CX, 5 MOV DI, karakterek ujra: MOV AH, 1 INT 21h MOV [DI], AL INC DI LOOP ujra DEC DI MOV CX, 5 MOV AH, 2 nyomtat: MOV DL, [DI] INT 21h DEC DI LOOP nyomtat INT 20h karakterek: db 0,0,0,0,0 9.9 tábla: Öt karakter beolvasása és kinyomtatása fordı́tott sorrendben 100 9.7 Két egyjegyű szám összeadása A 9.10 program beolvas két decimális számjegyet, összeadja őket, majd az eredménynek megfelelő számú csillag (‘*’) karaktert nyomtat ki. A programban a számjegyek beolvasása kétszer szerepel. A kód ismétlés elkerülésére a legjobb lenne függvényt használni, de erről csak később lesz szó a 10. fejezetben Az első beolvasott számot a CL regiszterben tároljuk el a 13. sorban A második beolvasott számjegy az AL regiszterben alakul ki a 24. sorban A 25 sorban összeadjuk a két számot és az eredményt a CL regiszterben tároljuk el A 26. sorban a CH regisztert kinullázzuk, hogy a teljes CX regiszter

tartalmazza az eredményt és a LOOP utası́tást tudjuk használni. A karakterek nyomtatásának előkészı́tése a 27 és 28 sorban történik, mı́g a nyomtatási ciklus a 30. és 31 sorban található A 9.11 program egy másik lehetőséget mutat a program megvalósı́tására Ebben a programban a beolvasást egy ciklussal végezzük el. Mivel a ciklushoz szükség van a CL regiszterre ezért a beolvasott számokat itt a memóriában tároljuk el. Ebben a programban a számok összeadását a 21 és 22 sorban végezzük el, majd a nyomtatást az előzőekhez hasonlóan, ciklussal oldjuk meg. 101 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 org 100h szam 1: MOV AH, 9 ; elso szam bekerese MOV DX, uzenet INT 21h MOV AH, 1 INT 21h CMP AL, ’0’ JB nem szam 1 CMP AL, ’9’ JA nem szam 1 SUB AL, ’0’ ; karakterbol szam MOV CL, AL ; karakter

tárolasa szam 2: MOV AH, 9 ; masodik szam bekerese MOV DX, uzenet INT 21h MOV AH, 1 INT 21h CMP AL, ’0’ JB nem szam 2 CMP AL, ’9’ JA nem szam 2 SUB AL, ’0’ ; karakterbol szam ADD CL, AL ; osszeadas XOR CH, CH MOV AH, 2 ; nyomtatas elokeszitese MOV DL, ’*’ ujra: INT 21h LOOP ujra INT 20h nem szam 1: MOV AH, 9 MOV DX, nem szam szoveg INT 21h JMP szam 1 nem szam 2: MOV AH, 9 MOV DX, nem szam szoveg INT 21h JMP szam 2 uzenet: db 0Dh,0Ah,’Adjon meg egy szamot: $’ nem szam szoveg: db 10,13,’Nem szamot adtal meg!$’ 9.10 tábla: Két szám összeadása és az eredmény kinyomtatása 102 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 org 100h MOV DI, szamok MOV CL, 0 szam be: MOV AH, 9 ; elso szam bekerese MOV DX, uzenet INT 21h MOV AH, 1 INT 21h CMP AL, ’0’ JB nem szam CMP AL, ’9’ JA nem szam SUB AL, ’0’ MOV [DI], AL INC DI INC CL CMP CL, 2 JNE szam be ; olvasas vege MOV CL,

byte [szamok] ADD CL, byte [szamok+1] XOR CH, CH MOV AH, 2 ; nyomtatas elokeszitese MOV DL, ’*’ ujra: INT 21h LOOP ujra INT 20h nem szam: MOV AH, 9 MOV DX, nem szam szoveg INT 21h JMP szam be szamok: db 0, 0 uzenet: db 0Dh,0Ah,’Adjon meg egy szamot: $’ nem szam szoveg: db 10,13,’Nem szamot adtal meg!$’ 9.11 tábla: Két szám összeadása és az eredmény kinyomtatása ciklussal 103 9.8 Egy karakter n-szeri kinyomtatása A 9.12 táblán látható program beolvas egy karaktert, utána egy decimális számjegyet és az elsőként beolvasott karaktert annyiszor nyomtatja ki, amekkora a másodiknak beolvasott szám volt. A program mostanra talán nem igényel magyarázatot, mivel minden részlete eddig már szerepelt egy korábbi programban. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 org 100h MOV AH, 9 MOV DX, uzenet1 INT 21h MOV AH, 1 INT 21h MOV [karakter], AL olvas:

MOV AH, 9 MOV DX, uzenet2 INT 21h MOV AH, 1 INT 21h CMP AL, ’0’ JB hiba CMP AL, ’9’ JA hiba SUB AL, ’0’ XOR CX, CX MOV CL, AL MOV AH, 9 ; uj sor nyomtatasa MOV DX, ujsor INT 21h MOV AH, 2 ; karakter sorozat nyomtatasa MOV DL, [karakter] nyomtat: INT 21h LOOP nyomtat INT 20h hiba: MOV AH, 9 MOV DX, uzenet nem szam INT 21h JMP olvas ujsor: db 10, 13, ’$’ karakter: db 0 uzenet1: db 10, 13, ’Adjon meg egy karaktert: $’ uzenet2: db 10, 13, ’Adjon meg egy számjegyet: $’ uzenet nem szam: db 10, 13, ’Nem számjegyet adott meg!’ 9.12 tábla: Egy karakter n-szeri kinyomtatására szolgáló program 104 9.9 Téglalap kinyomtatása A 9.13 és 914 táblákon bemutatott program beolvas két egyjegyű számot ellenőrzéssel, a sorok és oszlopok számát, majd a számoknak megfelelő méretű téglalapot nyomtat ki a képernyőre. A program igazából nem túl bonyolult, de az üzenetek nyomtatása és az ellenőrzések miatt

olyan hosszú lett, hogy két táblán kerül bemutatásra. A program speciális abban az értelemben, hogy ez a program nem “lineáris”. Ez azt jelenti, hogy a 2. sorban már rögtön 19 sorra ugrunk és ott folytatódik a program végrehajtása A 2 és 19 sor közé bekerült néhány adat, illetve a hiba kezelő programrészletek is. Itt ez jelenti azt, hogy a program nem lineáris, nem csak fentről, lefelé fut a program és adat is beékelődik a programba. A 20-22. sorokban egy üzenete ı́runk ki a felhasználónak, majd a 23 és 24 sorokban beolvasunk egy karaktert. A 25 és 28 sorok között ellenőrizzük, hogy a beolvasott karakter számjegy-e Ha nem számjegyet olvastunk be, a program egy hibaüzenetet ı́r ki és újra megpróbál beolvasni egy számjegyet. A 29. sorban a beolvasott számjegy ASCII kódját számmá konvertáljuk és eltároljuk a CH regiszterben A 32-34. sorokban egy újabb üzenetet ı́runk

ki, majd ismét egy karaktert olvasunk be a 35 és 36 sorban. A 37-40 sorok között ismét ellenőrzést hajtunk végre, hogy a beolvasott karakter szám-e Érdemes megfigyelni, hogy a két beolvasásnál külön hiba üzenet nyomtató részt használtunk: hiba1 és hiba2. Miért? Ez azért van, mert ha csak egy hibaüzenet nyomtató programrészlet lenne, akkor a hiba üzenet kinyomtatása után két különböző helyre kellene valahogy visszatérnie. Egyszer a hiba1 cı́mre, máskor pedig a hiba2 cı́mre. Természetesen ezt nem lehet A függvényeknél majd látni fogjuk, hogy ezt hogyan lehet megvalósı́tani, de itt most azt az egyszerű megoldást használjuk, hogy a kódot megismételjük. A másodszorra beolvasott értéket a BL regiszterben tároljuk el. A téglalap nyomtatását a 914 tábla mutatja be. A 46-48. sorokban csak egy soremelést nyomtatunk A 50 sorban beállı́tjuk a karakter nyomtatási funkció

kódot és az 51. sorban a nyomtatandó karaktert adjuk meg Az 52 sorban a CL regiszterbe átmásoljuk a BL regiszter tartalmát, az oszlopok számát. A CL regiszter lesz az egyik ciklus változó A másik ciklus változó a CH regiszter. Miért kell két ciklus változó? Nézzük meg a következő C kódot, ami egy téglalapot nyomtat ki: for(ch = n; ch > 0; ch--) { for(cl = m; cl > 0; cl--) { printf(’’o’’ } printf(’’ ’’ } A fenti kódban az látható, hogy van egy belső és egy külső ciklus. Ezeket jelöli a belso és kulso cı́m az assembly programban. Az is látható, hogy amikor a belső ciklus elkezdődik a CL regisztert mindig újra kell inicializálni. Ez történik a 52 sorban, amikor a CL regiszterbe átmásoljuk a BL regiszter tartalmát. (A BL regiszter tartalma nem változik meg a nyomtatás során) A belső ciklusban a 54. sor végzi a nyomtatást A 55 sor végzi a ciklus változó

csökkentését, majd a 56. sor valósı́tja meg a feltételes ugrást Ha a CL regiszter tartalma a csökkentés után nem zérus, akkor megismételjük a nyomtatást, mivel a belso cı́mre ugrik a program. Ha zérus lett a CL regiszter, akkor a 57. sorban folytatódik a program futása A 57-59 sorokban egy soremelést nyomtatunk ki Mivel itt megváltozik a funkció kód az AH regiszterben, ezért kell az 50. sorban ismét beállı́tani a karakter nyomtató funkció kódot. A 60 és 61 sorok valósı́tják meg a külső ciklust A 62 sorban lépünk ki a programból. 105 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 org 100h JMP olvas1 hiba1: MOV AH, 9 MOV DX, uzenet nem szam INT 21h JMP olvas1 hiba2: MOV AH, 9 MOV DX, uzenet nem szam INT 21h JMP olvas2 uzenet nem szam: db 10, 13, ’Nem számjegyet adott meg!’ uzenet1: db 10, 13, ’Adja meg a sorok szamat: $’

uzenet2: db 10, 13, ’Adja meg az oszlopok szamat: $’ olvas1: MOV AH, 9 MOV DX, uzenet1 INT 21h MOV AH, 1 INT 21h CMP AL, ’0’ JB hiba1 CMP AL, ’9’ JA hiba1 SUB AL, ’0’ MOV CH, AL olvas2: MOV AH, 9 MOV DX, uzenet2 INT 21h MOV AH, 1 INT 21h CMP AL, ’0’ JB hiba2 CMP AL, ’9’ JA hiba2 SUB AL, ’0’ MOV BL, AL ; folytatódik . 9.13 tábla: Egy téglalap kinyomtatására szolgáló program első része 106 45 ; nyomtatas itt kezdodik 46 MOV AH, 9 ; uj sor 47 MOV DX, ujsor 48 INT 21h 49 kulso: 50 MOV AH, 2 51 MOV DL, ’o’ 52 MOV CL, BL 53 belso: 54 INT 21h 55 DEC CL 56 JNE belso 57 MOV AH, 9 58 MOV DX, ujsor 59 INT 21h 60 DEC CH 61 JNE kulso 62 INT 20h 63 ujsor: 64 db 10, 13, ’$’ 9.14 tábla: Egy téglalap kinyomtatására szolgáló program második része 107 9.10 Sakktábla nyomtatása Ez a program tulajdonképpen nagyon hasonlı́t a téglalap nyomtató programhoz (9.9 fejezet), de itt nem egyféle karaktert kell nyomtatni,

hanem felváltva különböző karaktereket. A 915 program mutatja be a sakktábla nyomtatását megvalósı́tó assembly program. Ebben a programban is két egymásba ágyazott ciklus van. Az egyik ciklus változó a BX regiszter, mı́g a másik a CX regiszter. Bár a program 8x8-as téglalapot nyomtat ki, de a CX regiszter kezdeti értéke csak 4. Ez azért van mert négy darab dupla karaktert nyomtatunk ki egy sorba: vagy XO vagy OX karaktereket. Azért van kétféle dupla karakter, mivel az egyiket a páros a másikat a páratlan sorokba nyomtatjuk. A 7 sorban vizsgáljuk meg, hogy a sor száma, BX regiszter, páros-e Hogyan csináljuk? A 7. sorban a TEST utası́tás egy maszkolást végez és a legkisebb helyiértékű bitet tartja meg a BX regiszterből. Ez azért elegendő, mivel a felsőbb bitek minden kettő hatványai azok csak párosak lehetnek, ezért a legalsó bit az ami eldönti, hogy a BX-ben tárolt érték páros

vagy páratlan. Ha a legkisebb helyiértékű bit 1 akkor a BX regiszter tartalma páratlan, ha zérus, akkor páros. Miután eldőlt, hogy páros vagy páratlan sort nyomtatunk, kinyomtatjuk a két megfelelő karaktert a belső ciklusban. A belső ciklus a 6 és 21 sor között van A 22 és 26 sorok között csak egy sor emelést nyomtatunk. A 27 sorban csökkentjük a BX regisztert, a külső ciklus ciklusváltozóját és ha nem zérus akkor a 28. sorban a külső ciklus elejére ugrunk 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 org 100h mov bx, 8 mov ah,2 kulso: mov cx, 4 belso: test bx,1 jz paros paratlan: ; ez a cim igazábol nem kellene mov dl,’O’ int 21h mov dl,’X’ int 21h jmp ciklus paros: mov dl,’X’ int 21h mov dl,’O’ int 21h ciklus: loop belso ; uj sor mov dl, 0dh int 21h mov dl, 0ah int 21h dec bx jnz kulso int 20h 9.15 tábla: Egy sakktábla kinyomtatására szolgáló program

108 Ez a sakktábla nyomtatási feladat arra is jó, hogy a XOR utası́tás egy másik jellemző alkalmazását is bemutassuk. Két értékre alkalmazva a XOR utası́tást egy harmadik értéket fogunk kapni a 74 táblázat szerint. Ha újra alkalmazzuk ugyanazt a XOR utası́tást az eredményre, akkor az eredeti értéket kapjuk vissza. Nézzünk erre egy példát: MOV XOR XOR XOR XOR AL, AL, AL, AL, AL, 33h 11h 11h 11h 11h ; ; ; ; ; AL AL AL AL AL = = = = = 33h !!! 22h 33h !!! 22h 33h !!! A XOR utası́tásnak ezt a tulajdonságát használja ki a 9.16 program A 6 sorban a nyomtatandó karaktereket össze-XOR-oljuk, (amiből kapunk valamilyen értéket) de ezután ezt az értéket újra XORolva az egyik karakterrel, hol az egyik, ‘X’, hol a másik, ‘O’, karaktert kapjuk meg a 10. sorban Ebben a programban is a BX regiszter a külső ciklusváltozó és a CX regiszter a belső ciklusváltozó, aminek viszont 8 a

kezdeti értéke, mivel itt egyesével nyomtatjuk ki a karaktereket. A belső ciklus után a 13 sorban elmentjük a DX regiszter tartalmát, mert a soremelés nyomtatásnál tönkretesszük a regiszter tartalmát. A 14-17 sorokban nyomtatjuk ki a soremelés karaktereket és a 18 sorban visszaállı́tjuk a DX regiszter tartalmát. A 21. sor szorul még magyarázatra Nézzük meg a következő két sort: XOXOXOXO OXOXOXOX Azt lehet látni, hogy a második sort ugyanazzal a karakterrel kell kezdeni, mint amivel az első sort lezártuk. A 21 sor ezt biztosı́tja, hogy a XOR utası́tás alkalmazásával a ‘X’ karaktert “átugorjuk” Végül a 22. és 23 sor a külső ciklust valósı́tja meg 109 1 org 100h 2 mov ah,2 3 mov bx, 8 4 mov dl, ’X’ 5 mov dh, ’O’ 6 xor dh, dl 7 kulso: 8 mov cx, 8 9 belso: 10 xor dl,dh 11 int 21h 12 loop belso 13 mov bp, dx ; elmenti DX-et 14 mov dl, 0dh ; új sor nyomtatása 15 int 21h 16 mov dl, 0ah

17 int 21h 18 mov dx, bp ; visszaállitás DX-et 19 ; mivel ugyanazzal a karakterrel 20 ; folytatódik a következö sor 21 xor dl,dh 22 dec bx 23 jnz kulso 24 int 20h 9.16 tábla: Egy sakktábla kinyomtatására szolgáló program XOR utası́tással 110 9.11 ASCII tábla kinyomtatása A 9.17 táblán látható program az ASCII táblában található karaktereket nyomtatja ki a képernyőre A program igen egyszerű. A 2 sorban adjuk meg, hogy 256 darab karaktert fogunk kinyomtatni A 3 sorban megadjuk az első karakter ASCII kódját. A 4 sorban az INT 21h megszakı́tás funkció kódját adjuk meg. A 6 sor végzi a nyomtatást, majd a 7 sorban a DL regiszter megnövelésével a következő ASCII karaktert állı́tjuk be. A 8 sor csökkenti a CX regiszter tartalmát eggyel és ha még nem zérus, akkor az ujra cı́mre ugrik. A LOOP utası́tás segı́tségével képezzük a ciklust mely 256-szor fut le Az utolsó sorban

kilépünk a programból. 1 2 3 4 5 6 7 8 9 org 100h MOV CX, 256 MOV DL, 0 MOV AH, 2 ujra: INT 21h INC DL LOOP ujra INT 20h 9.17 tábla: Az ASCII tábla kinyomtatására szolgáló program 111 9.12 Szám kiı́rása decimális formában Ha egy számot decimális formában akarunk kinyomtatni, speciális nyomtatási eljárást kell alkalmazni. A 9.18 program erre mutat egy példát Az algoritmus lényege, hogy a számot mindig 10-el osztjuk és az osztás maradéka mindig egy decimális számjegyet ad, hiszen a maradék 0 és 9 közötti lehet. Nézzünk egy példát: 152 / 10 -> 15 és a maradék: 2 15 / 10 -> 1 és a maradék: 5 1 / 10 -> 0 és a maradék: 1 Amint ez látható tényleg a szám számjegyeit kapjuk meg, de fordı́tott sorrendben. Ezt is figyelembe kell venni az algoritmusnál. A 2. sorban az AX regiszterbe töltjük be azt a számot amit decimális formában szeretnénk kinyomtatni Érdemes arra is

gondolni, hogy mivel az AX regiszter 16 bites regiszter ezért 21 6 = 65536 féle számot tud csak tárolni, ahol a legkisebb szám a nulla és a legnagyobb szám a 65535. Erre az információra azért van szükség, mivel ı́gy már tudjuk, hogy maximum 5 számjegyet kell majd kinyomtatni. Ezt mutatja a 18 sorban az szamstr változó definı́ciója, ami 5 darab SPACE karaktert tartalmaz és a végén egy dollár jelet ($). A dollár jel azért kell a végére, hogy majd egyben tudjuk a számokat kinyomtatni az INT 21h megszakı́tással. A 3 sorban az SI regiszterbe azt a cı́met töltjük be ami az utolsó SPACE karakterre mutat a szamstr változóban. Az 5 sorban adjuk meg az osztót A 6. sorban azt készı́tjük elő, hogy majd az DX:AX számot osztjuk egy 16 bites regiszterrel és ı́gy majd az eredmény is egy 16 bites regiszterbe kerül. Az osztást a 7 sorban végezzük el A hányados az AX regiszterbe, a maradék a DX

regiszterbe kerül A maradék csak 0 és 9 közötti szám lehet A nyomtatáshoz a számot ASCII karakterré kell konvertálni, vagyis a számhoz hozzáadjuk a ‘0’ karakter ASCII kódját. A 8. sor után a DL regiszter tartalma a 30h és 39h értékek közötti szám lesz, mely megfelel a 0 és 9-es számok ASCII kódjának. A 9 sorban eltároljuk az ASCII kódot az SI regiszter által megadott helyre A 10. sorban az SI regisztert azért csökkentjük eggyel, hogy a következő karaktert az előző elé ı́rjuk A 11. sor a leállı́tási feltétel Itt azt vizsgáljuk, hogy a hányados zérus-e, vagyis nincs további számjegy amit konvertálni kellene. A 12 sor tartalmazza a feltételes ugrást, ami az ujra cı́mre ugrik ha ha van még szám amit konvertálni kell. Ha a hányados zéros, AX regiszter tartalma zérus, akkor nincs más hátra mint kinyomtatni az eltárolt számokat. A program olyan értelemben trükkös,

hogy a szamstr változó alap esetben SPACE karaktereket tartalmaz, és ı́gy ha csak két jegyű számot tárolunk el, azért még a program jól fog működni, mivel ebben az esetben a program legfeljebb 3 SPACE karaktert nyomtat a számok előtt. 112 1 org 100h 2 MOV AX, 54321 3 MOV SI, szamstr 4 ujra: 5 MOV BX, 10 ; 6 MOV DX, 0 ; 7 DIV BX ; 8 ADD DL, ’0’ ; 9 MOV [SI], DL ; 10 DEC SI ; 11 CMP AX, 0 12 JNZ ujra 13 MOV AH, 9 14 MOV DX, szamstr 15 INT 21h 16 INT 20h 17 szamstr: 18 db ’ ’,’$’ + 4 10-es osztassal valasztunk le egy jegyet DX:AX az osztando szam, BX az oszto hanyados -> AX, maradek -> DX szamjegy karakterre eltaroljuk visszafelé tároljuk 9.18 tábla: Szám kiı́rása decimális formában 113 9.13 Olvasás a memóriából A 9.19 program arra mutat egy példát, hogyan lehet a memóriában, egy fix cı́men lévő byte-ot megcı́mezni, illetve azt vizsgálni, hogy annak a byte-nak valahányadik bitje 1-e. A

0:417-es cı́men található byte ı́rja le a billentyűzet LED-ek állapotát. Például ha a 7 bit értéke 1, akkor a CAPS LOCK be van kapcsolva. Az alábbi program azt fogja vizsgálni, hogy a CAPS LOCK be van-e kapcsolva és annek megfelelő üzenetet fog kiı́rni. A 2. és 3 sorban az ES szegmens regiszterbe a zérus szegmens cı́met töltjük Mivel szegmens regiszterbe nem lehet közvetlenül értéket tölteni, ezért használjuk az AX regisztert. A 4 sorban direkt módon, szegmens regiszterrel együtt adjuk meg a vizsgálandó byte cı́mét. A byte-ot betöltjük a BL regiszterbe. Az 5 sor egy maszkolást hajt végre Lényegében a 40h = 0100 0000b értékkel és mivel az AND utası́tást használjuk ezért a művelet után csak a 7. bit értéke marad meg Például: 0101 1001 <- BL AND 0100 0000 <- Maszk -------------0100 0000 Ez azt jelenti, hogy az 5. sor után a BL regiszter értéke vagy zérus vagy pedig 40h

lesz Ezt a feltételt használja ki a 6. sorban a feltételes ugrás (Nem kell külön összehasonlı́tó utası́tás, CMP, mivel az AND utası́tás már megfelelően beállı́tja a Zérus bitet, ZF.) Mivel csak egy üzenetet akarunk kinyomtatni és csak a nyomtatandó üzenet más ezért attól függően hogy a zérust kaptunk-e a DX regiszterbe más cı́met töltünk. Fontos lehet még kiemelni a 8 sorban a feltétel nélküli ugrást, JMP Erre azért van szükség, mert miután beállı́tottuk a DX regiszter tartalmát a 7. sorban, már csak nyomtatni kell és nem szabad engedni hogy a DX regiszter tartalmát felülı́rjuk. Ha nincs a feltétel nélküli ugrás akkor pedig ez történne, mivel a 9. sorban folytatódna a program A 12. sortól már ugyanazt kell csinálni mind a két esetben, beállı́tani a funkció kódot az INT 21h megszakı́tásnak, meghı́vni a megszakı́tást, majd kilépni a programból. 1 2

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 org 100h mov mov mov and jnz mov jmp ax,0 es,ax bl,[es:417h] bl, 40h eg dx,kikapcs kiir eg: mov dx,bekapcs kiir: mov ah,9 int 21h int 20h kikapcs: db ’Ki van kapcsolva$’ bekapcs: db ’Be van kapcsolva$’ 9.19 tábla: CAPS LOCK állapotának nyomtatására szolgáló program 114 0.bit 1.bit 2.bit 3.bit 4.bit 5.bit 6.bit 7.bit az előtér kék szı́nösszetevője az előtér zöld szı́nösszetevője az előtér piros szı́nösszetevője az előtér intenzitása a háttér kék szı́nösszetevője a háttér zöld szı́nösszetevője a háttér piros szı́nösszetevője a villogás ki-bekapcsolása (a bit 1 értékénél villog) 9.20 tábla: A képernyő byte attribútumának bitjei 9.14 Közvetlen videó memóriába ı́rás Lehetőség van arra, hogy egy program közvetlenül a videokártya memóriájába ı́rjon adatot és ilyen módon közvetlenül a

képernyőre ı́rjunk. Ehhez persze tudnunk kell, hogy melyik szegmensen kezdődik a képernyő memória, vagyis hova van leképezve a videokártya memóriája. Általában a 0B800h a szegmens cı́me, kivéve például a Herkules video kártya (ma már nem használják ezt a kártyát). Tehát a 0B800h a szegmens cı́met fogjuk használni a 80x25 karakteres szöveges képernyő esetén. A nyomtatáshoz még azt is tudnunk kell, hogy milyen a képernyő felépı́tése. Minden megjelenı́tett karakterhez két byte tartozik: az egyik byte maga a karakter, a másik byte pedig a karakter attribútuma. Az attribútum a karakter szı́nét, intenzitását és villogását jelenti a 9.20 táblázat szerint A képernyő bal felső sarkához tartozik a zérus oszlop és zérus sor karakter pozı́ció. Hogyan lehet egy tetszőleges pozı́ciójú karaktert kinyomtatni? 115 9.15 Szöveg beolvasása Karakterenként olvasunk.

ESC-re vége Az INT 21 előkészı́tése és használata. 116 9.16 Beolvasott szövegben karakterek számlálása 117 9.17 Beolvasott szöveg nagy betűsre konvertálása 118 9.18 Feladatok 1. Írjunk programot, mely megszámolja, hogy egy byte-ban hány darab 1-es értékű bit van 2. Írjunk programot, mely bekér egy decimális számjegyet A számjegyről eldönti, hogy nagyobb-e mint öt és ennek megfelelő üzenetet ı́r ki: “Nagyobb mint öt”, “Kisebb mint öt”, “Egyenlő öttel”. 119 120 10. Fejezet Függvények 10.1 A verem adatszerkezet A verem tulajdonképpen egy LIFO (Last In First Out) adatszerkezet. Ez azt jelenti, hogy az utoljára elltárolt értéket olvashatjuk ki legelőször. A vermet angolul stack-nek is szokták nevezni Ha analógiát keresünk a verem adatszerkezetre, akkor talán egy raktárat képzelhetünk el. A padló a legalsó szint, amire tehetünk egy dobozt,

amire újabb dobozt tehetünk és ı́gy tovább. Ha a legfelső dobozra van szükségünk, akkor csak levesszük a kupac tetejéről. Ezzel szemben, ahhoz hogy a legalsó dobozt kivegyük, az összes többi felette levő dobozt le kell emelni. Amint látható egy verem esetén mindig csak a tetejéhez férünk hozzá (top-of-stack, TOS). A verembe helyezés műveletét PUSH-nak, a verem tetejéről való kivételt pedig POP-nak szoktuk nevezni. A 101 ábra bemutatja a verem egyszerűsı́tett működését. 10.11 A verem implementációja Az x86-os architektúra esetén a verem a memóriában található. Erre fontos lesz emlékezni később, mivel ezek szerint a vermet kezelhetjük LIFO adatszerkezetként, de mint véletlen hozzáférésű adatszerkezetként is! Mivel a verem a memóriában van ezért a megvalósı́tásához az SS szegmens és SP regisztert kell használni. Ez a regiszter páros (SS:SP) mutat mindig a

verem tetejére Az SS szegmens regiszter a verem szegmensének a cı́mét határozza meg, mı́g az SP regiszter a szegmensen belül adja meg a verem tetejének az offszetjét. Az 102a ábra azt mutatja, hogy az eddigiek alapján hogyan képzelhetjük el a vermet x86-os architektúra esetén. Sajnos ez a kép helytelen Az x86-os architektúra esetén a verem helyes képe a 10.2b ábrán látható Ezek alapján a verem adatszerkezet legfontosabb tulajdonságai: • Csak word méretű adat tölthető fel a veremre. Byte önmagában nem • A verem a magasabb memória cı́mtől az alacsonyabb memória cı́m felé “növekszik”. Ez a 102b ábra alapján azt jelenti, hogy a verem lefelé “növekszik”. 10.1 ábra: A verem működése 121 (a) (b) 10.2 ábra: a) A verem adatszerkezet helytelen képe b) A verem adatszerkezet valódi képe x86-os architektúrán. (a) (b) (c) 10.3 ábra: a) A verem elméleti képe üres

állapotban b) A verem állapota FEABh érték tárolása után c) A verem állapota 1234h érték tárolása után. • Az SS:SP regiszter páros mindig az utoljára eltárolt elemre mutat. Pontosabban az utoljára eltárolt szó (word) alsó byte-jára. A 10.3a ábra azt mutatja, hogy amikor a verem üres, akkor a verem hogyan néz ki “elméletileg” A 10.3b és 103c ábra azt mutatja, mi történik amikor adatokat teszünk a verembe Egy word feltöltése során először az SP regiszter értékét 2-vel csökkentjük majd a word-öt eltároljuk az SS:SP által mutatott memória cı́men. Amikor egy word-öt kiveszünk a veremből, először kimásoljuk az értéket az SS:SP által mutatott cı́mről, majd az SP regiszter értékét 2-vel csökkentjük. Itt kell megjegyeznünk, hogy a 10.3a ábra valóban csak elméleti képe a verem üres állapotának A magyarázathoz tegyük fel, hogy a veremben egy

érték, egy szó (word) van eltárolva. Amikor csak egy elem van a vermen akkor az SP regiszter értéke FFFEh. Amikor ezt az értéket kivesszük a veremből, akkor az SP regisztert meg kell növelni 2-vel. Ebben az esetben az SP értéke 10000h, ami nagyobb mint amit 16 biten tárolni lehetne, ı́gy az SP regiszter valójában a 0000h értéket tárolja majd. Ez azt jelenti, hogy a regiszter értéke “körbefordul” (wrap around) és az SP regiszter a szegmens elejére fog mutatni. 122 10.12 Verem műveletek Az x86-os architektúrán többféle utası́tás is létezik a verem kezelésére. Az alapvető verem műveleteknek mint push és pop van megfelelő assembly utası́tása: PUSH és POP. (Lásd 717 és 7110 bekezdés) További assembly utası́tások, melyek a vermet kezelik: • PUSHF (7.18 bekezdés) • PUSHA (7.19 bekezdés) • POPF (7.111 bekezdés) • POPA (7.112 bekezdés) 10.2 A verem használata A veremnek

több haszna is van az assembly nyelvben: • értékek időleges tárolása • paraméterátadás függvényeknek • lokális változóknak memória terület • vezérlés átadás 10.21 Értékek időleges tárolás A verem jól használható arra, hogy változókat és értékeket időlegesen eltároljunk. Például vegyük azt az esetet, hogy két változót fel akarunk cserélni: xchg [valtozo1], [valtozo2] Sajnos ez nem működik, mivel egy utası́tás kétszer nem férhet hozzá a memoriához. Az egyik megoldás a következő lehet: mov mov mov mov ax, [valtozo1] bx, [valtozo2] [valtozo1], bx [valtozo2], ax de ekkor két regisztert is használnunk kell és 4 memória műveletet végzünk. Ez a megoldás gondot jelenthet, mivel a végrehajtásához találnunk kellene 2 szabad regisztert, és sokszor problémás lehet egy programban. De mi van akkor, ha a fenti példában az AX és BX regiszterek

értékeire a csere után is szükség van? A megoldás az, hogy időlegesen el kell menteni az értéküket, el kell végezni a műveletet, majd helyre kell állı́tani a regiszterek értékét. ; mentsük el a regisztereket push ax push bx ; végezzük el a cserét mov ax, [valtozo1] mov bx, [valtozo2] mov [valtozo1], bx mov [valtozo2], ax 123 ; állı́tsuk helyre a regisztereket pop bx pop ax Bár ez a megoldás működik, de szükséges néhány megjegyzést tenni: 1. Először is a fenti megoldásban nyolcszor férünk hozzá a memóriához Ne felejtsük, hogy a verem műveletek is hozzá férnek a memóriához. 2. Másodszor, fontos észre venni, hogy ha a regiszterek eredeti értékét szeretnénk visszakapni, akkor amilyen sorrendben a regisztereket elmentjük a vermen azzal ellentétes sorrendben kell helyreállı́tani a regisztereket. Egy másik példa az időleges tárolásra: push dx push bx push cx . ;

utası́tások pop cx pop bx pop dx 3. Harmadszor, létezik egy elegánsabb megoldás a változók cseréjére push push pop pop [valtozo1] [valtozo2] [valtozo1] [valtozo2] Ebben a megoldásban pont az előző szabályt sértjük meg, de szándékosan, mivel ı́gy pontosan azt a hatást érjük el, hogy a regiszterek értékei felcserélődnek. Ezen kı́vül az is érdekes itt, hogy a fenti POP utası́tások kétszer férnek hozzá a memóriához, hiszen a veremből (memóriából) olvasunk és az argumentumban megadott memória cı́mre ı́runk. A POP utası́tás egy kivétel a szabály alól, vagyis hogy általában egy utası́tás nem férhet hozzá kétszer a memóriához. A másik kivétel ez alól a szabály alól a szöveg kezelő műveletek lesznek (lásd 12. fejezet) Nagyon fontos megérteni a fenti listában a 2. és 3 pont közötti különbséget Ebből a bekezdésből is jól látható, hogy a

verem mérete folyamatosan növekszik és csökken a program futása során. A paraméter átadást, lokális változók kezelését és vermen keresztüli vezérlés átadást a következő fejezetben tárgyaljuk. 10.3 Függvények definı́ciója A függvények önálló logikai program egységek amelyek valamilyen konkrét feladatot végeznek el. A függvényeket szokták alprogramnak is nevezni és nagyon fontos szerepet játszanak a moduláris program fejlesztésben. Bár bizonyos programozási nyelvek különbséget tesznek függvények és procedurák között, az assembly programozási nyelvben erre nincs szükség. Az assembly programozási nyelvben csak függvényeket definiálhatunk, amelyeknek paramétereket adhatunk át és kaphatunk vissza értéket. Ez a felfogás nagyban hasonlı́t a C programozási nyelvhez. Nagyon egyszerű definiálni egy függvényt assembly-ben. Két utası́tásra van

szükség: CALL (lásd 7.57 bekezdés) és RET (lásd 758 bekezdés) utası́tásokra Nézzünk egy egyszerű példát: 124 org 100h xor ax, ax call fvg int 20h fvg: add ax, 2 ret Ebben a példában a függvény neve fvg. Más assemblerekkel ellentétben, ahol speciálisan kell egy függvényt definiálni a NASM assembler esetén igen egyszerűen csak egy memória cı́met kell megadni, ami a függvény eleje és a végére egy RET utası́tás kell. Érdemes megvizsgálnunk a függvények működését is. A CALL utası́tás végrehajtása során, mivel a CALL utası́tás már betöltődött az utası́tás “értelmezőbe” ezért az IP regiszter a következő utası́tásra mutat, ahol a programnak folytatnia kell a működését miután a függvény lefutott. Erre a processzor úgy fog emlékezni, hogy ezt a cı́met elmenti a veremre. Ezután a CALL utası́tás a megadott cı́mre adja át a

vezérlést, vagyis az IP regiszter értékét megváltoztatja. Nézzük meg az előző példából generált gépi kódot: xxxx:0100 31C0 xxxx:0102 E80200 xxxx:0105 CD20 xxxx:0107 050200 xxxx:010A C3 org 100h xor ax, ax call fvg int 20h fvg: add ax, 2 ret Látható, hogy a CALL fvg utası́tásból E8 02 00 gépi kód keletkezik. Az E8-as érték adja meg az utası́tás kódját és a következő két szám pedig az fvg szimbólikus cı́mnek felel meg. A 02 00 értékek viszont nem felelnek meg a 107-es cı́mnek. Mi történik itt? Arról van szó, hogy a CALL utası́tás képes közeli és távoli ugrásra is. Amikor a CALL utası́tás és a függvény egy szegmensen belül van, akkor elegendő csak az offszetet megadni. A szegmens regiszterre nincs szükség. Ez látható a jelenlegi példában is, bár itt az fvg szimbólikus cı́mből nem konkrét cı́met számol ki az assembler, hanem egy eltolási

értéket. Azt számolja ki, hogy hány byte-nyit kell ugrania a CALL utası́tásnak ahhoz, hogy a program a függvény kezdő cı́ménél folytassa a végrehajtást. A gépi kódban a 02 00 byte sorozat található az E8-as utası́tás kód után, ami valójában 0002-nak felel meg, hiszen little-endian tárolási módot használ az x86-os architektúra. A 0002 érték azt adja meg, hogy a függvény kezdete két byte-nyi távolságra van és ı́gy a 105+2=107-es cı́men kell folytatni a végrehajtást. A függvényeknél az is nagyon fontos, hogy a függvény végén a RET utası́tásnak szerepelnie kell. Ez azért nagyon fontos, mivel a CALL utası́tás által a vermen eltárolt cı́met ez az utası́tás veszi le a veremről majd az ı́gy kapott cı́mre adja át a vezérlést. Az utası́tás működésének egy “különleges” demonstrálására nézzünk egy utası́tás sorozatot ami megfelel egy

feltétel nélküli ugró utası́tásnak: . push cim ret . cim: ; jmp cim A PUSH utası́tás a cim szimbólikus cı́met tölti fel a veremre, amit a RET utası́tás levesz és erre a cı́mre adja át a vezérlést. Tulajdonképpen a RET utası́tás ı́gy vezérlés átadást végez a verem felhasználásával, ami a verem egyik felhasználási módja. 125 10.31 Egymásba ágyazott függvényhı́vások A függvények egymásba ágyazhatók, ami azt jelenti, hogy egy függvény is hı́vhat egy másik függvényt. A 10.1 tábla egy “mesterséges” példát mutat arra, hogy a függvényeket hogyan lehet egymásba ágyazni. A 104 ábra pedig azt mutatja be, hogy a 101 táblán bemutatott program végrehajtása során az IP regiszter milyen értékeket vesz fel (az utası́tásokat milyen sorrendben hajtjuk végre) és a verem milyen értékeket tárol egy adott pillanatban. A veremben tárolt értékek

ebben a példában csak visszatérési cı́mek, a forrás program sorszámai. Az ábrában a nyı́l az SS:SP regiszter páros által mutatott cı́met jelöli. Nézzünk egy példát, ahol a 10.4d ábrán a verem tetején a visszatérési érték 6, ami a jelen példában a 6. sort jelenti a forráskódban, és a következő végrehajtandó utası́tás a 10 sorban található (IP=10) A 10. sorban egy RET utası́tás van, ami a verem tetejéről leveszi a 6-os értéket és ezt tölti be az IP regiszterbe, ı́gy nem véletlen, hogy a 10.4e ábrán már eggyel kevesebb érték van és a következő utası́tás amit végre kell hajtani az a 6. sorban található, vagyis IP=6 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 org 100h call muvelet int 20h muvelet: call torol call addketto ret torol: xor ax, ax ret addegy: inc ax ret addketto: call addegy call addegy ret 10.1 tábla: Példa az egymásba ágyazott függvényekre

10.4 Paraméter átadás függvényeknek A paraméter átadás egy kicsit komplikáltabb mint más magas szintű programozási nyelvekben. Assemblyben az a program részlet amelyik szeretne egy függvényt meghı́vni a paramétereket egy olyan helyre másolja amit önmaga és a függvény is elér, és csak ezután történik a függvényhı́vás. Háromféle lehetőségünk van a paraméter átadásra közös területen keresztül: • regiszteren, • memórián és • vermen keresztül. 126 (a) IP=2 (b) IP=5 (c) IP=9 (d) IP=10 (e) IP=6 (f) IP=15 (g) IP=12 (h) IP=13 (i) IP=16 (j) IP=12 (k) IP=13 (l) IP=17 (m) IP=7 (n) IP=3 10.4 ábra: A 101 táblán látható program nyomonkövetése 127 10.41 Paraméter átadás regiszteren keresztül A függvény működéséhez szükséges paramétereket regiszterekbe tesszük a függvény meghı́vása előtt. A módszerre nézzünk egy példát,

melyet a 10.2 tábla mutat be A program beolvas egy karaktert majd azt egy függvény segı́tségével ismét kinyomtatja, de a nyomtatást egy függvény végzi. 1 org 100h 2 MOV AH, 01 3 INT 21h 4 CALL charnyomtat 5 INT 20h 6 ; nyomtatandó karakter AL-ben adódik át 7 charnyomtat: 8 MOV AH, 02 9 MOV DL, AL 10 INT 21h 11 RET 10.2 tábla: Paraméter átadás regiszteren keresztül A módszernek vannak előnyei és hátrányai: • Előnyök – A módszer kényelmes és könnyű kis számú paramétert átadni egy függvénynek. – A módszer nagyon gyors, mivel minden paraméter már a regiszterekben lesz a függvényben. • Hátrányok – A fő hátrány, hogy csak néhány paramétert lehet regiszteren keresztül átadni, mivel csak limitált mennyiségű általános regiszter áll rendelkezésre. – Mivel a hı́vási metódus során bizonyos regisztereknek speciális szerepük lehet, ezért szükség lehet

ezeket addig a vermen elmenteni, amı́g a paraméterátadás meg nem történik. Ugyanakkor ez azt is jelenti, hogy a második előnyt elveszı́tjük, hiszen a paraméterátadásban verem műveletre is szükség van. 10.42 Paraméter átadás memórián keresztül A memórián keresztüli paraméter átadás hasonló a regiszteren keresztüli paraméter átadáshoz. Ebben az esetben lényegében a memóriában kijelölünk egy területet ahova a paramétereket a hı́vó program részlet bemásolhatja és ahonnan a függvény majd kiveheti a paramétereket. Ezt a megoldást is érdemes egy példával demonstrálni, ami 10.3 táblán látható A módszer előnye, hogy akárhány paraméter átadható egy függvénynek. Fő hátránya, hogy memória elérésre van szükség az összes paraméter átadása során Erre egy példát a 10.4 tábla mutat Ebben a példában a függvény három számot ad

össze 128 1 2 3 4 5 6 7 8 9 10 11 12 13 14 org 100h MOV AH, 01 INT 21h MOV [char], AL CALL charnyomtat INT 20h ; nyomtatandó karakter a memóriában charnyomtat: MOV AH, 02 MOV DL, [char] INT 21h RET char: db 0 10.3 tábla: Paraméter átadás memórián keresztül 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 org 100h ; regiszterek beállı́tása, ; amit valamilyen számı́tásból kaptunk MOV AX, 0001h MOV BX, 0010h MOV CX, 0100h ; . ; paraméter átadás memórián keresztül MOV SI, paramtabla MOV [SI], AX MOV [SI+2], BX MOV [SI+4], CX CALL osszead ; az eredmeny a DX regiszterben INT 20h ; regiszterek összeadása osszead: MOV SI, paramtabla MOV DX, [SI] ADD DX, [SI+2] ADD DX, [SI+4] RET paramtable: dw 0, 0, 0 10.4 tábla: Második példa a paraméter átadásra memórián keresztül 129 10.5 ábra: Verem állapota amikor két paramétert adunk át egy függvénynek a vermen keresztül 10.43 Paraméter

átadás vermen keresztül Ez az egyik leggyakoribb paraméter átadási módszer. Ebben az esetben a függvény paramétereit a vermen tároljuk el és csak utána hı́vjuk meg a függvényt. Ezt a módszert is egy példán keresztül lehet a legjobban bemutatni. Vegyünk egy olyan függvényt aminek két számot kell átadni: push [szam1] push [szam2] call osszead Miután a CALL utası́tást végrehajtottuk a verem állapota a 10.5 ábrán látható Az ábrából kitűnik, hogy a függvényen belül igen nehéz hozzáférni a paraméterekhez, mivel a verem tetején a visszatérési cı́m is ott van. A függvényen belül például megtehetjük a következőt: pop ax pop bx pop cx push ax ; ; ; ; IP ide kerül szam2 ide kerül szam1 ide kerül IP cı́m vissza kerül a veremre Lényegében először a visszatérési cı́met vesszük le, utána a paramétereket és végül a visszatérési cı́met vissza

kell tenni a veremre. A probléma ezzel a megoldással az, hogy félre kell tenni regisztereket a paraméterek kinyerésére, vagyis ezeket a regisztereket másra nem használhatjuk és ráadásul azt a helyzetet sem tudjuk kezelni amikor például több mint 10 paramétert szeretnénk átadni a függvénynek. A problémára a legjobb megoldás, hogy a paramétereket hagyjuk a vermen és csak akkor férjünk hozzájuk amikor a paraméterek kellenek. Ez az a pont ahol fontos arra emlékezni, hogy a verem a memóriában található és ı́gy memóriaként is kezelhető (lásd 10.11 bekezdés) Ez azt jelenti, hogy az adatok a veremben egymás utáni memória cı́meken találhatók és hivatkozhatunk rájuk SP, SP+2 és SP+4 cı́mekkel. Ebben az esetben az SP (Stack Pointer) regiszter mint egy viszonı́tási pont szolgál Így egy paraméter kiolvasását a következőképpen tehetjük meg: MOV BX, [SP+2] ; szam2 ide kerül MOV

CX, [SP+4] ; szam1 ide kerül Sajnos még ezzel a megoldással is van egy kis probléma. Az jelenti itt a problemát, hogy az SP regiszter értéke folyamatosan változhat a függvényen belül, mivel a függvényben bárhol használhatunk PUSH és POP utası́tásokat. Ha mégis ennél a megoldásnál maradunk, akkor arra kell nagyon figyelni, hogy az SP regiszternek mindig az aktuális értékét vegyük alapul. Például az előző programnál maradva a paraméterek kiolvasása módosul amikor a függvényen belül további verem műveleteket végzünk. PUSH [szam1] PUSH [szam2] CALL osszead 130 10.6 ábra: Verem állapota amikor két paramétert adunk át egy függvénynek a vermen keresztül, de függvényben az SP regiszter értéke is módosul . osszead: PUSH AX PUSH BX ; verem állapota az ábrán MOV AX, [SP+6] ; szam2 ide kerül MOV BX, [SP+8] ; szam1 ide kerül . A 10.6 ábra a verem állapotát mutatja be

akkor, amikor éppen a szam2 paramétert szeretnénk kiolvasni Az ábrából látható, hogy az SP regiszter által mutatott cı́m és a például a szam2 paraméter cı́me közötti távolság megváltozott. Mindezek után nézzük a “legjobb” megoldást. Az előző megoldással az volt a probléma, hogy az SP regiszter állandóan változhat. Ennek megoldására amikor belépünk a függvénybe készı́tünk egy “fix” pontot, amihez képest a paramétereket elérhetjük. Az SP regiszter helyett a BP regisztert is használhatjuk referencia pontként, miután az SP értékét belemásoltuk. Az előző példa végleges megoldását a vermen kereszt-li paraméter átadásra a 10.5 tábla mutatja be A programhoz tartozó verem állapotait a 10.7 ábra mutatja be A következőkben nézzük meg, hogyan alakul ki a verem állapota. A programban a paraméterek eltárolása ugyanúgy történik mint eddig, két

PUSH utası́tással feltöltjük az értékeket a veremre a 4. és 5 sorban Ez látható a 107a ábrán A 6 sorban található CALL utası́tás feltölti a 7. sor cı́mét a veremre, lásd a 107b ábra Ez az ábrában az IP értékkel van jelölve. Ezután a CALL utası́tás átadja a vezérlést az osszead cı́mre Itt először eltároljuk a BP regiszter értékét a 12. sorban, ahogy ez a a 107c ábrán látható Erre azért van szükség, mivel minden függvény ezt a regisztert használja és felül fogjuk ı́rni, de a függvényből kilépve szükség lehet az eredeti értékére. (Így a 12 sorban a vermet időleges érték tárolásra használjuk) Ezután az SP regiszter aktuális értékét átmásoljuk a BP regiszterbe a 13. sorban Ezzel lényegében létrejött a stack frame vagy “függvény keret”. Ez látható a 107d ábrán A függvényhez tartozó stack frame a függvényre

vonatkozó minden fontos információt tartalmaz: • a függvény paramétereit, • a függvény visszatérési értékét, • az elmentett BP regiszter értékét és • a lokális változókat is. (A lokális változókról a 105 bekezdésben olvashatunk) A fenti kialakı́tás miatt szokták a BP regisztert “frame pointer”-nek is nevezni. Ezután a 14 és 15 sorban elmentünk 2 regisztert, mely utası́tások módosı́tják az SP regisztert. Ez látható a 107e ábrán 131 Végül a 16. és 17 sorban kiolvassuk a két paramétert és összeadjuk őket A 107f ábrán látható az, hogy a paraméterek kiolvasásához szükséges cı́meket hogyan számolhatjuk ki. Természetesen ahogy felépı́tettük a vermet, úgy a függvény végén vissza is kell állı́tani, hogy az eredeti állapotot kapjuk vissza, mintha a függvény hı́vással semmi sem történt volna. Ez azt jelenti, hogy amilyen

sorrendben feltöltöttük az értékeket a veremre, azzal ellentétes sorrendben le kell vennünk a veremről. Így először helyreállı́tjuk az elmentett regisztereket a 18 és 19 sorban A függvény végén a BP regisztert is vissza kell állı́tani, hiszen lehet hogy ezt a függvényt egy másik függvény hı́vta meg és a BP regiszter a hı́vó függvény frame pointer-ét tartalmazza. A BP regiszter visszaállı́tását a 20 sorban végezzük el Végül a függvényből a RET paranccsal lépünk ki a 21 sorban Ahogy ezt már fent leı́rtuk, a RET utası́tás leveszi a függvény visszatérési értékét. Ebben a pillanatban a verem állapotát a 10.7a ábrának felel meg Az ábra jól mutatja, hogy a függvény hiába tért vissza a 7 sorhoz a veremben még vannak adatok. Ezeket az adatokat el kell távolı́tani a veremről, mivel a függvényhı́vás után nincs értelme a vermen tartogatni, hiszen

nincs többé hasznuk. Ezen kı́vül ha nem távolı́tjuk el, akkor a sokszori függvényhı́vás megtöltené a vermet. Két lehetőségünk van ezt a problémát orvosolni: • a hı́vó programrészlet takarı́t vagy. • a hı́vott programrészlet takarı́t. Ezeket a stratégiákat tárgyaljuk a következő bekezdésben. 1 org 100h 2 . 3 ; paraméter átadás vermen keresztül 4 PUSH [szam1] 5 PUSH [szam2] 6 CALL osszead 7 ADD SP, 4 8 ; az eredmeny az CX regiszterben 9 . 10 INT 20h 11 osszead: 12 PUSH BP 13 MOV BP, SP 14 PUSH AX 15 PUSH BX 16 MOV CX, [BP+6] ; szam1 kiolvasása 17 ADD CX, [BP+4] ; szam2 hozzáadása 18 POP BX 19 POP AX 20 POP BP 21 RET 10.5 tábla: Példa a paraméter átadásra a vermen keresztül Függvényhı́vás utáni takarı́tás Az előző bekezdésben, a 10.5 táblán bemutatott programban a függvényhı́vás után törölni kell 4 bytenyi értéket Használhatnánk például ezt a

megoldást is: POP CX POP CX 132 (a) (b) (d) (c) (e) (f) 10.7 ábra: Verem állapotai a 105 táblán bemutatott programban 133 de ezzel az a gond, hogy tönkretesszük a CX regiszter értékét. Így itt is inkább a vermet, mint memória tömböt kezeljük és ezért csak az SP regisztert módosı́tjuk: ADD SP, 4 Mivel a 10.7 ábrán a memória cı́mek lentről felfelé növekednek, ezért ahhoz hogy “eldobjunk” 4 byte-nyi értéket a veremről az SP regiszter értékét meg kell megnövelni. Az eldobás szó azért szerepel idézőjelek között, mert valójában az értékeket nem töröljük, csak annyi történik, hogy az SP regiszter mozgatásával átállı́tjuk a foglalt és a szabad részek közötti határt. Az SP regiszter által mutatott cı́mnél nagyobb cı́men elhelyezkedő értékek foglaltak, a kisebb cı́men elhelyezkedő értékek szabadok, azokat bármikor

felülı́rhatjuk, törölhetjük. Azt is fontos megérteni, hogy a következő teljesen helytelen: osszead: . ADD SP, 4 RET mivel ı́gy a visszatérési értéket is eltávolı́tanánk az ADD utası́tással. Ebben az esetben a LIFO szabály is sérül, hiszen a függvény hı́vás során alkalmazott sorrenddel ellentétes módon kellene mindent helyreállı́tani, de itt előbb próbáljuk meg felszabadı́tani a paraméterek helyét és csak utána akarjuk levenni a veremről a visszatérési értéket. Ha mégis ezt a megoldást szeretnénk, vagyis hogy a hı́vott függvény takarı́tson a vermen, akkor a RET utası́tásnak egy opcionális paramétert kell megadni. Például a: RET 4 utası́tás azt jelenti: IP = [SS:SP] SP = SP + 2 + 4 A fenti műveletben a 2 azért kell, hogy a visszatérési cı́met eltávolı́tsuk a veremről, a 4-es érték pedig a RET után megadott érték, és annyi byte-ot “dobunk el”

a veremről. Így első ránézésre furcsa lehet, hogy két különböző stratégia is van egy függvény paramétereinek letakarı́tására a veremről: 1. a hı́vó programrészlet takarı́t vagy 2. a hı́vott programrészlet takarı́t Hogy melyiket haználjuk, az attól függ, hogy a függvény paramétereinek száma fix vagy változó lehet. Ha egy függvénynek fix számú argumentuma van, akkor assembly-ben a 2. megoldás preferált Ez azért van, mert ı́gy csak egyszer, a függvény végén kell implementálni ezt a kódrészletet. Ugyanakkor ha egy függvénynek változó számú argumentuma lehet, akkor csak az 1. megoldás használható Mit jelent az, hogy változó számú argumentum? Itt gondoljunk például a C programozási nyelvben használt printf függvényre. Ezt a függvényt többféleképpen is meghı́vhatjuk: printf(’’Hello’’); printf(’’Az eredmeny: %d’’, ertek);

printf(’’x: %lf -- y: %lf’’, x, y); Erre a kérdésre még visszatérünk a 14. fejezetben 134 Állapotmegörzés A 10.5 táblán bemutatott programban a függvény elején elmentünk regisztereket a PUSH utası́tással, illetve a végén helyreállı́tjuk őket a POP paranccsal. Miért lehet erre szükség? Vegyük a következő programrészletet: MOV CX, szam ciklus: CALL szamolo . LOOP ciklus . Ebben a programrészletben a CX regiszter tárolja a ciklus változó értékét. Ha a szamolo függvény módosı́tja a CX regisztert, akkor a program logikája helytelen lesz, hiszen a CX regiszter értéke nem fut végig az általunk megadott tartományon. Ezért nagyon fontos, hogy minden olyan regisztert amit a függvényben használunk, azt a függvény elején elmentsünk, majd a függvény végén helyreállı́tsunk. Itt is felmerülhet a kérdés, hogy a hı́vó vagy a hı́vott programrészlet végezze a

mentést és a helyreállı́tást. Mi történik akkor, ha a hı́vó programrészletnek kell a regisztereket elmenteni? • A program karbantartása hihetetlenül nehéz lenne, mivel ha később a hı́vott függvény módosı́tjuk és az eredetitől eltérő regisztereket használna a függvény, akkor mindenhol ahol a függvényt meghı́vjuk módosı́tani kellene a programot. • A program mérete megnövekedne, mivel ha egy függvényt többször meghı́vunk, akkor minden alkalommal a regiszterek elmentését és helyreállı́tását is le kell programozni. Ezen okoknál fogva a regiszterek mentését és helyreállı́tását csak a hı́vott függvényben szoktuk leprogramozni, ahogy ez a 10.5 táblán bemutatott programban is láttuk Ez az megfontolás megfelel a moduláris programozás elveinek is. Még egy kérdést érdemes tisztázni: miért nem használjuk mindig a PUSHA és POPA utası́tásokat, amelyek

minden regisztert elmentenek és helyreállı́tanak? • Először is előfordulhat, hogy egy függvény vissza akar adni egy értéket a hı́vó függvénynek. Ezt általában regiszteren keresztül szoktuk megtenni, méghozzá az AX regiszteren keresztül. Ebben az esetben az AX regisztert nem kell elmenteni és nem szabad visszaállı́tani, vagyis felülı́rni a visszaadandó értéket. • Másodszor a PUSHA utası́tás végrehajtása 5 órajel ciklust igényel, mı́g egy PUSH utası́tás csak 1 órajel ciklusig tart. Ez azt jelenti, hogy a PUSHA utası́tásnak csak akkor van értelme ha 5 regiszternél többet akarunk elmenteni. 10.44 Érték és cı́m szerinti paraméter átadás Csak a teljesség kedvéért érdemes itt megemlı́teni az érték és cı́m szerinti paraméter átadás közötti különbséget. A témára még visszatérünk a 14 fejezetben is A legtöbb programozási nyelvben, ı́gy a C

programozási nyelvben is, az érték szerinti paraméter átadás az alapértelmezett módszer. Ez azt jelenti, hogy egy értéket amit szeretnénk átadni a függvénynek azt átmásoljuk a függvény “területére”. Az eddigiek alapján ez megfelel annak, hogy az értéket felmásoljuk a függvény stack frame-jébe. A cı́m szerinti paraméter átadás esetén a változó cı́mét adjuk át a függvénynek, vagyis a változó cı́mét felmásoljuk a függvény stack frame-jébe. A két módszer közötti különbség bemutatására a 10.6 táblán és a 107 táblán bemutatott programokat érdemes összehasonlı́tani. Mind a két program beolvas két karaktert, amelyeket eltárolunk a memóriában, majd 135 1 org 100h 2 ; két karakter beolvasása 3 MOV AH, 01 4 INT 21h 5 MOV [char], AL 6 MOV AH, 01 7 INT 21h 8 MOV [char+1], AL 9 10 PUSH word [char] 11 CALL char2nyomtat 12 INT 20h 13 14 char2nyomtat: 15

PUSH BP 16 MOV BP, SP 17 PUSH AX 18 PUSH DX 19 PUSH BX 20 MOV BX, [BP+4] 21 MOV AH, 02 22 MOV DL, BL 23 INT 21h 24 MOV DL, BH 25 INT 21h 26 POP BX 27 POP DX 28 POP AX 29 POP BP 30 RET 31 char: db 0, 0 10.6 tábla: Érték szerinti paraméter átadás a vermen keresztül egy függvény segı́tségével a karaktereket kinyomtatjuk. A 106 táblán látható programban, a 10 sorban a char változó értékét feltöltjük a veremre Az ı́gy feltöltött értéket a frame stack-ből a 20 sorban visszaolvassuk a BX regiszterbe, majd külön-külön kinyomtatjuk a BL és BH regiszter tartalmát. A 10.7 táblán látható program egy kicsit más Ebben a programban a 10 sorban a char változó cı́mét töltjük fel a verembe és a 20. sorban ezt a cı́met olvassuk ki a veremből majd másoljuk át a BX regiszterbe. Így a 22 és 24 sorban az átadott cı́mről olvassuk ki a nyomtatandó karaktereket Egy kicsit mesterkéltnek tűnhet

ez a példa, de a valódi programok esetén is van jelentősége a cı́m szerinti paraméter átadásnak. Az egyik legfontosabb alkalmazási területe a cı́m szerinti paraméter átadásnak, amikor egy tömböt szeretnénk átadni egy függvénynek. Ilyenkor nem érdemes a teljes tömböt feltölteni a veremre, hanem elegendő csak a tömb cı́mét átadni a függvénynek. A 108 tábla egy másik példát mutat a cı́m szerinti paraméter átadásra, amiben egy szöveget nyomtatunk ki egy függvénnyel. 10.45 Változó számú paraméter átadása függvénynek A C programozási nyelvben arra is lehetőség van, hogy egy függvény változó számú paramétert fogadjon el. Ilyen függvények a scanf és a printf függvények Ebben az esetben a hı́vott függvény 136 1 org 100h 2 ; két karakter beolvasása 3 MOV AH, 01 4 INT 21h 5 MOV [char], AL 6 MOV AH, 01 7 INT 21h 8 MOV [char+1], AL 9 10 PUSH char 11

CALL char2nyomtat 12 INT 20h 13 14 char2nyomtat: 15 PUSH BP 16 MOV BP, SP 17 PUSH AX 18 PUSH DX 19 PUSH BX 20 MOV BX, [BP+4] 21 MOV AH, 02 22 MOV DL, [BX] 23 INT 21h 24 MOV DL, [BX+1] 25 INT 21h 26 POP BX 27 POP DX 28 POP AX 29 POP BP 30 RET 31 char: db 0, 0 10.7 tábla: Cı́m szerinti paraméter átadás a vermen keresztül nem tudja előre, hogy paramétert adunk át neki. Többféle megoldás is létezik ennek a szituációnak a kezelésére. Az egyik legegyszerűbb módszer, hogy az első paraméter megadja, hogy hány további paraméter kerül a veremre. Egy dologra azonban figyelni kell, hogy a paraméterek száma az utolsó legyen amit feltöltünk a veremre, éppen a visszatérési cı́m fölé. Ezt a helyzetet a 108 ábra mutatja be A 10.9 tábla egy érdekes minta programot mutat be az előbb bemutatott változó paraméterű függvényekre. A program folyamatosan olvas számjegyeket (“bármennyit”), amı́g nullát nem

adunk meg. Ezeket a számjegyeket átadjuk egy függvénynek, ami összeadja a számokat és visszaadja az összegüket. Végül a program az összegnek megfelelő darab pontot nyomtat ki a képernyőre Nézzük a program működését: A 2. sor egy előkészı́tés, a CX regisztert lenullázzuk, mivel a CX regiszterben fogjuk számolni, hogy hány számot adott meg a felhasználó. Az 4 és 5 sorban olvasunk be egy számjegyet. Itt ellenőrizni is kellene, hogy csak számjegyeket adhat meg a felhasználó, de ettől az ellenőrzéstől most eltekintünk. A 6 sorban a karakter ASCII kódját számmá konvertáljuk Ha ennek a műveletnek az eredménye zérus, akkor a felhasználó a zérus számot adta meg, és véget ér a beolvasás. A 8. és 9 sor segı́tségével feltöltjük a beolvasott számot a veremre és a 10 sorban megnöveljük a számlálót. Így a CX regiszter azt fogja mutatni, hogy hány

értéket töltöttünk fel a veremre A 14 sorban magát a számlálót is feltöltjük a veremre. A 15 sorban szereplő CALL utası́tással átadjuk a 137 1 org 100h 2 PUSH szoveg ; szöveg cı́me 3 CALL nyomtat 4 INT 20h 5 6 nyomtat: 7 PUSH BP 8 MOV BP, SP 9 PUSH AX 10 PUSH DX 11 MOV AH, 09 12 MOV DX, [BP+4] ; a cı́met olvassuk ki 13 INT 21h 14 POP DX 15 POP AX 16 POP BP 17 RET 18 szoveg: db ’Hello vilag$’ 10.8 tábla: Szöveg nyomtatása függvénnyel, mely demonstrálja a cı́m szerinti paraméter átadást a vermen keresztül vezérlést a függvénynek. A 29 és 30 sor befejezi a függvény stack frame-jének előkészı́tését Ekkor a 10.8 ábrán látható állapot alakul ki a vermen A 31 sorban elmentjük a CX regisztert, mivel a 32. sorban betöltjük a paraméterek számát a CX regiszterbe A végeredmény az AX regiszterben fog kialakulni ezért a 33. sorban lenullázzuk az AX regisztert A 34 sorban az SI

regisztert úgy készı́tjük elő, hogy ha ezt az értéket hozzáadjuk a BP regiszterhez, akkor rögtön az első paraméterre fog mutatni. Ezután a 36 sorban az AX regiszterhez adjuk az aktuális paramétert A 37 sorban az SI regiszter értékét kettővel növeljük meg, mivel a vermen 2 byte-onként, vagyis word-önként, vannak a paraméterek eltárolva. A 38 sorban található LOOP utası́tás az előzőleg a CX regiszterbe betöltött számszor végrehajtja a ciklust. A 34-38 sorok közötti részt meg lehetne oldani másképpen is, például: ADD BP, 6 ujra ad: ADD AX, [BP] LOOP ujra ad 10.8 ábra: A verem állapota, változó számú paraméter esetén 138 de ennek a módszernek az a hátránya, hogy a BP regisztert folyamatosan módosı́tjuk és ı́gy többet nincs lehetőségünk az eredeti számlálót elérni. A 39-41 sorok között megfelelően befejezzük a függvényt Az egyik érdekesebb

részlet a 16-18. sorok között található, mivel a függvény előtt feltöltött értékeket le is kell takarı́tani a veremről. Ugyanakkor nem tudjuk előre, hogy hány darab értéket kell letörölni a veremről. Ezt a problémát itt úgy oldjuk meg, hogy először a CX regiszter értékét megnöveljuk 1-el. Így most a CX regiszter a paraméterket számát plusz egy értéket tartalmaz A plusz egy arra kell, hogy a számlálót is feltöltöttük a veremre. Ezután megduplázzuk a CX értékét, mivel a vermen word méretű adatokat tárolunk. Végül a 18 sorban az SP regiszter módosı́tásával eldobjuk a feltöltött értékeket a veremről. A 20-25. sorok között annyi pont karaktert nyomtatunk ki, amekkora számot az AX regiszterben a függvény visszaadott. Erre már láttunk példát korábban 139 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

36 37 38 39 40 41 org 100h mov cx, 0 ujra olvas: mov ah, 1 int 21h sub al, ’0’ jz olvas vege xor ah, ah push ax inc cx jmp ujra olvas olvas vege: push cx call osszead inc cx ; a szamlalo is bele tartozzon add cx, cx ; cx = cx * 2 add sp, cx mov cx, ax mov ah, 2 mov dl, ’.’ nyomtat: int 21h loop nyomtat int 20h osszead: push bp mov bp, sp push cx mov cx, [bp+4] xor ax,ax mov si, 6 ujra ad: add ax, [bp+si] add si, 2 loop ujra ad pop cx pop bp ret 10.9 tábla: Változó számú szám összeadása és annyi pont nyomtatása 140 10.5 Lokális változók függvényekben Az eddigi bekezdésekben nem esett arról szó, hogy hogyan kezeljük a függvények lokális válotzóit. Például vegyük a következő C program részletet: int szamol(int a, int b) { int temp, n; temp = a; n = b; . } Ebben a a program részletben az n és temp változók akkor jönnek létre amikor belépünk a függvénybe, és a változók megszünnek amikor

kilépünk a függvényből. Így ezekre a változók lokálisak és “dinamikusak” Az ilyen dinamikus változóknak helyet foglalhatnánk az adat szegmensben is, de ezt a módszert két oknál fogva nem szoktuk használni: 1. Helyfoglalás az adat szegmensben statikus és akkor is megmarad a terület amikor már nem a függvényben vagyunk, nem a függvény utası́tásait hajtjuk végre. 2. Ennél fontosabb indok, hogy ez a fajta helyfoglalás nem működik rekurzı́v függvényekkel A rekurzı́v függvényekkel a 10.6 bekezdésben foglalkozunk Ezért a lokális változókat a vermen szoktuk létrehozni. A fenti C függvény esetén az assembly-ben létrehozott verem a 10.9 ábrán látható módon néz ki Ahogy ez látható, a BP regiszter, mint frame pointer, a lokális változók elérésére is alkalmas. A lokális változók lefoglalása igen egyszerűen megoldható, csak megint memória tömbként kell

tekinteni a veremre és két lokális változó esetén ı́gy néz ki: SUB SP, 4 Mivel egy változót 2 byte-on tárolunk, ezért négyet vonunk ki az SP regiszterből. A kivonásra pedig azért van szükség, mert ı́gy a verem tetejét elmozdı́tjuk és szabad helyek jönnek létre. Ezek után nézzük meg, hogyan lehet a fenti C programrészletet megvalósı́tani assembly-ben: PUSH [b] PUSH [a] CALL szamol ADD SP, 4 . szamol: PUSH BP MOV BP, SP SUB SP, 4 PUSH AX . MOV AX, [BP+4] MOV [BP-2], AX MOV AX, [BP+6] MOV [BP-4], AX . POP AX ADD SP, 4 POP BP RET ; ; ; ; ’a’ változó betöltése ’temp’ változóban tárolás ’b’ változó betöltése ’n’ változóban tárolás 141 10.9 ábra: Lokális változók helye a stack frame-ben Itt fontos megérteni, hogy a lokális változók az assembly kódban tulajdonképpen “átalakulnak” abban az értelemben, hogy például a fenti programrészletben a temp

változóra [BP-2] módon lehet hivatkozni, illetve a n változóra [BP-4] módon lehet hivatkozni. Ezért az assembly programokban makrót (11. fejezet) szoktak használni az ilyen változók megnevezésére: %define temp [BP-2] %define n [BP-4] . PUSH [b] PUSH [a] CALL szamol ADD SP, 4 . szamol: PUSH BP MOV BP, SP SUB SP, 4 PUSH AX . MOV AX, [BP+4] ; MOV temp, AX ; MOV AX, [BP+6] ; MOV n, AX ; . POP AX ADD SP, 4 POP BP RET ’a’ változó betöltése ’temp’ változóban tárolás ’b’ változó betöltése ’n’ változóban tárolás 10.51 ENTER és LEAVE utası́tások A 386-os Intel processzor óta van két speciális utası́tás amely közvetlenül támogatja a lokális változók látrehozását és megszüntetését. Az ENTER utası́tás formátuma: ENTER bytes, level A bytes paraméter azt adja meg, hogy hány byte-ot kell lefoglalni lokális változóknak. Ha nincs szükség lokális változókra,

akkor az értéke lehet zérus is. A második paraméter a függvények egymásba 142 ágyazottságát adja meg. Ha itt nem zérust adunk meg, akkor level darab frame pointert másolunk a frame stack-be, a korábbi stack frame-ből. Így a: ENTER XXX, 0 utası́tás megfelel az PUSH BP MOV BP, SP SUB SP, XXX utası́tásoknak. A LEAVE utası́tás az ENTER utası́tás által lefoglalt stack frame-t szabadı́tja fel 10.6 Rekurzı́v függvények A rekurzı́v függvények abban speciálisak, hogy a függvény tulajdonképpen önmagát hı́vja meg. Más szóval úgy is elképzelhetnénk a dolgot, hogy a függvény egy újabb példányát hozza létre, és azt a függvényt hı́vjuk meg. Ez valójában nincs ı́gy, a függvény kódból csak egy van, de a függvény környezete az ami “megduplázódik”. Ezért nagyon fontos a verem használata, hiszen a vermen akárhány stack frame-t elhelyezhetünk. A

regiszteren vagy memórián keresztűli paraméterátadásnál csak egy terület van ahova a paramétereket ı́rhatjuk, ezért egy újabb függvény hı́vás felülı́rja az értékeket és ı́gy a függvény visszatérése után helytelen kódot hajtanánk végre. A rekurzı́v függvények bemutatására vegyünk először egy pseudo kódban ı́rt függvényt: FÜGGVÉNY nyomtat(n) print n HA n != 0 nyomtat(n-1) HA VÉGE FÜGGVÉNY VÉGE Ha ezt a függvényt meghı́vjuk a nyomtat(2) módon, akkor a program kinyomtatja a 210 értékeket. Ebben az az érdekes, hogy egy számsorozatot nyomtatunk ki, pedig a kódban semmilyen ciklus nincs! Ezért szokták a rekurziót a 4. ciklus képző programozási mószernek is nevezni1 A pseudo kódnak megfelelő assembly program a 10.10 táblán látható, illetve a verem állapotai a program futása során a 10.10 ábrán látható Az egyes alábrák azt az állapotot

mutatják, amit az alcı́mben megadott program sorban szereplő utası́tás végrehajtása után kapnánk a vermen. Az ábrában a szı́nes dobozok a foglalt memória területet jelölik a fehér dobozok a szabad memória területek. Az SS:SP regiszter páros, ami a verem tetejét jelöli, mindig a szı́nes és a fehér dobozok közé mutat. Az ábrákban a dobozban szereplő IP=4 jelöli a függvény visszatérési értéket, a számok a dobozban pedig a függvény paraméternek (n) felelnek meg. Ezek után nézzük a program működését részletesen, hogy mindenki számára világos legyen a működési elv. A 2 sorban a 2 értéket töltjük fel a veremre, mint word adattı́pus (1010a ábra) A 3. sorban meghı́vjuk a nyomtat függvényt, ami a visszatérési értéket feltölti a veremre (1010b ábra), majd átadja a vezérlést a 8. sornak A 8 sorban eltároljuk a a BP regiszter értékét és ezzel

létrehoztuk a függvény stack frame-jét. Ez látható a 1010c ábrán Mivel a függvényben az AX, BX 1 Emlékezzünk az algoritmusok tantárgy ismereteire: 1. elől tesztelő ciklus 2. hátul tesztelő ciklus 3. számláló ciklus 143 és DX regisztereket is használjuk, ezért ezeket a regisztereket elmentjük a 10-12. sorokban (1010d1010f ábrák) A 13 sorban az INT 21h megszakı́tás funkció kódját állı́tjuk be, majd a 14 sorban a veremről betöltjük a függvény paraméterét a BX regiszterbe. A 15 sorban átmásoljuk a paramétert a DL regiszterbe, mivel a nyomtatásnál az INT 21h megszakı́tás ezt a regisztert fogja használni. Miért nem rögtön a DX regiszterbe ı́rtuk bele a függvény paraméterét a 14. sorban? Azért nem, mert a nyomtatáshoz a DL regiszter értékét módosı́tani kell, a számot a számnak megfelelő karakter ASCII kódjává kell alakı́tani úgy, hogy

hozzáadunk 30h értékét. A 17 sorban elvégezzük a nyomtatást a megszakı́tással. A 18 sorban megvizsgáljuk, hogy a függvény paramétere, a BL regiszter, zéruse Mivel nem zérus a BL regiszter értéke, ezért a 20 sorban folytatjuk Először is csökkentjük a paraméter értékét, majd ezt az értéket feltöltjük a veremre (10.10g ábra) a 21 sorban A 22 sorban a függvényhı́vás ismét feltölti a visszatérési értéket (10.10h ábra) és átadja a vezérlést a 8 sornak A 8. és 9 sor befejezi a stack frame előkészı́tését (1010i ábra) Itt látható az, hogy csak egy függvény van, de mivel a verem tetején más adatok vannak, ezért ez egy “új” függvénynek számı́t, hiszen más adatokkal fog számolni. Ezt követi a paraméter beolvasása (14 sor), a nyomtatás (13-17 sor), illetve az ellenőrzés, hogy zérus-e a függvény paramétere. Mivel a függvény paramétere nem

zérus, ezért csökkentjük a paraméter értékét 1-el (20. sor), majd feltöltjük a veremre a 21 sorban (1010m ábra) A 22. sor újra meghı́vja a nyomtat függvényt, vagyis a 23 sor mint visszatérési érték felkerül a veremre (10.10n ábra) és átadja a vezérlést ismét a 8 sornak Immár harmadszor a BP regiszter felkerül a veremre (10.10o ábra) a 8 sorban, ezzel a harmadik stack frame-et előkészı́tve A 10-12 sorokban a regisztereket ismét elmentjük, illetve a 13-17. sorokban a nullás értéket kinyomtatjuk A 18. sorban a BL regiszter értékét nullának fogjuk találni, ı́gy a 25 sorba ugrunk A 25-28 sorokban eldobjuk az elmentett AX, BX, DX és BP értékeket. Ez látható a 1011a-1011d ábrákon A 29. sorban a verem tetején látható cı́mre (1011d ábra) adódik át a vezérlés, vagyis a 23 sorra A 23. sorban eldobjuk a verem tetejére feltöltött paramétert (1011e ábra) Ezt követi a

25-28 sorok végrehajtása, ahol megint helyreállı́tjuk az elmentett regisztereket (10.11f-1011j ábrák), majd a 29 sorban a verem tetején található cı́mre visszatér a függvény, vagyis a 23. sorba Itt ismét eldobjuk a vermen található értékekeket (10.11k-1011p ábrák) Amikor ismét a 29 sorba érünk akkor a verem tetejéről levesszük a visszatérési cı́met (10.11p ábra) és elugrunk az ı́gy megadott cı́mre, a 4 sorba A 4. sor végrehajtásával az utolsó értéket is letakarı́tjuk a veremről és visszaáll az eredeti állapot, amikor is semmi nem volt a vermen (10.11r ábra) 10.7 Hatékonyság Ahogy ebben a fejezetben láttuk a függvények nagy mértékben támogatják a moduláris programozást. Ugyanakkor a függvények használatáért “fizetnünk” is kell, mivel a paraméter átadási módszerek megvalósı́tásához extra utası́tásokat kell alkalmazni, amelyek nem

közvetlenül az algoritmushoz tartoznak. Az ilyen extra utası́tásokat “overhead”-nek nevezzük Vegyünk egy programrészletet, két változó cseréjét. Ez látható a 1011 táblán A bal oldali programrészlet egyszerűen végrehajtja a cserét, a jobb oldali program függvényként végzi el ugyanezt. A második esetben lényegében csak a függvényhı́vással és a RET utası́tással egészı́tjük ki a programot. Mind a két programrészletben ECX-szer hajtjuk végre a műveletet. (Jelen példában azért használjuk a 32 bites regisztereket, mert “nagyon sokszor” szeretnénk végrehajtani, hogy mérhető adatokat kapjunk.) Amennyiben mind a két kódrészletet lemérjük 50 000 000 futás után, azt kapjuk, hogy alap esetben 160 ms-ig, mı́g függvényként való futtatás esetén 240 ms-ig tart a programrészlet futása. A különbség ezen mérések szerint másfélszeres (Más mérések

szerint ez lehet 2.3-szeres különbség is [2]) Azt is érdemes meggondolni, hogy ha paramétereket is átadunk a függvénynek akkor ez az “overhead” még nagyobb lehet, ı́gy sebességre való optimalizálás esetén a függvény hivások minimalizálandók (lásd 15.1 és 1515 bekezdés) 10.8 Ellenőrző kérdések 1. Mi a különbség a sor és verem adatszerkezetek között? 144 (a) IP=2 (b) IP=3 (c) IP=8 (d) IP=10 (e) IP=11 (n) IP=22 (f) IP=12 (o) IP=8 (g) IP=21 (p) IP=10 (h) IP=22 (q) IP=11 (i) IP=8 (j) IP=10 (k) IP=11 (l) IP=12 (m) IP=21 (r) IP=12 10.10 ábra: A verem állapotai a 1010 táblán bemutatott rekurzı́v függvény végrehajtása során 145 (a) IP=25 (b) IP=26 (k) IP=29 (c) IP=27 (l) IP=23 (d) IP=28 (m) IP=25 (e) IP=29 (n) IP=26 (f) IP=23 (o) IP=27 (g) IP=25 (p) IP=28 (h) IP=26 (q) IP=29 (i) IP=27 (j) IP=28 (r) IP=4 10.11 ábra: A verem állapotai a 1010 táblán

bemutatott rekurzı́v függvény végrehajtása során 146 1 org 100h 2 push 2 3 call nyomtat ; nyomtat(3) 4 add sp,2 5 int 20h 6 7 nyomtat: 8 push bp 9 mov bp,sp 10 push ax 11 push bx 12 push dx 13 mov ah, 2 ; 14 mov bx, word [bp+4] ; | 15 mov dl, bl ; | print n 16 add dl, 30h ; | 17 int 21h ; 18 cmp bl, 0 ; HA n != 0 19 jz nyomtat vege 20 dec bl ; 21 push bx ; | nyomtat(n-1) 22 call nyomtat ; 23 add sp,2 24 nyomtat vege: 25 pop dx 26 pop bx 27 pop ax 28 pop bp 29 ret 10.10 tábla: Számjegyek nyomtatása rekurzı́v függvénnyel 2. Mi az a stack underflow? Melyik művelet tudná ezt okozni? 3. Mi az a stack overflow? Melyik művelet tudná ezt okozni? 4. Melyek a verem fő felhasználási területei? 5. Melyik utası́tással lehet feltölteni egy értéket a veremre? 6. Ha POP utası́tás nem megengedett, akkor hogyan tudunk levenni egy értéket a veremről? 7. Mely regiszterek mutatják meg a verem tetejének cı́mét? 8. Hogyan

cserélhetjük fel két regiszter tartalmát a vermen keresztül? 9. Mi az a stack frame és mit tartalmaz? 10. Melyik regiszter a frame pointer? 11. Milyen módszerekkel adhatunk át paramétert egy függvénynek? 12. Ha a regiszteren keresztül adunk át paramétert, akkor ennek a módszernek milyen előnyei és hátrányai vannak? 147 ujra: mov mov mov mov eax, ertek1 ebx, ertek2 ertek2, eax ertek1, ebx dec ecx jnz ujra ujra: call csere dec ecx jnz ujra jmp vege csere: mov eax, ertek1 mov ebx, ertek2 mov ertek2, eax mov ertek1, ebx ret vege: 10.11 tábla: Programrészlet két változó cseréjére függvény nélkül és függvénnyel 13. Mely memória területen definiálunk lokális változókat egy függvényben? 14. Miért nem az adat szegmensben definiáljuk a lokális változókat? 10.9 Feladatok 9. fejezetben bemutatott programokat ı́rjuk át úgy, hogy az időleges tárolásra ne a MOV utası́tást

használjuk, hanem a vermet. 148 11. Fejezet Makrók A makrók nagyon érdekes és hasznos programozási konstrukciók. Mit nevezünk makrónak? Ez sajnos a programozási nyelvtől is függ. Az assembly programozási nyelvben a makrók hasonlók a C programozási nyelvben használt makrókhoz, de érdekes módon egy kicsit többet is tudnak Persze erre az extra segı́tségre szükség is van, mivel az assembly programozási nyelv egy alacsony szintű vagyis gépközeli programozási nyelv. Assembly-ben a makró arra ad lehetőséget, hogy egy szöveg blokkhoz egy nevet rendeljünk hozzá, majd amikor az assembler az adott névvel találkozik a forráskódban, akkor a név helyére a szöveg blokkot illeszti be. A behelyettesı́tés angol neve: macro expansion Egyszerűen fogalmazva a macro egy fejlett szöveg behelyettesı́tési mechanizmus. 11.1 Egy soros makrók A legegyszerűbb makrók egy sorosak. Erre egy példa: %define

csereaxbx XCHG AX, BX amit egy programkódban a következőképpen is használhatunk: MOV AX, 1 MOV BX, 2 . csereaxbx . Amikor az assembler ezt lefordı́tja, akkor azt két lépésben teszi. Először is elvégzi a makró behelyettesı́téseket: MOV AX, 1 MOV BX, 2 . XCHG AX, BX . majd ezután az assembler legenerálja a bináris kódot. Ez azt jelenti, hogy egy két lépéses (two-pass) fordı́tási folyamat végeredményeként jön létre a bináris kód. Ez a két lépéses folyamat jellemző a C programozási nyelvre is, ahol az első lépés az előfeldolgozás (preprocessing) és a második lépés a fordı́tás (compiling). 149 A makrók összetettebbek is lehetnek, mivel rendelkezhetnek argumentummal vagy paraméterrel, mint a függvények. Ugyanakkor ez felveti a makrók és függvények közötti kapcsolatot Mikor, melyiket és hogyan használjuk? Egy függvény tulajdonképpen egy al-programnak felel meg.

Egy gyakorlatiasabb megfogalmazás szerint a függvény egy olyan utası́tás sorozatnak felel meg, amelyet sokszor, több különböző helyen használunk a programunkban. Így a függvény létrehozásához az ismétlődő kódrészletet “kiemeljük”, nevet adunk neki, majd amikor szükségünk van rá, akkor a nevével hivatkozunk rá és ezzel átadjuk a függvénynek a vezérlést (meghı́vjuk). Ez a definı́ció nagyon hasonló a fenti makró definı́cióhoz Nézzük makrók és függvények közötti különbségeket: • A legfontosabb különbség a makrók és függvények között a generált bináris kódban van. – Egy függvény esetén a bináris kódot az assembler egyszer generálja le, majd minden alkalommal amikor a kódrészletre szükség van, akkor a CALL utası́tással hı́vjuk meg. Ez azt is jelenti, hogy a függvényhı́vás helyére a CALL utası́tás bináris kódja

kerül. – Egy makrók esetén, ahol a makró neve szerepel, oda lesz behelyettesı́tve a makró forráskódja és oda kerül a bináris kód is. Minden alkalommal Ez azt jelenti, hogy mindenhol, ahol a makró neve szerepel a kódban, oda a makró teljes bináris kódja belefordul. • A másik nagyon fontos különbség a paraméter átadási módszerben van. – Függvények esetén a 10. fejezetben tárgyalt paraméter átadási módszerek lehetségesek: regiszteren, memórián és vermen keresztül. – Makrók esetén közvetlen paraméter átadás lehetséges, úgy mintha egy magas szintű programozási nyelvet használnánk. Például: %define csere(a,b) XCHG a, b . csere(AX, BX) . Ebből a kódrészletből az alábbi kód generálódik a makró behelyettesı́tés után: . XCHG AX, BX . Ezek után a makró definiálás néhány további fontos szabálya a következő: • Egy makró definı́ció

során a kis és nagy betű közötti különbség számı́t. • Rekurzı́v definı́ció esetén a behelyettesı́tés csak egyszer történik meg. Például: %define a(x) 1+a(x) mov ax, a(3) amiből a következő kód generálódik: mov ax, 1+a(3) • Nagyon fontos, hogy a behelyettesı́tés a makró használatakor történik és nem a definiáláskor. Például: %define b(x) 2*x %define a(x) 1+b(x) mov ax, a(8) 150 A példában amikor az assembler meglátja a a(8) kifejezést, akkor először az a(x) makró helyettesı́tődik be: mov ax,1+b(8) ezután pedig a b(x) makró behelyettesı́tése történik meg: mov ax,1+2*8 11.2 Több soros makrók Több soros makrók esetén a szintakszis a következő: %macro név param szám utası́tások utası́tások . %endmacro A név adja meg a makró nevét, amivel hivatkozni lehet rá. A param szám adja meg a makrónak megadható paraméterek számát. Nézzük az

első egyszerű példát, amely tulajdonképpen egy szorzásnak felel meg: %macro szorzasAX 4el shl AX, 2 %endmacro Ez egy olyan makró, aminek nincs paramétere és használata igen egyszerű: mov AX, 3 szorzasAX 4el amiből a generált kód a következő lesz: mov AX, 3 shl AX, 2 Ez a példa elég korlátozott, mivel csak az AX regisztert képes 4-el megszorozni. Ha szeretnénk ezt a korlátozást eltávolı́tani, akkor egy olyan makrót kellene definiálnunk, amelyiknek megadhatjuk, hogy melyik regisztert akarjuk megszorozni: %macro szorzas 4el 1 shl %1, 2 %endmacro A név után megadott szám adja meg, hogy a makrónak van egy argumentuma. Erre az argumentummal egy százalék jellel és utána a paraméter számával lehet hivatkozni, például: %1. Így ha ezt a makrót használjuk: mov BL, 3 szorzas 4el BL akkor bármilyen regiszter megadhatunk, például BL, és ı́gy a behelyettesı́tett kód a következő lesz: 151 mov

BL, 3 shl BL, 2 Ha több paramétert akarunk átadni egy makrónak, erre is lehetőség van: %macro csere 2 XCHG %1, %2 %endmacro Ennek a makrónak a használata a következő lesz: csere AX, BX Amint ez látható a makrók teljesen “integrálódhatnak” az assembly nyelvbe. Ennek sajnos az is a következménye, hogy a makrók és az utası́tások néha egy kicsit össze is keverhetők, például: %macro push 2 push %1 push %2 %endmacro . push ax push bx, cx Itt is látható, hogy az első alkalommal a push egy utası́tás, mı́g a második alkalommal a push egy makró, amit majd az assembler lecserél a definı́cióban megadott utası́tásokra. 11.21 Cı́mkék makrókban Eddig csak olyan makrókat láttunk amelyekben nem használtunk semmilyen memória cı́met, ugyanakkor a cı́mek egy kis figyelmet érdemelnek. Tegyük fel, hogy a következő makrót definiáljuk, amely egy értéket összehasonlı́t zérussal és

aszerint állı́tja be az AX regiszter értékét, hogy zérus volt-e az érték: %macro cmp zero 1 cmp %1, 0 jz nulla mov AX, 1 nulla: mov AX, 0 %endmacro Ha ezt a makrót többször is használjuk: cmp zero CX . cmp zero DX . akkor a következő kód generálódik: cmp CX, 0 jz nulla mov AX, 1 nulla: mov AX, 0 152 . cmp DX, 0 jz nulla mov AX, 1 nulla: mov AX, 0 . Ahogy ez itt is látható, ebben az esetben a nulla cı́m kétszer is megjelenik a kódban. Ezt az assembler nem engedi meg és hibát fog generálni Ilyen esetben a megoldás az, hogy a nulla cı́mnek “lokálisnak”, egyedinek kell lennie az egyes makró behelyettesı́tések során. Ezt úgy lehet elérni, hogy a cı́m elé kettő darab százalék jelet kell tenni: %macro cmp zero 1 cmp %1, 0 jz %%nulla mov AX, 1 %%nulla: mov AX, 0 %endmacro Ha ezt az újabb makró definı́ciót használjuk: cmp zero CX . cmp zero DX . akkor már nem lesz semmi gond, hiszen a

következő kód generálódik: cmp CX, 0 jz nulla2345 mov AX, 1 nulla2345: mov AX, 0 . cmp DX, 0 jz nulla7453 mov AX, 1 nulla7453: mov AX, 0 . A makrókban a dupla százalék jellel definiált cı́mek esetén az assembler garantálja, hogy minden egyéb, a programban előforduló cı́mtől eltérő cı́met fog generálni, vagyis minden makró behelyettesı́tés esetén a cı́m egyedi lesz. 11.22 “Greedy” makró paraméterek Az is előfordulhat, hogy nem csak fix számú argumentumot akarunk megadni egy makrónak, hanem néha többet is. Erre az esetre való a “greedy” paraméter, ami azt jelenti, hogy minden utána következő érték hozzá tartozik. Például: %macro PRINT 1+ 153 JMP %%atlep %%szoveg: DB %1, ’$’ %%atlep: MOV DX, %%szoveg MOV AH,9 INT 21H %endmacro A példában a 1+ azt jelenti, hogy a makrónak egy paramétere biztosan van, de lehet több is. Abban az esetben ha több paramétert is megadunk,

akkor mindegyik, egymás után a %1 helyére kerül. A fenti makró használatára a példa: PRINT ’Hello vilag’, 10, 13 amiből a következő kód generálódik: JMP atlep87643 szoveg8964: DB ’Hello vilag’, 10, 13, ’$’ atlep87643: MOV DX, szoveg8964 MOV AH,9 INT 21H 11.3 Makrók és függvények még egyszer A fenti ismeretek tükrében érdemes még egyszer összehasonlı́tani a függvényeket és a makrókat egy példán keresztül. A példában az előző bekezdés makróját hasonlı́tjuk össze egy függvénnyel, amelyik szintén egy szöveget nyomtat ki. Az összehasonlı́tás a 111 táblán található A táblából úgy tűnik, hogy a makrók rövidebb kódot generálnak, de általában inkább az a helyzet, hogy a további makró hı́vások esetén újra és újra több kód kerül be a forráskódba, mı́g az újabb függvényhı́vások esetén csak újabb PUSH, CALL és ADD

utası́tások adódnak hozzá a programhoz. 11.4 Makrók gyűjtemények A gyakran használt makrókat össze lehet gyűjteni egy file-ba, majd ezeket később igen könnyen lehet használni. Például definiáljunk két egyszerű makrót Az egyik makró egy billentyű leütésére vár, a másik makró pedig a programból való kilépést hajtja végre: %macro BillVar 0 MOV AH, 0 INT 16h %endmacro %macro Kilep 0 INT 20h %endmacro Ezeket a makrókat mentsük el egy makro.inc file-ba Ha ezután ezeket a makrókat egy programban használni szeretnénk, akkor a következő módon járhatunk el: 154 %include "makro.inc" org 100h BillVar Kilep Ebből is látható, hogy ha megfelelő neveket használunk a makrók esetén, akkor nagyon “beszédes” (könnyen érthető, értelmezhető) programokat tudunk ı́rni a segı́tségükkel. 155 Makró definı́ció %macro PRINT 1+ JMP %%atlep %%szoveg: DB %1, ’$’

%%atlep: MOV DX, %%szoveg MOV AH,9 INT 21H %endmacro Makró használat PRINT ’Hello’, 13, 10 PRINT ’Vilag’, 13, 10 Makróból generált kód JMP atlep6345 szoveg9092: DB ’Hello’, 13, 10, ’$’ atlep6345: MOV DX, szoveg9092 MOV AH,9 INT 21H JMP atlep7231 szoveg1235: DB ’Vilag’, 13, 10, ’$’ atlep7231: MOV DX, szoveg1235 MOV AH,9 INT 21H Függvény definı́ció PRINT: PUSH BP MOV BP, SP PUSH AX PUSH DX MOV AH, 9 MOV DX, [BP+4] INT 21h POP DX POP AX POP BP RET Függvény használat PUSH szoveg1 CALL PRINT ADD SP, 2 PUSH szoveg2 CALL PRINT ADD SP, 2 . szoveg1: db ’Hello’, 13, szoveg2: db ’Vilag’, 13, Függvényből generált kód PRINT: PUSH BP MOV BP, SP PUSH AX PUSH DX MOV AH, 9 MOV DX, [BP+4] INT 21h POP DX POP AX POP BP RET . PUSH szoveg1 CALL PRINT ADD SP, 2 PUSH szoveg2 CALL PRINT ADD SP, 2 . szoveg1: db ’Hello’, 13, szoveg2: db ’Vilag’, 13, 11.1 tábla: Makrók és függvények összehasonlı́tása 156 10, ’$’

10, ’$’ 10, ’$’ 10, ’$’ 11.5 Ellenőrző kérdések 1. Mi az a makró? 2. Miben hasonlı́tanak és miben különböznek a makrók és a függvények? 3. Hogyan definiálhatunk lokális cı́meket makrókban? 4. Hogyan definiálhatunk több soros makrót? 5. Mi történik rekurzı́v makrók esetén? 6. Fel kell-e tölteni a makró paramétereit a veremre a makró meghı́vása előtt? 7. Mit jelent az, hogy “greedy” makró paraméter? 8. Mi lesz a forrás kód a következő makró használata után: %define %define %define . MOV AX, bb(x) 2+x aa(x) 1+bb(x) cc(x) [BX+aa(x)] cc(1) 157 158 12. Fejezet String műveletek A string kezelő utası́tások memóriablokkokkal végeznek műveletet. A string, tulajdonképpen szöveg, a szöveg pedig nem más mint egy karakter sorozat vagy byte sorozat és egy byte sorozat amikor a memóriában tároljuk akkor pedig megfelel egy memóriablokknak. A szövegek

tárolására két stratégiát alkalmazhatunk: • fix méretű szövegek és • változó méretű szövegek. A fix méretű szövegek esetén minden szöveg azonos méretű és ı́gy egyszerű a kezelésük. Ugyanakkor két probléma is lehet a fix méretű szövegekkel: • Ha az adott szöveg hosszabb mint a fix méret, akkor azok a karakterek amelyek a fix méreten túlra esnek elvesznek. Ilyenkor lerövidı́tjük (truncation) a szöveget • Ha az adott szöveg rövidebb mint a fix méret, akkor a maradék karaktereket ki szokták tölteni (padding). Ezt a két problémát figyelembe kell venni akkor, amikor a fix méretű szövegek méretét próbáljuk meghatározni. Ösztönösen nagy értéket akarunk választani, ı́gy minden szöveg belefér és egy szöveget sem kell lerövidı́teni. Ugyanakkor ha csak egy nagy és több kisebb szöveg van, akkor elég sok helyet elpazarolhatunk. Erre a dilemmára

jelent megoldást a változó méretű szöveg A változó méretű szövegek esetén a szöveg pontosant annyi karaktert tárol, mint amennyire szükség van. Ugyanakkor a szöveg karakterein kı́vül még egy adatra szükség van és ez a szöveg hossza A szöveg hosszát kétféle stratégiával lehet megadni: • explicit módon tároljuk a szöveg méretét • egy lezáró karaktert (sentinel character) használunk. Nézzünk egy példát arra, amikor explicit módon tároljuk a szöveg méretét: szoveg: db ’Valamilyen szoveg’ hossz: db $-szoveg ahol a $ jel az aktuális cı́met jelenti. Ez a megoldás azért működik, mivel a $ jel éppen a szoveg cı́men található szöveg utolsó karaktere utáni cı́met jelenti és ebből vonjuk ki magát a szoveg cı́met. Feltételezve, hogy a NASM fordı́tó a szoveg szimbólikus cı́met a 200d decimális cı́mre fordı́tja le, akkor a fenti példában a $ jel

értéke 217d lesz és ı́gy a hossz cı́men a 17d értéket fogjuk tárolni. Így természetesen ezt is ı́rhatnánk: 159 szoveg: db ’Valamilyen szoveg’ hossz: db 17 de ezzel az a probléma, hogy ha később megváltoztatjuk a szöveg tartalmát akkor a hossz változót is meg kell vátloztatni. Az előző megoldást alkalmazva a szöveg hossza automatikusan számolódik ki ı́gy leveszi ezt a terhet rólunk. A másik megoldásban egy lezáró karakterrel jelöljük a szöveg végét, ı́gy nincs szükség explicit módon tárolni a szöveg hosszát, hiszen a szöveg elejétől a lezáró karakterig kell csak megszámolni a karakterek számát. Ennél a módszernél fontos feltételezés, hogy a lezáró karakter nem fog előfordulni magában a szövegben. Azt már láttuk, hogy ha az INT 21h megszakı́tást használjuk a 09h funkciókóddal akkor a szöveg végén a $ jelnek kell szerepelnie. Ezzel

szemben a C programozási nyelvben a szöveg végén az ASCII NULL karakter szerepel. Ez a karakter nem összekeverendő a nullás szám ASCII kódjával, mivel ez az érték 30h lenne, mı́g az ASCII NULL karakter értéke 00h. Az ilyen nullával lezárt szövegeket ASCIIZ szövegnek is szokták nevezni. Nézzük erre is egy példát: szoveg: db ’Valamilyen szoveg’,0 12.1 String utası́tások A string utası́tások a 7.6 bekezdésben találhatók Amint a bekezdésből látható, az utası́tások operandusai lehetnek egy forrás cı́m, egy cél cı́m vagy mindkettő A 8086-os processzoron a forrás cı́m a DS:SI (SI = source index) regiszter pár adja meg, mı́g 32 bites rendszeren a DS:ESI regiszterek adják meg a forrás cı́met. Hasonlóan a 8086-os processzoron a cél cı́met az ES:DI (DI = destination index) regiszterek, mı́g 32 bites rendszeren az ES:EDI regiszterek adják meg. Az utası́tások a leı́rtak alapján

automatikusan frissı́tik az SI illetve DI regisztereket az adat méretével: byte, 2 byte (word) vagy 4 byte (dword). A frissı́tés lehet csökkentés vagy növelés is, az irány (Direction) státusz bittől függően Az utası́tások jelentősége abban van, hogy ismétlő prefix-el lehet használni, amelyeket a 7.6 bekezdés szintén tárgyal. A prefix lehet feltételes vagy feltétel nélküli 12.11 String másolás Az adatok másolását érdemes egy kicsit jobban megvizsgálni, mivel érdekes működési módokat fedezhetünk fel, illetve későbbiekben azokat jól használhatjuk is. A másolás alapja a MOVS utası́tás (lásd ??. bekezdés), melynek működését a következő pseudo-kód tudja leı́rni: [ES:DI] = [DS:SI] if(DF == 0) { DI = DI + 1 SI = SI + 1 } else { DI = DI - 1 SI = SI - 1 } String másolás egyszerűen Az adatok másolása esetén általában nem kell azzal foglalkozni, hogy az index

regisztereket növeljük vagy csökkentjük a másolás során. A következő assembly programrészletben növekvő cı́mek mellett 160 (a) (b) (c) (d) (e) (f) 12.1 ábra: A MOVSB utası́tás egyszerű működése másoljuk át a tömböt: cld lea lea mov rep . array1: array2: si, array1 di, array2 cx, 321 movsb repb 321 repb 321 A másolás folyamatát a 12.1 ábra mutatja be String másolás átlapolással Ezek után nézzük meg mi történik a következő programrészletben? cld lea si, array1 161 (a) (b) (c) (d) (e) (f) 12.2 ábra: A MOVSB utası́tás működése átlapolással és növekvő cı́mekkel lea di, array2 mov cx, 321 rep movsb . array1: db ’X’ array2: repb 321 A változás abban van, hogy Úgy tűnik mintha az array1 nevű változó most csak 1 elemű lenne. Akkor mégis hogyan fog ez a programrészlet 321 byte-ot átmásolni? Azt kell figyelembe venni, hogy az assembler az

egymás után ı́rt adat vagy kódrészleteket közvetlenül egymás után fogja elhelyezni a memóriában a fordı́tás során. A jelen esetben ez azt jelenti, hogy először az array1 cı́m által jelölt egy byte-ot teszi a memóriába, majd közvetlenül utána másik 321 byte-ot helyez el. Ez az elrendezés a 12.2a ábrán látható Ennek az a következménye, hogy ı́gy a két tömb (array1 és array2) tulajdonképpen át van lapolva, más szóval egymásba érnek. Ebben az esetben nem mindegy, hogy növekvő vagy csökkenő cı́mek mellett másoljuk át az adatokat. A 122 ábra azt a helyzetet mutatja, amikor a Direction státusz bit zérus és az SI illetve DI regiszterek növekednek a MOVSB utası́tás ismételt végrehajtása során. Az ábrában a szagggatott vonallal jelölt nyı́l jelöli, hogy melyik adat hova lesz átmásolva. Amint látható az ábrából, ebben az esetben lényegében azt kapjuk,

hogy az array1 cı́men lévő byte értékével felülı́rjuk az array2 tömb minden elemét. Egy tömb adott byte-al való felülı́rására ugyanakkor jobb a STOS utası́tása (lásd 7.64 bekezdés) String másolás nagyobb átlapolással Esetleg valakiben felmerülhet, hogy ezek után mi van akkor, ha nem csak egy byte-ot definiálunk az array1 cı́men? A helyzet az, hogy a működés nem változik, csak most, az array1 cı́men definiált több értékkel, mint mintával ı́rjuk felül az array2 cı́men található tömböt. Például az alábbi kód működését: cld lea lea mov rep si, array1 di, array2 cx, 321 movsb 162 (a) (b) (c) (d) (e) (f) 12.3 ábra: A MOVSB utası́tás működése nagyob átlapolással és növekvő cı́mekkel Végeredményben ismétlődő mintát kapunk. . array1: array2: db ’X’, ’Y’, ’Z’ repb 321 a 12.3 ábra mutatja be Az ábra azt mutatja, hogy a

programrészletben megadott három byte fog ismétlődni az array2 cı́mtől is. Erre már nem lenne képes a STOSB utası́tás, csak akkor ha az ismétlődő minta byte, word vagy double word méretű. String másolás átlapolással fordı́tott forrás és cél cı́mmel A 12.11 bekezdésben bemutatott másolást egy kicsit másképpen is felı́rhatjuk, vagyis például a forrás és cél cı́met felcserélhetjük. Nezzük meg mi történik ilyenkor: cld lea lea mov rep . array1: array2: si, array2 di, array1 cx, 321 movsb db ’X’ repb 321 Amint a 12.4 ábrán is látható, ebben az esetben az array2 cı́men található tömböt “eggyel előre másoljuk”. Ha csak az array2 tömböt tekintjük, akkor ez lényegében azt jelenti, hogy a tömb első elemét “töröljük”, hiszen a programrészlet végrehajtása után az array2 tömbben már nem található az első elem, illetve az utolsó elem a tömb

végén kétszer szerepel. Ha a legutolsó elemre nincs szükség duplán akkor az array2 tömb lényegében egy elemmel kevesebbet tartalmaz. Ez helyzet látható a 12.5 ábrán 12.12 Stringek összehasonlı́tása Az összehasonlı́tás alapja a CMPS utası́tás melynek működését a következő pseudo-kód ı́rja le: 163 (a) (b) (c) (d) (e) (f) 12.4 ábra: A MOVSB utası́tás működése átlapolással és fordı́tott forrás és cél cı́mmel (a) 12.5 ábra: A tömbök állapota a MOVSB utası́tás végrehajtása utána, amikor a tömbök át vannak lapolva és fordı́tott forrás és cél cı́mmel. [ES:DI] összehasonlı́tása [DS:SI] if(DF == 0) { DI = DI + 1 SI = SI + 1 } else { DI = DI - 1 SI = SI - 1 } Fontos azt tudni, hogy az összehasonlı́tás az assembly nyelvben úgy történik, hogy tulajdonképpen a két értéket kivonjuk egymásból és az eredmény alapján a státusz

biteket beállı́tjuk. Például ha a két érték egyenlő, akkor a különbségük zérus lesz. Ezért van, hogy a zérus státusz bit jelzi az értékek egyenlőségét vagy nem egyenlőségét. A CMPS utası́tás nagyon jól kombinálható a REPZ, REPE, REPNZ és REPNE prefixekkel. Stringek egyenlősége A következő programrészlet két szöveget hasonlı́t össze: string1: db ’abcxef’,0 strlen EQU $ - string1 string2: db ’abcdef’,0 . 164 mov CX, strlen mov SI,string1 mov DI,string2 cld repe cmpsb Az összehasonlı́tás addig folytatódik ameddig a karakterek megegyeznek, illetve a CX regiszter értéke nem zérus. A fenti példában a program addig fog futni, amı́g meg nem találja a string1 szövegben az x és a string2 szövegben a d karaktereket, melyek nem egyenlőek. Ugyanakkor fontos, hogy amikor az összehasonlı́tás véget ér az SI és DI regiszterek az utoljára összehasonlı́tott karakterek

utáni karakterre mutatnak, vagyis az e karakterre. Tehát ha a szövegekben az első eltérő karakterre vagyunk kiváncsiak, akkor az SI és DI regisztereket csökkenteni kell eggyel. 12.13 Keresés stringek-ben A szövegben való keresésre a SCAS utası́tás használható. Az utası́tás pseudo kódja: [ES:DI] összehasonlı́tása AL-el if(DF == 0) { DI = DI + 1 } else { DI = DI - 1 } Ez az utası́tás is az ismétlő prefixekkel használható a legjobban. Egy karakter keresése Nézzünk egy egyszerű példát, amikor azt szeretnénk ellenőrizni, hogy egy karakter megtalálható-e a szövegben és ha igen, akkor a cı́mére is kiváncsiak vagyunk, tehát, hogy hol található a karakter a szövegben: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 string1: db ’abcxef’,0 strlen EQU $ - string1 . mov CX, strlen mov DI, string1 mov AL, ’x’ cld repne scasb jnz nincs meg dec di . jmp vege nincs meg: . vege: A 8. sorban a kereső

parancsot addig ismételjük, amig az AL regiszter értéke nem egyenlő az ES:DI regiszterpár által mutatott értékkel, vagy a CX regiszter értéke zérus nem lesz. A 9 sorban azt ellenőrizzük, hogy miért ért véget a keresés. Ha a zérus státusz bit értéke nulla, akkor nem találtuk 165 meg a karaktert ezért ugrunk a 9. sorban Ha valóban megtaláltuk a karaktert, akkor a zérus státusz bit értéke 1 lesz és “átesünk” a 10. sorba A 10 sorban azért csökkentjük a DI regiszter értékét, hogy a regiszter valóban arra a karakterre mutasson, amelyiket megtaláltunk. lényegében a keresést meg is fordı́thatjuk. Ebben az esetben amı́g a memória értékei megegyeznek (egyenlőek) a megadott karakterrel, addig folyamatosan továbblépünk a memóriában, mı́g ha a memóriában található érték különbözik az AL regiszter értékétől akkor leáll a keresés. Például egy

szöveg elején ugorjunk át minden SPACE karaktert: 1 string1: db ’ abc’,0 2 strlen EQU $ - string1 3 . 4 mov CX, strlen 5 mov DI, string1 6 mov AL, ’ ’ 7 cld 8 repe scasb 9 dec di 10 . A program végén a DI regiszter az első nem SPACE karakterre fog mutatni. Így a programban a 8. sorban a REPE prefix azt jelenti, hogy ismételjük addig a SCASB utası́tást, amı́g egyenlő az AL regiszterrel. 12.14 LODSB és STOSB utası́tások használata Elsőre furcsának tűnhetnek a LODSB és STOSB utası́tások. Főleg azért mert nem igazán használhatók a REP prefixekkel. (Azért nincs értelme használni a REP prefixet például a LODSB utası́tással mivel ez csak azt jelentené, hogy n-szer betöltünk értéket az AL regiszterbe.) Ugyanakkor abban az esetben, ha nem csak át kell másolni az adatokat, hanem közben valamilyen módon módosı́tani is kell, akkor a LODSB utası́tással be tudjuk tölteni az adatot, majd a

módosı́tás után a STOSB utası́tással tárolni tudjuk. Erre nézzünk egy példát, amelyben minden karakter helyett az utána következő karaktert szeretnénk tárolni: 1 2 3 4 5 6 7 8 9 cld lea si, forras lea di, cel mov cx, [hossz] ujra: lodsb inc al stosb loop ujra 12.2 String utası́tások előnyei és hátrányai Két fő előnye van ezeknek az utası́tásoknak: • Az index regiszterek automatikusan módosulnak a Direction státusz bit szerint. • Képesek egyszerre két, a memóriában levő operandussal dolgozni, vagyis például képesek memóriából memóriába másolni. Az utası́tások nem csak, hogy egyszerűek és elegánsak, de nagyon hatékonyak is. Az utası́áts annál gyorsabb minnél nagyobb méretű adatokat másolunk egyszerre, ı́gy a MOVSB utası́tásnál “gyorsabb” 166 a MOVSW és ennél “gyorsabb” a MOVSD utası́tás. Így például ha 4099 byte-ot szeretnénk a

lehető leggyrosabban átmásolni egyik cı́mről egy másikra, akkor a következő kódrészlet használható: 1 2 3 4 5 6 7 8 cld lea lea mov rep movsw movsb . si, forras di, cel cx, 1024 movsd ; 4096 byte ; 2 byte ; 1 byte A 4. sorban azért adunk meg 1024-et, mivel a MOVSD utası́tások 4 byte-ot mozgatnak és ı́gy 1024 × 4 = 4096 byte-ot másolunk át, majd a 6. és 7 sorban a maradék kettő és egy byte-ot mozgatjuk át Ebben a kódrészletben a szöveg mérete előre ismert volt, de lehetőség van hasonlóan gyors adat másolásra akkor is, ha a szöveg méretét nem ismerjük előre. Erre mutat példát a következő programrészlet: 1 cld 2 lea si, forras 3 lea di, cel 4 mov cx, [meret] 5 shr cx, 2 6 jz kevesebb mint 4 7 rep movsd 8 kevesebb mint 4: 9 mov cx, [meret] 10 and cx, 11b 11 jz vege 12 rep movsb 13 vege: ; osztás 4-el ; maszkolás, 0-3 lehet A 4. sorban betöltjük a másolandó adat méretét, amit az 5

sorban elosztunk 4-el Azért 4-el, mert megpróbáljuk a MOVSD utası́tást használni és ez az utası́tás 4 byte-ot mozgat egyszerre, ı́gy a CX regiszterbe a meret negyedét kell tárolni. Ugyanakkor a 6 sorban ellenőrizni kell, hogy a meret negyede az nagyobb-e mint zérus. Ha kisebb, például csak 3 byte-ot kell átmásolni, akkor nem szabad használni a MOVSD utası́tást és ezért átugorjuk azt. Ha nagyobb, akkor 4 byte-onként átmásoljuk az adatokat. Ekkor még mindig előfordulhat az, hogy amikor a meret értékét eloszottuk 4-el, akkor volt valamennyi maradék. Ezt a maradékot az 5 sorban “eldobtuk”, vagyis nem vettük figyelembe A 4-el való osztásnak a maradéka lehet: 0, 1, 2 és 3. Ahhoz, hogy megállapı́tsuk, hogy mennyi a maradék a 10 sorban maszkoljuk a meret értékét úgy, hogy a CX értéke csal 0, 1, 2 és 3 lehet. Itt is megvizsgáljuk, hogy volt-e maradék. Ha nem volt maradék, akkor a 11

sorból a 13 sorba ugrunk Ha volt maradék, akkor a 12. sorban a REP MOVSB utası́tással másoljuk át a byte-okat 167 12.3 Ellenőrző kérdések 1. Mik az előnyei és hátrányai a fix méretű szövegeknek? 2. Mik az előnyei és hátrányai a változó méretű szövegeknek? 3. Hasonlı́tsa össze a különböző szöveg tárolási módokat, amikor lezáró karaktert tárolunk illetve amikor közvetlenül tároljuk a szöveg hosszát. 4. Mik az előnyei a string kezelő utası́tások használatának? 5. Miért nincs értelme a REP prefixnek a LODSB utası́tás esetén? 6. Adjon meg olyan esetet, amikor fontos a Direction státusz bit értéke! 7. Hasonlı́tsa össze a következő két szöveg definı́ciót Mik az előnyök és hátrányok: szoveg: db ’Hello vilag’ hossz: dw $-szoveg illetve szoveg: db ’Hello vilag’ hossz: dw 11 168 13. Fejezet Példák függvényekre és szöveg

kezelésre 13.1 Szöveg hosszának megállapı́tása 169 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 org 100h push szoveg call strlen add sp, 2 int 20h szoveg: db ’abcd’,0 strlen: push bp mov bp, sp push cx push di push es les di, [bp+4] mov cx, 0ffffh cld mov al,0 repne scasb jcxz sl no string inc di mov ax, di sub ax, [bp+4] clc jmp sl done sl no string: stc sl done: pop es pop di pop cx pop bp ret ; szöveg pointer ES:DI-be ; lehetséges maximális hossz ; NULL karakter ; if ECX = 0, not a string ; növeljük 1-el, ı́gy 0-ra mutat ; szöveg hossz AX-ben ; nem volt hiba ; carry 1 => nem szöveg 13.1 tábla: Egy szöveg hosszát megállapı́tó függvény 170 14. Fejezet C és assembly programok kapcsolata 14.1 Függvény hı́vási konvenciók 14.11 16 bites mód Egy függvénynek a paramétereket a vermen keresztül adjuk át. A legelső paraméter kerül a legalacsonyabb

memória cı́mre Akár 8 vagy 16 bite értéket akarunk feltölteni a veremre minden alkalommal egy 16 bites, word értéket kell tárolni a vermen. Ha 16 bitnél több bites értéket akarunk tárolni, akkor is word értékekeket kell feltölteni a veremre little-endiam módon. Ez azt jelenti, hogy a legkisebb memória cı́mre kerül a legkisebb helyiértékű word. Mindez azt jelenti, hogy minden érték a vermen 2 byte-ra van illesztve (2 byte aligned). A függvények a visszatérési értékükett regiszteren keresztül adjuk át. 8 bites egész szám esetén az AL regisztert használjuk, 16 bites egész szám esetén az AX regisztert használjuk, 32 bites egész szám esetén a DX:AX regisztereket használjuk, boolean érték esetén az AX regisztert használjuk és valós szám esetén az ST0 FPU regisztert használjuk. 14.12 32 bites mód A cdecl hı́vási konvenció az alap eset Linux-on. Konvenció cdecl

stdcall fastcall, Microsoft és GNU fastcall, Borland Paraméter sorrend a vermen Első paraméter az alacsony cı́men Első paraméter az alacsony cı́men Az első két paraméter ECX és EDX regiszterekben, a többi paraméter stdcall szerint Az első három paraméter EAX, ECX és EDX regiszterekben, a többi paraméter stdcall szerint 14.1 tábla: Függvény hı́vási konvenciók 32 bites módban 171 Paraméter eltávolı́tó a hı́vó a függvény a függvény a függvény 172 15. Fejezet Optimalizálás A fejezetben tárgyalt eljárások és módszerek egy része csak a modern x86-os processzorok esetén használható, mivel egy részük még nem is létezett az 8086-os processzor idejében. 15.1 Optimalizálás sebességre Az első és legfontosabb dolog, hogy azonosı́tsuk azt a kód részletet, ahol a programunk legtöbb időt tölti.1 Ez az egyik legfontosabb alapelv, mivel a mai programok

egy jelentős része gyakran sokkal több időt tölt modulok, erőforrások betöltésével, adatbázisok elérésével mint valamilyen számı́tással a programban. Így ha csak a számı́tást optimalizáljuk akkor a program által felhasznált időnek csak az 1%-át javı́tjuk, mı́g a többi idő változatlan marad. Az assembly kód használata egy programban csak akkor hasznos, ha a program CPU intenzı́v, például: kép és hang feldolgozás, titkosı́tás, rendezés, adat tömörı́tés és komplikált matematikai számı́tás. A CPU intenzı́v programokra általában az jellemző, hogy van egy olyan ciklus amit a program nagyon sokszor végrehajt. Ez általában az úgynevezett legbelső ciklus (innermost loop) Ezt a program részletet kell megtalálni és optimalizálni. Ha bármilyen más program részt optimalizálunk, akkor tulajdonképpen csak az időnket pazaroljuk, mivel nem tudunk gyorsı́tást

elérni és a programunkat csak átláthatatlanná tesszük az optimalizálással. A másik fontos alapelv, hogy érdemes magát az optimalizálandó algoritmust tanulmányozni, mivel sokszor egy másik algoritmus választásával már jobb eredményt érhetünk el. 15.11 Sorrenden kı́vüli végrehajtás Lényegében minden modern x86-os processzor képes a sorrenden kı́vüli végrehajtásra (out-of-order execution). 1 “Premature optimization is the root of the evil”. 173 1 2 3 4 5 6 mov ax, [mem1] imul 6 mov [mem2], ax mov bx, [mem3] add bx, 2 mov [mem4], bx 15.1 tábla: Sorrenden kı́vüli végrehajtás 15.12 Utası́tás betöltés és dekódolás 15.13 Utası́tás késleltetés és átbocsátási képesség 15.14 Függőségi lánc megtörése 15.15 Ugrások és függvény hı́vások Függvényhı́vások eltüntetése Feltétel nélküli ugrások eltüntetése 15.2 Optimalizálás

méretre 15.3 Memória hozzáférés optimalizálása 15.4 Ciklusok optimalizálása 15.5 Vector programozás 15.6 Problémás utası́tások 174 16. Fejezet Optimalizált példák 16.1 ASCII tábla nyomtatása rövidebben Ez a program a 9.11 fejezetben bemutatott program rövidebb változata Ebben a programban két dolgot használunk ki. Az egyik az, hogy a DL regiszter egy 8 bites regiszter és ı́gy 0 és 255 közötti számokat tud tárolni, illetve az ASCII karaktereket is 0 és 255 közötti számok reprezentálnak. Így a regiszter és az ASCII karakterek számai között egy az egyes megfeleltetést tudunk létrehozni. Az igazi trükk a 6. sorban van, itt növeljük meg mindig a DL regiszter tartalmát Igen ám de amikor a DL regiszter tartalma 255, majd megnöveljük az értékét, akkor bár 256-ot kellene kapni, de ezt nem képes a regiszter tárolni, ı́gy “átfordul”. Ez azt jelenti, hogy a 255 után a 0

következik Ez fog történni 6. sorban és az INC utası́tás be is állı́tja a ZF státusz bitet megfelelően, vagyis nincs szükség CMP utası́tásra, elegendő a feltételes utası́tást használni. Ezeknek a trükköknek a segı́tségével 15 byte-ról 12 byte-ra lehet csökkenteni a lefordı́tott program méretét. 1 2 3 4 5 6 7 8 org 100h MOV DL, 0 MOV AH, 2 ujra: INT 21h INC DL JNZ ujra INT 20h 16.1 tábla: Az ASCII tábla kinyomtatására szolgáló optimalizált program 175 176 17. Fejezet Megjegyzések 17.1 Szokásos hibák Az alábbi lista a leggyakrabban elkövetett hibákat tartalmazza: • Elfelejtjük a regisztereket elmenteni! Minden művelet vagy függvény elején mentsük el a regisztereket, illetve a művelet vagy függvény végén állı́tsuk helyre a regisztereket. Erre azért lehet szükség, mert a regiszter értékére később szükségünk van, vagy nem szeretnénk, hogy a

művelet vagy függvény az általa megváltoztatott regiszterekkel a végrehajtásban az utána következő műveleteket befolyáolja. Ne felejtsük el, hogy a POP és PUSH utası́tások sorrendje különböző kell legyen (lásd ??. fejezet) • A PUSH vagy POP utası́tásnak nincs megfelelő párja. Ez lényegében azt jelenti, hogy bármilyen végrehajtási útvonalon fut le a program a PUSH és POP műveletek számának meg kell egyeznie. Vegyük a következő példát: push bx test cx, cx jz vege . pop bx vege: ret Ha a program a vege cı́mre ugrik, akkor a pop bx utası́tás nem hajtódik végre. Ez azt jelenti, hogy a ret utası́tás a BX regiszter korábbi értékét fogja levenni a veremről és ı́gy rossz cı́mre fog ugrani a program. • Egy speciális célra foglalt regisztert nem rendeletésszerűen használunk. Például a BP regiszternek speciális rendeltetése van amikor függvényeket használunk •

Stack-relatı́v cı́mzés használata PUSH műveletek után. A stack-relatı́v cı́mzés itt azt jelenti, hogy az SP regisztert használjuk a cı́mzésben. Például: mov [sp+4], di push ax push bx push bp cmp si, [sp+4] 177 A fenti kódrészletben a programozó eredeti célja valószı́nűleg az volt, hogy az SI és DI regisztereket összehasonlı́tsa, de a két PUSH utası́tás megváltoztatja az SP regiszter értékét. Gyakorlásképpen gondoljuk végig, hogy az SI regiszter mivel lesz összehasonlı́tva? A válasz lábjegyzetben található.1 • Egy változó értékének és cı́mének összekeverése! valtozo: dw 0 . mov bx, valtozo ; valtozo cı́me kerül BX-be mov ax, [valtozo] ; valtozo értéke kerül AX-be mov cx, [bx] ; valtozo értéke kerül CX-be • A függvény hı́vási könvenciókat nem tartjuk be. Fontos, hogy a programokban a függvényeknek a megfelelő sorrendben adjuk át a

paramétereket. • Elfelejtjük a RET utası́tást a függvény végéről. Ha a RET utası́tást nem tesszük a függvény végére, akkor a program a függvény utolsó utası́tása utáni művelettel fog folytatódni anélkül, hogy visszatérne a hı́vási ponthoz. • Elfelejtjük kiürı́teni a Floating-Point Unit vermét. Mielőtt az FPU verem bármelyik “regiszterébe” értéket ı́rhatnánk a regisztert törölni kell. (Lásd ?? fejezet) • Az irány státusz bitet (direction flag) elfelejtjük megfelelően beállı́tani. • Előjeles és előjel néküli egész számok összekeverése a műveletek során. • Rossz indexelést használunk egy tömb adatszerkezet elérése során. A tömb indexet meg kell szorozni a tömb egy elemének méretével: tomb: dw 0, 0, 0, 0, 0, 0, 0, 0, 0 . mov bx, tomb . mov si, 2 lea di, [bx+si*2] • Egy tömb cı́mzésénél a nem megfelelő indexet használjuk.

Figyeljünk arra, hogy egy n elemű tömbben az elemek indexe nullától n − 1-ig tart. • A LOOP műveletet úgy használjuk, hogy a CX regiszter értéke zérus. Ne feledjük, hogy a LOOP művelet először csökkenti a CX regiszter értékét és csak utána ellenőrzi, hogy a regiszter zérus lett-e. Vegyük például a következő kódrézletet: mov cx, 0 ujra: . loop ujra Gyakorlásképpen határozzuk meg, hogy a fenti kódrészlet hányszor fut le? A válasz lábjegyzetben található.2 1A 2A fenti kódrészletben valójában az SI és az AX regiszterek tartalma lesz összehasonlı́tva. fenti kódrészlet 216 -szor fog lefutni. 178 A. Függelék ASCII táblázat Elvileg 256 ASCII karakter van. Az A1 táblán látható ASCII táblázat csak a fontosabb karaktereket tartalmazza és direkt ilyen módon van ábrázolva. dec ⇓ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ⇒ hex 0 1 2 3 4 5 6 7 8 9 A B C D E F 0 0

NULL BELL BS HT LF VT FF CR 16 1 32 2 SPC ! ” # $ % & ’ ( ) * + , . / 48 3 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 64 4 @ A B C D E F G H I J K L M N O 80 5 P Q R S T U V W X Y Z [ ] ˆ A.1 tábla: Egyszerűsı́tett ASCII táblázat A táblázatban szereplő speciális szimbólumok magyarázata: BELL - Alarm BS - Backspace HT - Horizontal TAB LF - Linefeed VT - Vertical TAB FF - Formfeed CR - Carriage return 179 96 6 ‘ a b c d e f g h i j k l m n o 112 7 p q r s t u v w x y z { | } ˜ DEL SPC - Space DEL - Delete 180 B. Függelék Felhasznált irodalom 1. Agner Fog: Optimizing subroutines in assembly language An optimization guide for x86 platforms, Copenhagen University College of Engineering, 2009 2. Sivarama P Dandamudi: Introduction to Assembly Language Programming, For Pentium and RISC Processors, Springer, 2005. 181 Példa programok listája Öt karakter beolvasása és kinyomtatása fordı́tott sorrendben, 100 Érték

szerinti paraméter átadás a vermen keresztül, 136 ASCII tábla kinyomtatása, 111 ASCII tábla nyomtatása rövidebben, 175 Cı́m szerinti paraméter átadás a vermen keresztül, 136 CAPS LOCK állapotának nyomtatása, 114 Egy byte bináris kinyomtatása, 91 Egy byte hexadecimális kinyomtatása, 95 Egy hexadecimális szám kinyomtatása, 93 Egy karakter beolvasása és a köv. kinyomtatása (a), 98 Egy karakter beolvasása és az utána köv. kinyomtatása (b), 98 Egy karakter kinyomtatása, 48 Egy karakter n-szeri kinyomtatása, 104 Egy sakktábla kinyomtatása, 108 Egy sakktábla kinyomtatása XOR-al, 109 Egy szöveg kinyomtatása, 49 Egy számjegy beolvasása és kinyomtatása, 97 Egy téglalap kinyomtatása, első rész, 105 Egy téglalap kinyomtatása, második rész, 105 Egymásba ágyazott függvények, 126 Első program, 47 Két szám összeadása, 101 Két szám összeadása ciklussal, 101 Második

példa a paraméter átadásra memórián keresztül, 128 Példa a paraméter átadásra a vermen keresztül, 132 Paraméter átadás memórián keresztül, 128 Paraméter átadás regiszteren keresztül, 128 Szöveg hosszát megállapı́tó függvény, 169 Szöveg nyomtatása függvénnyel, 136 Szám kiı́rása decimális formában, 112 Számjegyek nyomtatása rekurzı́v függvénnyel, 144 Változó számú szám összeadása és annyi pont nyomtatása, 139 182 Tárgymutató rekurzı́v függvény, 141, 143 rendszer busz, 17 RISC, 11 ASCII, 48 AT&T, 15 big-endian, 24 branching, 21 seg kulcsszó, 39 stack, 121 stack frame, 131 C programozási nyelv, 124, 135, 136 CALL, 130 Carry bit, 92 CISC, 11 COM, 87 times kulcsszó, 39 TOS, 121 ugró utası́tás, 21 data alignment, 25 wrt kulcsszó, 40 EXE, 88 függvény, 124 frame pointer, 131, 141 gépi kód, 12 I/O kontroller, 26 időleges tárolás, 123 Intel,

15 LIFO, 121, 134 Little endian, 38, 40 Little-endian, 125 little-endian, 24 lokális változók, 141 LSB, 24 maszkolás, 95 megszakı́tás, 27 memory management, 87 moduláris programozás, 124, 144 MSB, 24 nasm, 125 overhead, 144 paraméter átadás, 126 paraméter átadás memóriával, 126, 128 paraméter átadás regiszterrel, 126, 128 paraméter átadás veremmel, 126, 130 POP, 121, 123, 124, 130 POPA, 135 Program Segment Prefix, 87 PSP, 87 PUSH, 121, 123, 130 PUSHA, 135 183

Programozás | Assembly » Iványi Péter - Assembly programozás

Alapadatok

Értékelések

Mit olvastak a többiek, ha ezzel végeztek?

Történelem emelt szintű érettségi szóbeli tételek, 2006

Bodlaki Tamás - Az Assembly nyelvű programozás alapjai

Peugeot 307SW kézikönyv

Access adatbázis-szerkesztő

Tartalmi kivonat

Cikkajánló

Hogyan keressünk állást az interneten?

Doksiajánló

Tartalmak

Navigáció

Programozás | Assembly » Iványi Péter - Assembly programozás

Alapadatok

Doksi olvasó beágyazása

Értékelések

Mit olvastak a többiek, ha ezzel végeztek?

Történelem emelt szintű érettségi szóbeli tételek, 2006

Bodlaki Tamás - Az Assembly nyelvű programozás alapjai

Peugeot 307SW kézikönyv

Access adatbázis-szerkesztő

Tartalmi kivonat

Cikkajánló

Hogyan keressünk állást az interneten?

Doksiajánló

Tartalmak

Navigáció