# Systemprogrammierung

Speicherverwaltung: Adressraumkonzepte

Wolfgang Schröder-Preikschat

Lehrstuhl Informatik 4

02. Dezember 2014

Systemprogrammierung

## Gliederung

- Grundlagen
  - Fragmente
  - Zuteilungseinheiten
  - Strategien
- 2 Adressräume
  - Überblick
  - Physischer Adressraum
  - Logischer Adressraum
  - Virtueller Adressraum
- Zusammenfassung

# Herangehensweisen zur Verwaltung des Arbeitsspeichers

Fest abgesteckte oder ausdehn-/zusammenziehbare Gebiete für jedes Programm

#### statisch

- Arbeitsspeichergebiete maximaler, fester Größe
  - je eins pro Prozessadressraum inkl. dem Betriebssystem
  - innerhalb der Gebiete ist Speicher dynamisch zuteilbar
- Gefahr von Leistungsbegrenzung/-verlusten, z.B.:
  - Brache eines Gebiets in anderen Gebieten nicht nutzbar
  - kleine E/A-Bandbreite mangels Puffer im Gebiet des BS
  - erhöhte Wartezeit von Prozessen wegen zu kl. Puffern

#### dynamisch

- Arbeitsspeicherfragmente variabler Größe
  - ggf. mehrere pro Prozessadressraum inkl. Betriebssystem
  - das Betriebssystem ermittelt freie Bereiche und teilt sie zu
- Zusammenspiel Laufzeit- und Betriebssystem
  - d.h., von malloc(3) und z.B. brk(2)

#### Fragment: "Bruchstück" eines (log./virt.) Prozessadressraums

- ein im Arbeitsspeicher abzulegendes Teil von Programmtext/-daten
- die Zuteilungseinheiten können in beiden Weisen gleich ausgelegt sein

## Hardwarevorgaben und Verschnitt

Zuteilungseinheiten als Vielfaches von Bytes oder Seitenrahmen

Aufbau und Struktur der zuteilungsfähigen Fragmente im Arbeitsspeicher unterscheidet sich je nach zu Grunde liegender Adressraumausprägung

Seitennummerierung

- Fragment → Vielfaches von Seitenrahmen
- ggf. wird mehr Speicher als benötigt zugeteilt
- interne Fragmentierung des Seitenrahmens

Segmentierung

- Fragment  $\mapsto$  Vielfaches von Bytes  $\rightsquigarrow$  Segment
- ggf. ist ein passendes Stück nicht verfügbar
- externe Fragmentierung des Arbeitsspeichers

**Verschnitt** (als Folge in/externer Fragementierung) zu **optimieren**, ist eine der zentralen Aufgaben der Speicherverwaltung

anfallender Rest bei der Speicherzuteilung allgemein

- "Abfall" im Falle interner Fragmentierung
- "Hohlräume" im Falle externer Fragmentierung

# Politiken bei der Speicherverwaltung

| 5 | neic | herzutei  | lungsverfa | hren |      | <br>oh | ligatori | sch  |
|---|------|-----------|------------|------|------|--------|----------|------|
|   | PCIC | TICIZUCCI | rungsverru |      | <br> | <br>   | inga com | 5011 |

Platzierungsstrategie (engl. placement policy)

- wohin im Arbeitsspeicher ist ein Fragment abzulegen?
  - dorthin, wo der Verschnitt am kleinsten/größten ist?
  - oder ist es egal, weil Verschnitt zweitrangig ist?

#### Speichervirtualisierung . . . . . . optional

Ladestrategie (engl. fetch policy)

- wann ist ein Fragment in den Arbeitsspeicher zu laden?
  - im Moment der Anforderung durch einen Prozess?
  - oder im Voraus, auf Grund von Vorabwissen oder Schätzungen?

**Ersetzungsstrategie** (engl. replacement policy)

- welches Fragment ist ggf. aus den Arbeitsspeicher zu verdrängen?
  - das älteste, am seltensten genutzte oder am längsten ungenutzte?

## Gliederung

- Grundlagen
  - Fragmente
  - Zuteilungseinheiten
  - Strategien
- Adressräume
  - Überblick
  - Physischer Adressraum
  - Logischer Adressraum
  - Virtueller Adressraum
- 3 Zusammenfassung

## Grundlagen der Rechnerarchitektur, 2. Semester

Ergänzung, Verfeinerung bzw. Vertiefung von GRA



- Kap. 5 Schnittstelle zum Betriebssystem [1], speziell...
  - ✓ Speicherverwaltung
  - ✓ Paging
  - ✓ Segmentierung

- ... beleuchtet im Kontext der Maschinenprogrammebene, genauer:
  - Artefakte der Hardware
  - Abstraktion durch ein Betriebssystem

### Betriebssystemsicht von Adressraumarten

#### physikalischer Adressraum (auch: realer/physischer Adressraum)

- **nicht linear** adressierbarer E/A- und Speicherbereich, dessen Größe der Adressbreite der CPU entspricht
  - $2^N$  Bytes, bei einer Adressbreite von N Bits
  - von Lücken durchzogen → ungültige Adressen

#### logischer Adressraum

- **linear** adressierbarer Speicherbereich von 2<sup>M</sup> Bytes bei einer Adressbreite von N Bits
  - M = N z.B. im Fall einer Harvard-Architektur<sup>1</sup>
  - M < N sonst

#### virtueller Adressraum

- logischer Adressraum, der 2<sup>K</sup> Bytes umfasst
  - $\bullet$  K > N bei Speicherbankumschaltung, Überlagerungstechnik
  - $K \leq N$  sonst

 $<sup>^{1}</sup>$ Getrennter Programm-, Daten- und E/A-Adressraum.

### Beispiel einer Adressraumorganisation

2 Adressräume

Adressenbelegung (engl. address assignment)

| Adressbereich     | Größe (KB) | Verwendung                       |
|-------------------|------------|----------------------------------|
| 00000000-0009ffff | 640        | RAM (System)                     |
| 000a0000-000bffff | 128        | Video RAM                        |
| 000c0000-000c7fff | 32         | BIOS Video RAM                   |
| 000c8000-000dffff | 96         | keine                            |
| 000e0000-000effff | 64         | BIOS Video RAM ( <i>shadow</i> ) |
| 000f0000-000fffff | 64         | BIOS RAM (shadow)                |
| 00100000-090fffff | 147456     | RAM (Erweiterung)                |
| 09100000-fffdffff | 4045696    | keine                            |
| fffe0000-fffeffff | 64         | SM-RAM (system management)       |
| ffff0000-fffffff  | 64         | BIOS ROM                         |

# Ungültige Adressen

Zugriff → Busfehler (engl. bus error)

| Adressbereich     | Größe (KB) | Verwendung                       |
|-------------------|------------|----------------------------------|
| 0000000-0009ffff  | 640        | RAM (System)                     |
| 000a0000-000bffff | 128        | Video RAM                        |
| 000c0000-000c7fff | 32         | BIOS Video RAM                   |
| 000c8000-000dffff | 96         | keine                            |
| 000e0000-000effff | 64         | BIOS Video RAM ( <i>shadow</i> ) |
| 000f0000-000fffff | 64         | BIOS RAM (shadow)                |
| 00100000-090fffff | 147456     | RAM (Erweiterung)                |
| 09100000-fffdffff | 4045696    | keine                            |
| fffe0000-fffeffff | 64         | SM-RAM (system management)       |
| ffff0000—ffffffff | 64         | BIOS ROM                         |

#### Reservierte Adressen

Zugriff → Schutzfehler (engl. protection fault)

| Adressbereich     | Größe (KB) | Verwendung                 |
|-------------------|------------|----------------------------|
| 00000000-0009ffff | 640        | RAM (System)               |
| 000a0000-000bffff | 128        | Video RAM                  |
| 000c0000-000c7fff | 32         | BIOS Video RAM             |
| 000c8000-000dffff | 96         | keine                      |
| 000e0000-000effff | 64         | BIOS Video RAM (shadow)    |
| 000f0000-000fffff | 64         | BIOS RAM (shadow)          |
| 00100000-090fffff | 147456     | RAM (Erweiterung)          |
| 09100000-fffdffff | 4045696    | keine                      |
| fffe0000-fffeffff | 64         | SM-RAM (system management) |
| ffff0000-ffffffff | 64         | BIOS ROM                   |

#### Freie Adressen

Hauptspeicher (engl. main memory)

| Adressbereich                  | Größe (KB) | Verwendung                 |
|--------------------------------|------------|----------------------------|
| 00000000-0009ffff              | 640        | RAM (System)               |
| 000a0000-000bffff              | 128        | Video RAM                  |
| 000c0000-000c7fff              | 32         | BIOS Video RAM             |
| 000c8000-000dffff              | 96         | keine                      |
| 000e0000-000effff              | 64         | BIOS Video RAM (shadow)    |
| 000f0000-000fffff              | 64         | BIOS RAM (shadow)          |
| 00100000 <del>-</del> 090fffff | 147456     | RAM (Erweiterung)          |
| 09100000-fffdffff              | 4045696    | keine                      |
| fffe0000-fffeffff              | 64         | SM-RAM (system management) |
| ffff0000-ffffffff              | 64         | BIOS ROM                   |

### Segmentierung durch die Maschinenprogrammebene

Logische Unterteilung von Prozessadressräumen

- Ebene 4-Programme sind in (mind.) zwei Segmente logisch aufgeteilt:

  - Text Maschinenanweisungen, Programmkonstanten

  - Daten initialisierte Daten, globale Variablen, Halde
- Ebene 3-Programme kennen (mind.) ein weiteres Segment:
  - lokale Variablen, Hilfsvariablen, aktuelle Parameter Stapel

#### Betriebssysteme verwalten diese Segmente im phys. Adressraum

- ggf. mit Hilfe einer MMU (engl. memory management unit)
  - Hardware, die nur logische in physische Adressen umsetzt
  - für die Verwaltung des Speichers ist das Betriebssystem verantwortlich
- die MMU legt eine Organisationsstruktur auf den phys. Adressraum
  - sie unterteilt ihn in Seiten fester oder Segmente variabler Länge

#### Ausprägungen von Prozessdressräumen

Seitennummerierter oder segmentierter Adressraum

eindimensional in **Seiten** aufgeteilt (engl. paged)

• eine Programmadresse  $A_P$  bildet ein Tupel (p, o):

```
p = A_P \text{ div } 2^N \sim \text{Seitennummer (engl. page number)}
o = A_P \mod 2^N \sim \text{Versatz (engl. byte offset)}
```

- mit 2<sup>N</sup> gleich der Seitengröße (engl. *page size*) in Bytes
- Seite → Seitenrahmen (auch: Kachel) des phys. Adressraums

zweidimensional in **Segmente** aufgeteilt (engl. segmented)

- eine Programmadresse  $A_S$  bildet ein Paar (S, A)
  - mit der Adresse A relativ zu Segment(name/nummer) S
  - bei seitennummerierten Segmenten wird A als  $A_P$  interpretiert
- Segment  $\mapsto$  Folge von Bytes/Seitenrahmen des phys. Adressraums

### Adressumsetzung: seitenorientiert

Seitennummerierter Adressraum (engl. paged address space)



- Seitennummer ist Index in Seitentabelle
  - pro Prozess
  - dimensioniert durch die MMU
- ungültiger Index führt zum *Trap*
- die indizierte Adressierung (der MMU) liefert einen Seitendeskriptor
  - enthält die Seitenrahmennummer, die die Seitennummer ersetzt
  - entspricht der Basisadresse des Seitenrahmens im phys. Adressraum
- setzen der Basis-/Längenregister der MMU → Adressraumwechsel

#### Adressumsetzung: explizit segmentorientiert

Segmentierter Adressraum (engl. segmented address space)



- Segmentname ist Index in die Segmenttabelle eines Prozesses
  - dimensioniert durch die MMU, ungültiger Index führt zum Trap
- indizierte Adressierung (der MMU) ergibt den Segmentdeskriptor
  - enthält Basisadresse und Länge des Segments (engl. base/limit)
  - $address_{phys} = address > limit ? (Trap, 0) : base + address$

### Adressumsetzung: implizit segmentorientiert

Segmentregister bzw. Segmentselektor (engl. segment selector)



 je nach Art des Speicherzugriffs selektiert die MMU implizit das passende Segment

Befehlsabruf (engl. instruction fetch)  $\mapsto$  code

Operandenabruf (engl. operand fetch) aus Text-, Daten-, Stapelsegment

- Direktwerte
- $\mapsto$  code

 $\odot$ 

• globale/lokale Daten  $\mapsto$  data  $\equiv$  stack

• Programme können weiterhin 1-dimensionale log. Adressen verwenden

### Adressumsetzung: implizit segment- und seitenorientiert

Segmentierter seitennummerierter Adressraum (engl. page-segmented address space)



- Reihenschaltung von zwei Adressumsetzungseinheiten der MMU:
   Segmenteinheit löst eine segmentierte Adresse auf
  - adressiert und begrenzt die Seitentabelle

Seiteneinheit generiert die physikalische Adresse

• jeder Prozess hat (mind.) eine Segment- und eine Seitentabelle

## Seiten- bzw. Segmentdeskriptor

Abbildung steuernder Verbund

Adressumsetzung basiert auf Deskriptoren der MMU, die für jede Seite bzw. Segment die Relokations- und Zugriffsdaten verwalten

- die Basisadresse des Seitenrahmens/Segments im phys. Adressraum
- die **Zugriffsrechte** des Prozesses
  - lesen (read), schreiben (write), ggf. ausführen (execute)

Segmente sind (im Geg. zu Seiten) von variabler, dynamischer Größe und benötigen daher zusätzliche Verwaltungsdaten  $\sim$  Segmentdeskriptor

- die **Segmentlänge**, um Segmentverletzungen abfangen zu können
  - Basis-/Längenregister ⊂ Segmentdeskriptor
- die Expansionsrichtung: Halde "bottom-up", Stapel "top-down"

#### Deskriptorprogrammierung erfolgt zur Programmlade- und -laufzeit

- bei Erzeugung/Zerstörung schwer- und leichtgewichtiger Prozesse
- bei Anforderung/Freigabe von Arbeitsspeicher

### Seiten- bzw. Segmenttabelle

Adressraum beschreibende Datenstruktur

Deskriptoren des Adressraums eines Prozesses sind in einer **Tabelle im Arbeitsspeicher** zusammengefasst

- die **Arbeitsmenge** (engl. working set) von Deskriptoren eines Prozesses wird im Zwischenspeicher (engl. cache) gehalten
  - TLB (engl. translation lookaside buffer) der MMU
- Adressraumwechsel als Folge eines Prozesswechsels bedeutet:
  - zerstören der Arbeitsmenge (TLB "flush"; teuer, schwergewichtig)
  - Tabellenwechsel (Zeiger umsetzen; billig, federgewichtig)

#### Basis-/Längenregister (engl. base/limit register)

- beschreibt eine Tabelle und damit exakt einen Prozessadressraum
- bei der Adressumsetzung wird eine **Indexprüfung** durchgeführt:
  - descriptor = index ≤ limit ? &base[index] : (Trap, 0)
  - wobei *index* die Seitennummer/den Segmentnamen repräsentiert

## Adressraumabbildung einhergehend mit Ein-/Ausgabe

Integration von Vorder- und Hintergrundspeicher

Abstraktion von Größe und Örtlichkeit des verfügbaren Hauptspeichers

- vom Prozess nicht benötigte Programmteile können ausgelagert sein
  - sie liegen im **Hintergrundspeicher**, z.B. auf der Festplatte
- der Prozessadressraum könnte über ein Rechnernetz verteilt sein
  - Programmteile sind über die Hauptspeicher anderer Rechner verstreut

Zugriffe auf ausgelagerte Programmteile fängt der Prozessor ab: Trap

- sie werden stattdessen **partiell interpretiert** vom Betriebssystem
- der unterbrochene Prozess wird in einen E/A-Stoß gezwungen
  - er erwartet die erfolgreiche Einlagerung eines Programmteils
  - ggf. sind andere Programmteile aus dem Hauptspeicher zu verdrängen
- Wiederaufnahme des CPU-Stoßes → Wiederholung des Zugriffs

## Seiten-bzw. Segmentdeskriptor (Forts.)

Zusätzliche Attribute

Adressumsetzung unterliegt einer **Steuerung**, die "transparent" für den zugreifenden Prozess die Einlagerung auslöst

- die "Gegenwart" eines Segments/einer Seite wird erfasst: present bit
  - $0 \mapsto \text{ausgelagert}$ ; Trap, partielle Interpretation, Einlagerung
    - die Basisadresse ist eine Adresse im Hintergrundspeicher
    - wird nach der Einlagerung vom Betriebssystem auf 1 gesetzt
  - $1 \mapsto \text{eingelagert}$ ; Befehl abrufen, Operanden lesen/schreiben
    - die Basisadresse ist eine Adresse im Vordergrundspeicher
    - wird nach der Auslagerung vom Betriebssystem auf 0 gesetzt
- das "Gegenwartsbit" dient verschiedentlich noch anderen Zwecken:
  - um z.B. Zugriffe zu zählen oder ihnen einen Zeitstempel zu geben
  - Betriebssystemmaßnahmen zur Optimierung der Ein-/Auslagerung

### Zugriffsfehler

Seitenfehler (engl. page fault) bzw. Segmentfehler (engl. segment fault)

present bit = 0

 je nach Befehlssatz und Adressierungsarten der CPU kann der Behandlungsaufwand im Betriebssystem und somit der Leistungsverlust beträchtlich sein

```
void hello () {
    printf("Hi!\n");
}

void (*moin)() = &hello;

main () {
    (*moin)();
}
```

```
main:
    pushl %ebp
    movl %esp,%ebp
    pushl %eax
    pushl %eax
    andl $-16,%esp
    call *moin
    leave
    ret
```

```
FF15080494E8
```

# Zugriffsfehler: Schlimm(st)er Fall eines Seitenfehlers

call \*moin (x86) Aufruf einer indirekt adressierten Prozedur

der Operationskode (FF 15) wurde bereits gelesen



- Operandenadresse holen (08 04 94 E8)
- Funktionszeiger lesen (08)
- Funktionszeiger weiterlesen (04 83 A0)
- Rücksprungadresse stapeln (08 04)
- Sücksprungadresse weiterstapeln (83 9E)
- Operationskode holen (83)
- Operanden holen (EC 18)
- Seitenfehler 6. und 7. sind eigentlich bereits der Ausführung des ersten Maschinenbefehls der aufgerufenen Prozedur zuzurechnen

### Seitenfehler: Aufwandsabschätzung von Einzelzugriffen

Nichtfunktionale Programmeigenschaften

effektive Zugriffszeit (effective access time, eat) auf den Hauptspeicher

 hängt stark ab von der Seitenfehlerwahrscheinlichkeit (p) und verhält sich direkt proportional zur Seitenfehlerrate:

$$eat = (1 - p) \cdot pat + p \cdot pft, 0 \le p \le 1$$

- angenommen, folgende Systemparameter sind gegeben:
  - 50 ns Zugriffszeit auf den RAM (physical access time, pat)
  - 10 ms mittlere Zugriffszeit auf eine Festplatte (page fault time, pft)
  - 1% Wahrscheinlichkeit eines Seitenfehlers (p = 0,01)
- dann ergibt sich:

$$eat = 0,99 \cdot 50 \, \text{ns} + 0,01 \cdot 10 \, \text{ms} = 49,5 \, \text{ns} + 10^5 \, \text{ns} \approx 0,1 \, \text{ms}$$

• Einzelzugriffe sind im Ausnahmefall um den Faktor 2000 langsamer

### Seitenfehler: Aufwandsabschätzung bei Folgezugriffen

Seitenfehler sind nicht wirklich transparent

mittlere Zugriffszeit (mean access time, mat) auf den Hauptspeicher

 hängt stark ab von der effektiven Seitenzugriffszeit und der Seitengröße (in Bytes pro Seite bzw. Seitenrahmen):

$$mat = (eat + (sizeof(page) - 1) \cdot pat)/sizeof(page)$$

- angenommen, folgende Systemparameter sind gegeben:
  - Seitengröße von 4096 Bytes (4KB)
  - 50 ns Zugriffszeit (pat) auf ein Byte im RAM
  - effektive Zugriffszeit (eat) wie eben berechnet bzw. abgeschätzt
- dann ergibt sich:  $mat = (eat + 4095 \cdot 50 \text{ ns})/4096 \approx 74,41 \text{ ns}$
- Folgezugriffe sind im Ausnahmefall um den Faktor 1,5 langsamer

### Seitenüberlagerung "Considered Harmful"

Pro und Contra

#### Virtuelle Adressräume sind . . .

vorteilhaft wenn übergroße bzw. gleichzeitig mehrere Programme in Anbetracht zu knappen Hauptspeichers auszuführen sind

ernüchternd wenn der eben durch die Virtualisierung bedingte Mehraufwand zu berücksichtigen ist und sich für ein gegebenes Anwendungsszenario als problematisch bis unakzeptabel erweisen sollte

#### **Seitenfehler** sind

- nicht wirklich transparent, wenn zeitliche Aspekte relevant sind
  - z.B. im Fall von Echtzeitverarbeitung oder Hochleistungsrechnen
- erst zur Laufzeit ggf. entstehende nichtfunktionale Eigenschaften

## Gliederung

- Grundlagen
  - Fragmente
  - Zuteilungseinheiten
  - Strategien
- 2 Adressräume
  - Überblick
  - Physischer Adressraum
  - Logischer Adressraum
  - Virtueller Adressraum
- 3 Zusammenfassung

#### Adressräume

#### Ebenen der Abstraktion

- der physikalische Adressraum enthält gültige & ungültige Adressen
  - ungültige Adressen gültige Adressen
  - ungültige Adressen Zugriff führt zum Busfehler
    - gültige Adressen Zugriff gelingt, ist jedoch zu bedenken...
      - reservierte Adressbereiche → Schutz
- der logische Adressraum enthält gültige Adressen
  - Zugriffsrechte der Prozesse stecken Gültigkeitsbereiche ab
    - Zugriff auf reservierte Adressen führt ggf. zum Schutzfehler
  - Prozesse sind in ihrem Programmadressraum abgeschottet, isoliert
    - Zugriff auf "fremde" freie Adressen führt zum Schutzfehler
- der virtuelle Adressraum enthält "flüchtige Adressen"
  - die Bindung der Adressen zu den Speicherzellen ist nicht fest
  - sie variiert phasenweise zwischen Vorder- und Hintergrundspeicher

#### Adressraumdeskriptoren

Seitennumerierte und segmentierte Adressräume

Abbildung steuernde Verbunde zur Erfassung einzelner Adressraumteile

- speichern Attribute von Seiten oder Segmente
  - d.h., Relokations- und Zugriffsdaten, Zugriffsrechte
- bilden Seiten fester Größe auf gleichgroße Seitenrahmen ab
  - seitennummerierter Adressraum
- bilden Segmente variabler Größe auf Byte- oder Seitenfolgen ab
  - segmentierter und ggf. seitennummerierter Adressraum

Abbildungstabellen fassen Deskriptoren (eines Adressraums) zusammen

- die Tabellen liegen im Arbeitsspeicher des Betriebssystems
  - der dafür erforderliche Speicherbedarf kann beträchtlich sein
- im TLB sind Arbeitsmengen von Deskriptoren zwischengespeichert
  - ein Cache der MMU, ohne dem Adressumsetzung ineffizient ist

Zugriffsfehler sind intransparente, nicht-funktionale Eigenschaften

#### Resümee

- Arbeitsspeicherverwaltung ist (a) statisch oder (b) dynamisch
  - (a) Arbeitsspeichergebiete maximaler, fester Größe
  - (b) Arbeitsspeicherfragmente variabler Größe
- dabei sind Fragmente Teile eines (log./virt.) Prozessadressraums
  - die im Arbeitsspeicher zu platzierenden Teile von Programmtext/-daten
  - für die freier Platz, sog. Löcher, im Arbeitsspeicher zu finden ist
- Prozessadressräume sind (a) physikalisch, (b) logisch, (c) virtuell
  - (a) lückenhafter, wirklicher Hauptspeicher
  - (b) lückenloser, wirklicher Hauptspeicher
  - (c) lückenloser, scheinbarer Hauptspeicher

Arbeitsspeicher liegt im Vordergrund (a, b) bzw. Hintergrund (c)

#### Politiken der Speicherverwaltung

Platzierungsstrategie • wohin ist ein Fragment abzulegen?

Ladestrategie • wann ist ein Fragment zu laden?

Ersetzungsstrategie • welches Fragment ist ggf. zu verdrängen?

#### Literaturverzeichnis

#### [1] FEY, D.:

Grundlagen der Rechnerarchitektur und -organisation.

http://www3.informatik.uni-erlangen.de/Lehre/GRa/, jährlich. - Vorlesungsfolien