1  Projektumgebung

Das systematische Anlegen von Verzeichnissen und Dateien ist eine wichtige Grundlage für erfolgreiche Datenprojekte. Wir erstellen daher zuerst einen Ordner namens “toolkit-lab” und legen darin die Unterordner “code” für unsere Code-Dateien und “data” zum Speichern von Datensätzen an, um unser Projekt strukturiert zu halten.

Unsere Ordnerstruktur kann wie folgt dargestellt werden:

(a) Visuelle Darstellung
(b) Baumstruktur
Abbildung 1.1: Darstellung der Ordnerstruktur

Für die Darstellung der Ordnerstruktur verwenden wir typischerweise eine Baumstruktur, wie in Abbildung 1.1 (b) dargestellt. Diese kann mit Hilfe unterschiedlicher Zeichen dargestellt und auch wie folgt erstellt werden:

toolkit-lab/
- code/
- data/

Anstatt eine grafische Benutzeroberfläche wie den Windows-Explorer oder den macOS Finder zu verwenden, werden wir die Befehlszeile nutzen, um die Ordner einzurichten. Die Befehlszeile ist ein leistungsstarkes Werkzeug zum Einrichten unserer Arbeitsumgebung. Sie ermöglicht eine Kommunikation mit dem Betriebssystem über textbasierte Eingaben.

Die Befehlszeile eröffnet eine neue Ebene der Interaktion mit unserem Computer. Viele Aufgaben können damit effizienter erledigt werden als mit einer grafischen Benutzeroberfläche.

Weitere gängige Bezeichnung für die Befehlszeile sind:

In Windows ist die Bezeichnung für das entsprechende Programm Eingabeaufforderung (siehe Abbildung 1.2 (a)), auf dem Mac heißt es Terminal (siehe Abbildung 1.2 (b)).

(a) Eingabeaufforderung in Windows
(b) Terminal auf dem Mac
Abbildung 1.2: Kommandozeilen

Wenn wir von der Befehlszeile sprechen, ist es wichtig, auch das Konzept der “Shell” zu verstehen. Die Shell ist ein Programm, das als Vermittler zwischen uns und dem Betriebssystem fungiert. Sie interpretiert unsere Eingaben und übersetzt sie in Anweisungen, die das System ausführen kann.

Die Kommandozeile, die wir sehen und in die wir Befehle eingeben, ist die Schnittstelle zur Shell. Sie ist sozusagen das “Blatt Papier”, auf dem wir unsere Anweisungen schreiben, während die Shell der “Übersetzer” ist, der diese Anweisungen versteht und umsetzt.

Auf Windows-Systemen:

Auf Mac-Systemen:

Trotz dieser Unterschiede ist das grundlegende Konzept auf beiden Systemen gleich: Wir geben Befehle ein, und die Shell interpretiert und führt sie aus.

Die Verwendung der Kommandozeile und das Verständnis der Shell-Umgebung sind wichtige Fähigkeiten in der Datenanalyse und Softwareentwicklung. Sie ermöglichen uns eine präzisere Kontrolle über unser System und sind besonders nützlich für Automatisierungen.

In den folgenden Abschnitten werden wir lernen, wie wir grundlegende Befehle nutzen können, um unsere Projektstruktur einzurichten und zu verwalten.

1.1 Projektumgebung in Windows

1.1.1 Eingabeaufforderung

Hier die Schritte, um die Ordner mit der Windows-Eingabeaufforderung (“Command Prompt” bzw. “cmd”) zu erstellen.

  1. In dem Windows-Suchfenster “Eingabeaufforderung” eingeben und dann mit rechtem Mausklick auf das Symbol des Eingabeaufforderungs-Programms klicken. “Als Administrator ausführen” auswählen. Falls die Frage erscheint: “Möchten Sie zulassen, dass durch diese App Änderungen an Ihrem Gerät vorgenommen werden?” auf Ja klicken.

  2. Wenn die Eingabeaufforderung geöffnet wird, erscheint eventuell zunächst ein Windows-Verzeichnis wie bspw “C:\Windows\System32”. Wir müssen daher mit cd (change directory)zu unserem Benutzerkonto wechseln. Den Befehl unten eingeben und Eingabetaste drücken:

    cd %userprofile%

    %userprofile% ist eine sogenannte Umgebungsvariable in Windows. Sie repräsentiert den Pfad zum Profilordner des aktuell angemeldeten Benutzers.

  3. Nun sollte das angezeigte Verzeichnis das Home-Verzeichnis sein. In meinem Fall lautet der Pfad “C:\Users\jankirenz”, da mein Benutzername jankirenz heißt.

    Abbildung 1.3: Eingabeaufforderung in Windows
  4. Wir erstellen nun mit mkdir (make directory) einen neuen Ordner namens “toolkit-lab” in dem Home-Verzeichnis. Befehl eingeben und Eingabetaste drücken (falls hier der Hinweis erscheint, dass Sie dazu keine Berechtigung haben, haben Sie die Eingabeaufforderung in Schritt 1 eventuell nicht als Administrator gestartet):

    mkdir toolkit-lab
    Abbildung 1.4: Erstellung des Ordners toolkit-lab
  5. Damit wir in dem neuen Ordner “toolkit-lab” die beiden Unterordner anlegen können, müssen wir zuerst in den Ordner navigieren. Mit cd (change directory) können wir in das Verzeichnis “toolkit-lab” navigieren:

    cd toolkit-lab
    Abbildung 1.5: Wechseln in den Ordner toolkit-lab
  6. Wir verwenden nun nochmals mkdir (make directory), um die Ordner code und data zu erstellen.

    mkdir code data

    Dieser Befehl erzeugt beide Ordner gleichzeitig.

    Abbildung 1.6: Wechseln in den Ordner toolkit-lab
  7. Mit dem Befehl dir (directory) können wir die Verzeichnisse in dem aktuellen Pfad anzeigen lassen.

    dir

    Da wir uns in dem Ordner “toolkit-lab” befinden, werden di Ordner “code” und “data” angezeigt.

    Abbildung 1.7: Wechseln in den Ordner toolkit-lab
  8. Die Eingabeaufforderung kann nun geschlossen werden. exit eingegeben und Eingabetaste drücken.

    exit

Wir haben damit ein Hauptverzeichnis toolkit-lab mit zwei Unterverzeichnissen eingerichtet: code für unsere Skripte und data zum Speichern von Datensätzen.

1.1.2 Explorer

Damit wir die Ordner in dem Windows-Explorer anzeigen können, gehen wir wie folgt vor:

  1. In dem Windows-Suchfenster Explorer eingeben und das Programm anklicken.

  2. In der linken Menüleiste im Explorer auf “Dieser PC” klicken.

  3. “Lokaler Datenträger (C:)” auswählen.

  4. Users anklicken.

  5. Den eigenen Benutzernamen auswählen.

  6. Hier sollte nun der Ordner toolkit-lab erscheinen.

1.2 Projektumgebung auf Mac

Hier die Schritte, um das Hauptverzeichnis und die Unterverzeichnisse mit dem Terminal (dies ist die Bezeichnung der Befehlszeile in macOS) in macOS zu erstellen.

1.2.1 Terminal öffnen

  1. Um das Terminal in macOS zu öffnen, nutzen wir die Spotlight-Suche. Wir öffnen diese mit der Tastenkombination Command + Leertaste (erst Command gedrückt halten und dann zusätzlich die Leertaste drücken).

  2. In der Spotlight-Suche “Terminal” eingeben und Terminal-app anklicken. Nun sollte das Terminal sichtbar sein.

    Abbildung 1.9: Terminal auf dem Mac
  3. Wir geben nun den Befehl echo $SHELL ein und bestätigen mit Eingabetaste um zu prüfen, welche Shell-Ausführung auf dem Gerät verwendet wird. Bis Oktober 2019 war bash (Bourne Again Shell) der Standard, danach hat Apple auf zsh umgestellt.

    echo $SHELL
    • echo: Befehl, der Text auf der Konsole ausgibt.
    • $: signalisiert der Shell, dass auf den Wert einer Variable zugegriffen werden soll. Der Name der entsprechenden Variable folgt direkt auf das $.
    • SHELL: Dies ist eine Umgebungsvariable, die den Pfad zur aktuell verwendeten Shell speichert (z.B. /bin/bash, /bin/zsh).

    Wenn wir also $SHELL schreiben, sagt das der Shell: “Gib mir den Wert der Variable namens SHELL”.

    Ist die Ausgabe “/bin/zsh”, wird bereits zsh verwendet. Wenn das Ergebnis “/bin/bash” ist, verwendet das Gerät derzeit noch bash.

    Falls aktuell noch bash verwendet wird, sollte zunächst auf zsh umgestellt werden:

    1. Zuerst überprüfen, ob zsh bereits installiert ist:
    zsh --version

    Falls eine Version angezeigt wird, weiter mit c). Ansonsten zu Schritt b).

    1. Falls zsh noch nicht installiert sein sollte, können die Apple Xcode Command Line Tools installiert werden, die zsh enthalten:
    xcode-select --install

    1. Wenn zsh installiert ist, kann mit diesem Befehl direkt zu zsh gewechselt werden:
    chsh -s /bin/zsh

    Bei Bedarf Benutzerpasswort eingeben, wenn dazu aufgefordert wird. Dann das Terminal schließen und nochmals mit der Spotlight-Suche öffnen.

    Hinweise zu dem Befehl: chsh ist der Befehl zum Ändern der Standard-Shell. Die Option -s bewirkt, dass die Shell für den aktuellen Benutzer geändert wird. Und /bin/zsh ist der Pfad zur Z-Shell (zsh).

1.2.2 Terminal-Elemente

Hier eine Erklärung zu den unterschiedlichen Elementen im Terminal, die in der zsh-Shell angezeigt werden:

Abbildung 1.10: Terminal mit zsh-Shell auf dem Mac
  • Benutzername: Dieser steht ganz links in der ersten Zeile. In diesem Fall jankirenz. Es zeigt an, welcher Benutzer aktuell am System angemeldet ist.

  • Hostname: Der Hostname wird nach dem @-Symbol aufgeführt. Hier kirenziMac. Dies ist der Name des Computers, auf dem das Terminal läuft.

  • Aktuelles Verzeichnis (Pfad): Nach dem Hostnamen wird das Verzeichnis angezeigt, in welchem wir uns gerade befinden. In dem Bild isr das Tilde-Symbol ~ zu sehen. Dies ist ein Platzhalter und steht für das Home-Verzeichnis des aktuellen Benutzers. Der vollständige Pfad des Home-Verzeichnisses wäre in meinem Fall “/Users/jankirenz”. Es setzt sich beim Mac immer aus dem Ordner “Users” und einem Unterordner, der die Bezeichnung des Benutzernamens hat, zusammen.

  • Prompt: Das % Symbol am Ende der Zeile ist der sogenannte Prompt. Dieser signalisiert, dass das Terminal bereit ist, einen Befehl entgegenzunehmen.

1.2.3 Terminal-Befehle

Als nächstes behandeln wie einige Terminal-Befehle.

  1. Zuerst verwenden wir den Befehl pwd (print working directory) und drücken die Eingabetaste, um den vollständigen Pfad des aktuellen Verzeichnisses anzuzeigen.

    pwd

    Wenn das Terminal gerade geöffnet wurde, sollte das aktuelle Verzeichnis das sogenannte Home-Verzeichnis sein (in meinem Fall lautet der Pfad “/Users/jankirenz”, da mein Benutzername jankirenz heißt).

  2. Wir erstellen nun mit mkdir (make directory) einen neuen Ordner namens “toolkit-lab” in dem Home-Verzeichnis:

    mkdir toolkit-lab
  3. Damit wir in dem neuen Ordner “toolkit-lab” die beiden Unterordner anlegen können, müssen wir zuerst in den Ordner navigieren. Mit cd (change directory) können wir in das Verzeichnis “toolkit-lab” navigieren:

    cd toolkit-lab
  4. Wir verwenden nun nochmals mkdir (make directory), um die Ordner code und data zu erstellen.

    mkdir code data

    Dieser Befehl erzeigt beide Ordner gleichzeitig.

  5. Mit dem Befehl ls (list) können wir die Verzeichnisse in dem aktuellen Pfad anzeigen lassen.

    ls

    Da wir uns in dem Ordner “toolkit-lab” befinden, werden dir Ordner “code” und “data” angezeigt.

  6. Das Terminal kann nun geschlossen werden.

1.2.4 Finder nutzen

Um die Ordner auch im Finder anzeigen zu lassen, müssen wir zuerst eine Einstellung anpassen.

  1. Wir öffnen die Spotlight-Suche mit der Tastenkombination Command + Leertaste, geben Finder ein und wählen das Programm aus.

    Abbildung 1.11: Finder in Spotlight-Suche öffnen
  2. In der oberen Mac-Menüleiste auf “Finder” gehen und auf Einstellungen klicken. Finder Einstellungen ändern

    Abbildung 1.12: Finder-Einstellungen
  3. In den Finder-Einstellungen auf “Seitenliste” klicken und den Benutzernamen auswählen. Damit wird dieser in der Seitenleiste des Finders angezeigt. Danach kann das Menü geschlossen werden (auf den roten Knopf oben links klicken).

    Abbildung 1.13: Finder-Seitenleiste
  4. In dem Finder-Fenster sehen wir in der linken Seitenleiste den Benutzername (in meinem Fall jankirenz). Wenn wir darauf klicken, sollte in dem Fenster rechts danaben der Ordner “toolkit-lab” angezeigt werden. Damit die Ansicht wie in dem Bild unten erscheint, muss in der oberen Taskleiste die sogenannte “Spaltenansicht” (Symbol mit drei Spalten) ausgewählt sein.

    Abbildung 1.14: Finder-Fenster

Geschafft! Wir ein Hauptverzeichnis “toolkit-lab” mit zwei Unterverzeichnissen eingerichtet: “code” für unsere Code-Dateien und “data” zum Speichern von Datensätzen.