# Kapitel 1. Einstieg in die Welt von Python:

In unserer heutigen digitalen Welt sind Computer nicht mehr aus unserem Alltag wegzudenken. Ob in der Finanzwelt, Industrie aber auch in der Wissenschaft erledigen Computer in Sekundenschnelle komplizierte Rechnungen und helfen dem Anwender komplizierte Sachverhalte vereinfacht wieder zu geben. Daher empfiehlt es sich insbesondere als Physiker zumindest die Grundlagen einer beliebigen Programmiersprache zu beherrschen.  

Im folgenden werden wir uns gemeinsam die Grundzüge der Programmiersprache **Python** erarbeiten. Ein besonderes Augenmerk liegt hierbei auf den verschiedenen Herausforderungen die das analysieren von Experimentdaten mit sich bringt. Um euch bestens auf die Anforderungen im **physikalische Grundpraktikum (PGP)** vorzubereiten lernen wir im Folgenden wie man:

* einfache Rechnungen mit Python durchführt
* "Mathematische" Funktionen definiert
* Funktionen auf größere Zahlenmengen anwendet
* Daten in Form von Graphen richtig darstellt
* eine Ausgleichsgerade von Datenpunkten berechnen kann.

Damit ihr das neu gelernte Wissen direkt vertiefen könnt, wird dieses Notebook an verschiedenen Stellen kleinere Aufgaben für euch bereit halten.

## Grundlagen zu Python bzw. Jupyter Notebooks:

Bevor wir mit dem eigentlichen programmieren beginnen wollen müssen wir uns jedoch erst einmal mit unserem so genannten Interpreter (**Jupyter Notebook**) vertraut machen. Bei der Programmiersprache **Python** handelt es sich um eine so genannte **Interpretersprache**. Dies bedeutet, dass eingegebene Befehle, ähnlich wie bei einem Taschenrechner, direkt ausgeführt werden.

Zum Beispiel beim berechnen von: 

In [None]:
3 + 2

Unser Interpreter, das **Jupyter Notebook**, stellt hierbei einen komfortable Interpreterumgebung dar. Diese erlaubt es uns neben **Code**-Zellen auch Texte und Formeln in so genannten **Markdown**-Zellen darzustellen. Hierbei existiert eine ganze Bandbreite an Formatierungsmöglichkeiten. Zum Beispiel:

**Überschriften:**

# Level 1.
## Level 2.
### Level 3.

**Aufzählungen: **

* Mit normalen
* Aufzählungspunkten
    1. oder 
    2. Numerierungen
        * Auf unterschiedlichen
            1. Ebenen

**Schriftarten:**

**Fett**

*Italic (Kursive)*

`True type`

bzw. Syntax highlighting

```python 
def EasyFunc(x):
    return 2 * x
```

**Formeln mit Hilfe des Latex-Syntax:**

$ f(x) = \int\limits_0^\infty e^{-x} \, dx $

(Latex werdet ihr beim F-Praktikum kennen lernen)


**Bilder:**

![The Python logo](https://www.python.org/static/community_logos/python-powered-w-200x80.png "Das Python Logo")


Darüber hinaus bietet uns das Jupyter Notebook noch diverse weitere Optionen an welche unseren harten Alltag vereinfachen. 

Neben diesen nützlichen Befehlemm gibt es noch weitere tolle Kürzel wie zum Beispiel:
* **D + D** um eine Zelle zu **löschen** 
* **Y** verwandelt eine aktuelle **Markdown**-Zelle in eine **Code**-Zelle
* **Strg** + **Shift** + **Minus** Splittet eine Zelle an der Position eures Cursors 
* **F** für "Find and Replace" (nützlich wenn ihr zum Beispiel ein Variablennamen austauschen wollt)
* **I** + **I** Um den *"Kernel"* zu stoppen (wichtig falls ihr mal eine unendliche LOOP gebaut habt)

Des weiteren könnt ihr [hier](https://www.cheatography.com/weidadeyue/cheat-sheets/jupyter-notebook/) eine Auflistung weiterer Jupyter-Befehle  finden.

## Python als Taschenrechner:

Neben dem einfachen summieren zweier Zahlen ermöglicht uns Python natürlich auch das verwendet weiterer Operatoren. Hierbei haben die Operatoren ähnlich wie in der Mathematik gewisse Prioritäten (*Punkt vor Strich*). Die Operation mit dem niedrigeren Prioritätswert wird zu erst ausgeführt.   

<table border="1" class="docutils">
<colgroup>
<col width="25%">
<col width="40%">
<col width="11%">
<col width="24%">
</colgroup>
<thead valign="bottom">
<tr class="row-odd"><th class="head">Operator</th>
<th class="head">Ergebnis</th>
<th class="head">Priorität</th>
</tr>
</thead>
<tbody valign="top">
<tr class="row-even"><td><tt class="docutils literal"><span class="pre">x</span> <span class="pre">+</span> <span class="pre">y</span></tt></td>
<td>Die Summe von <em>x</em> und <em>y</em></td>
<td>6</td>
</tr>
<tr class="row-odd"><td><tt class="docutils literal"><span class="pre">x</span> <span class="pre">-</span> <span class="pre">y</span></tt></td>
<td>Differenz von <em>x</em> und <em>y</em></td>
<td>5</td>
</tr>
<tr class="row-even"><td><tt class="docutils literal"><span class="pre">x</span> <span class="pre">*</span> <span class="pre">y</span></tt></td>
<td>Produkt von <em>x</em> und <em>y</em></td>
<td>4</td>
</tr>
<tr class="row-odd"><td><tt class="docutils literal"><span class="pre">x</span> <span class="pre">/</span> <span class="pre">y</span></tt></td>
<td>Quotient von <em>x</em> und <em>y</em></td>
<td>3</td>
</tr>
<tr class="row-odd"><td><tt class="docutils literal"><span class="pre">x</span> <span class="pre">%</span> <span class="pre">y</span></tt></td>
<td>Rest von <tt class="docutils literal"><span class="pre">x</span> <span class="pre">/</span> <span class="pre">y</span></tt></td>
<td>2</td>
</tr>
<tr class="row-odd"><td><tt class="docutils literal"><span class="pre">x</span> <span class="pre">**</span> <span class="pre">y</span></tt></td>
<td><em>x</em> bei der Potenz von <em>y</em></td>
<td>1</td>
</tr>
</tbody>
</table>

Hier ein paar Beispiele:

In [None]:
2 / 3 - 2

In [None]:
3**2 * 2 - 8  

In [None]:
3**2**2

Wie in der Mathematik können wir auch bei Python Klammern verwenden um die Rechenreihenfolge zu ändern:

In [None]:
3**2 * 2 - 8  

In [None]:
3**2 * (2 - 8 ) 

Um unsere Rechnungen besser zu Strukturieren können wir Zahlen auch Variablen zu ordnen. Hierzu verwenden wir das Gleichheitszeichen um einer Variablen (*links*) einem Wert (*rechts*) zu zuordnen.

In [None]:
a = 5

In [None]:
a

In [None]:
variable = 2

In [None]:
a * variable

Bei der Definition von Variablen ist es wichtig auf die Reihenfolge zu achten. Dies gilt nicht nur innerhalb einer Zelle...

In [None]:
a = 4
b = 3
a = 7

a * b

... sondern auch für die Reihenfolge in der die Code-Zellen ausgeführt werden (Angezeigt durch In []:). 

In [None]:
a = 7

In [None]:
a = 4

In [None]:
a * b

Ein weiterer Vorteil (bzw. auch Nachteil) ist, dass Python eine so genannte *dynamische* Datentypenvergabe nutzt. Um besser zu verstehen was dies bedeutet gucken wir uns das Nachfolgende Beispiel an. 

In [None]:
a = 2
b = 5
c = a * b
c

In [None]:
a = 2
b = 5.0
c = a * b
c 

In der oberen Zelle ist **c** vom Datentyp `int` (*Integer*) was einer Ganzen Zahl entspricht. In der unteren Zelle jedoch ist **c** vom Datentype `float` (*Floating Point Number*) also eine Gleitkommazahl. Dies liegt daran das wir in der unteren Zelle **b** als Gleitkommazahl definiert haben. Um uns Arbeit abzunehmen hat Python für uns im Hintergrund dynamisch entschieden, dass somit **c** ebenfalls vom type `float` sein muss. 

Neben den primitiven Datentypen `float` und `int` gibt es noch die wichtigen Datentypen `str` (*string*) was einer Zeichenkette entspricht (z.B. Buchstaben, Wörter und Sätze), `complex` für Komplexe Zahlen und `bool` für Wahrheitswerte. Was genau Wahrheitswerte sind und für was diese verwendet werden, werdet ihr noch im **PGP2** lernen. 

Für das **PGP1** sind erstmal nur die typen `int`, `float` und `str` von Bedeutung.

## Zeichenketten.

Wie eben bereits erwähnt gibt es neben den Zahlen Datentypen `int`, `float` und `complex` auch noch den Datentyp einer Zeichenkette `str`. Zeichenketten werden in Programmiersprachen vielseitig verwendet z.B. bei einer Nutzereingabe (wie dem Passwort), Dateiname bei einer Installation, oder bei Textrückgaben von Programmen. Letzteres haben wir bereits in Aufgabe 2 mit Hilfe der `print`-Funktion gesehen.

Für das PGP-1 wollen wir uns zunächst darauf beschränken, dass Zeichenketten in so genannten **Formatstrings** dazu genutzt werden können schönere `print` Rückgaben zu erzeugen bzw. wir mit Zeichnketten Achsenbeschriftungen an Graphen anbringen können. 

Zunächst erst aber einmal eine einfache Zeichenkette:

In [None]:
'Dies ist eine Zeichenkette'

Hierbei kann eine Zeichenkette auch alle Symbole enthalten die euer Interpreter unterstützt. In Jupyter sind dies alle gewohnten Zeichen wie Buchstaben, Zahlen, Sonderzeichen und Leerzeichen:  

In [None]:
s1 = '0123456789'
s2 = 'äöü'
s3 = '*+~`´?ß-@€'
s4 = 'python 3.7>'

print(s1,s2,s3,s4)

Einen **Formatstring** können wir über zwei Arten generieren (**Muss checken welche Python version im Hub genutzt wird**):

In [None]:
a = 'eins'
b = 2

print('Dies ist Syntaxvariante {}'.format(a))
print()
print(f'Dies ist Syntaxvariante {b}') 

Neben dem Einfügen von Strings oder Zahlen in eine Zeichenkette können wir die eingefügten Werte auch formatieren:

In [None]:
pi = 3.1415926535

print(f'Dies ist pi auf 4 signifikante Stellen gerundet: {pi:.4}')
print()
print('Dies ist pi auf 4 signifikante Stellen gerundet: {:.4}'.format(pi))

... oder sofern ihr eine Rückgabe lieber über mehrere Zeilen ausgeben lassen wollt könnt ihr dieswie folgt machen:

In [None]:
U = 12.0   #V
dU = 0.1   #V
I = 0.30   #mA
dI = 0.01  #mA

R = U/I #kOhm 
dR = R * ((dU / U)**2 + (dI / I)**2)**0.5

print(f'''An einem Widerstand R wurden die folgenden Werte gemessen:
Spannung: {U}+/-{dU} V
Strom:    {I}+/-{dI} mA
Hierraus resultiert ein Widerstand von {R}+/-{dR:.2} kOhm ''') 

## Das definieren von Funktionen:

Anstatt Berechnungen wie bei einem Taschenrechner immer wieder manuell einzugeben, ermöglicht uns eine Programmiersprache das definieren von Funktionen. Funktionen können hierbei ähnlich wie mathematische Funktionen definiert und behandelt werden. Im folgenden wollen wir uns dies im Fall des Ohmschen Gesetzt welches durch 

$U(R, I) = R \cdot I$ 

beschrieben wird angucken. Hierbei wird die Spannung $U$ durch die Variablen $R$ und $I$ beschrieben. Dies gilt auch analog für Funktionen in einer Programmiersprache:

In [None]:
def Spannung(Widerstand, Strom):  # U(R,I)
    return Widerstand * Strom     # Wiedergabe der Funktion

Diese Funktion können wir nun auf Messdaten anwenden. Z.B. wir Messen bei einem Widerstand von $1\,\text{k}\Omega$ einen Strom von $10\,\text{mA}$:

In [None]:
# Leider müssen wir hier auf die Einheiten selbst achten.
# Deshalb ist es ratsam sich die Einheiten zu den Werten zu notieren.
U = Spannung(1000, 0.01)     # in V 
U   

Neben mathematischen Funktionen, können Funktionen in einer Programmiersprache auch viel allgemeinere Aufgaben erfüllen bzw. komplexe Algorithmen beinhalten. Hierzu lernt ihr jedoch noch mehr in anderen Programmierkursen. Wie zum Beispiel:

* Computer in der Wissenschaft 
* Programmieren für Physiker
* Einführung in die Programmierung

### Tipp: 
Es ist ratsam gleich von Anfang an Funktionen zu dokumentieren. Hierzu wird in Python der sogenannte `Doc-Strings`. Sie beinhalten Informationen über die Funktion selbst ihre Verwendeten Parameter und ihrer Ausgabe. Zum Beispiel für unser Beispiel des Ohmschen Gesetzt:

In [None]:
def Spannung(Strom, Widerstand):
    '''
    Diese Funktion berechnet die Spannung eines Ohmschen 
    Widerstands.
    
    Args:
        Strom (float): Der gemessene Strom in mA.
        Widerstand (float): Der Wert des verwendeten Widerstands
            in Ohm.
         
        
    Returns:
        float: Die Berechnete Spannung in V.
    '''
    return Widerstand * Strom/1000

## Messtabellen in Python:

Damit euch eine Programmiersprache wie Python Arbeit abnehmen kann, sollte es natürlich auch möglich sein größere Datenmengen z.b. die Werte einer Messtabelle in einer Variablen zu speichern. Python bietet hierfür mehrer verschiedene Konzepte alle mit unterschiedlichen Stärken und Schwächen. Die gängigsten Methoden sind listen, tuple, bzw. so genannte numpy.arrays und pandas.dataframes. Aufgrund der imitierten Zeit im PGP 1 werden wir uns hier lediglich mit zwei dieser vier Methoden auseinander setzen. 

Fangen wir zunächst mit Listen an. Eine Liste ist eine Ansammlung von Werten, welche alle den gleichen oder ganz unterschiedliche Datentypen haben können. Eine Liste kann auf zwei unterschiedliche Art und Weisen erstellt werden:

In [None]:
Messwerte1 = ['Wert1', 'Wert2', 'Wert3']  # Variante 1
Messwerte1

In [None]:
Messwerte2 = list([2, 0.9, '1'])          # Variante 2
Messwerte2

Sobald wir eine liste erstellt haben können wir eine ganze Reihe von unterschiedlichen Manipulationen durchführen um sie nach unserem belieben zu verändern.

Wir können zum Beispiel die bestehende Liste um ein Wert erweitern (`append`) oder einen zusätzlichen Wert an eine beliebige Stelle in der Liste hinzufügen (`insert`).

In [None]:
Messwerte1.append('Wert5')
Messwerte1

In [None]:
Messwerte1.insert(4, 'Wert4')
Messwerte1

Ups, was ist denn in der letzten Zelle passiert? Wert4 wurde ja garnicht an Stelle 4 der Liste gesetzt, Python scheint nicht zählen zu können... 

Leider zählt Python doch richtig. In Python läuft der index von objekten in einer Liste oder ähnlichem immer von 0,1,2,3...n. Dies können wir auch ganz einfach überprüfen in dem wir unsere Liste in verschiedene "Scheiben" schneiden (so genanntes slicing). Dies geht wie folgt:  

In [None]:
NeueWerte = ['Wert1', 'Wert2', 'Wert3', 'Wert4', 'Wert5', 'Wert6'] 

Die kleinste Scheibe welche wir abschneiden können ist ein einzelner Wert:

In [None]:
NeueWerte[0]  # Hier seht ihr, dass der erste Wert den Index 0 hat.

In [None]:
wert_index_2 = NeueWerte[2]   
wert_index_2

Wie bei einer Pizza können wir uns natürlich auch größere Stücke nehmen.

In [None]:
NeueWerte[0:3]    

In [None]:
NeueWerte[2:5] # Ihr seht Python behandelt den letzten Wert wie in einem offenen Intervall [2,5)

In [None]:
NeueWerte[2:]  # Hier werden alle Werte mit dem Index >= 2 zurück gegeben

In [None]:
NeueWerte[-3:] # Mit negativen Zahlen fangt ihr vom Ende der Liste an

Neben `insert`, `append` und `slicing` bietet Python noch ein paar weitere Listenmanipulationen an. Mit Hilfe des `+` Operators könnt ihr die Werte in einer Liste direkt an eine andere Liste anfügen.

In [None]:
Messwerte1 + NeueWerte

Anders als `append` welches die zweite Liste als ganzes an die erste Liste anfügt:

In [None]:
Messwerte1.append(NeueWerte)
Messwerte1

Aber aufgepasst bei `append` wird eure Liste an welche ihr die Daten anhängt (hier Messwerte1) direkt geändert (dies gilt auch für `insert`), während ihr beim `+` Operator die Variable überschreiben müsst damit die Änderung wirksam wird.  

In [None]:
Messwerte1 = Messwerte1 + NeueWerte
# Tipp dies könnt ihr auch einfach mit Hilfe von
# Messwerte1 += NeueWerte
Messwerte1

Zwei weitere nützliche Befehle im zusammenhang von listen ist die `len`- und `range`-Funktion. 

`len` gibt euch die Länge einer Liste zurück 

In [None]:
print(Messwerte1)
len(Messwerte1)

`range` erstellt euch ganzzahlige Werte zwischen zwei ganzen Zahlen 

In [None]:
range(0,  # <-- Startwert
      5,  # <-- Endwert (nicht mehr enthalten, offenes Ende)
      2   # <-- Schrittweite
     )

Ihr könnt die `range` Rückgabe auch wieder in eine Liste umwandeln mit

In [None]:
list(range(0,5,2))

<div class=task>
    
#### Aufgabe 4.a.: Erstellen von Messwerttabellen:

Erstelle für jede Spalte (außer der Messwertnummer) der nachfolgende Messtabelle eine Liste welche die Messdaten beinhaltet. Benutze anschließend den `append` Befehl um deine Spaltendaten an eine weitere Liste namens *daten* anzuhängen. 

| Messwertnummer | Spannung [V] | Strom [mA] | Fehler der Spannung [V] | Fehler des Stroms in [mA] |
|----------------|--------------|------------|-------------------------|---------------------------|
| 1              | 12.00        | 110        | 0.32                    | 10                        |
| 2              | 11.78        | 98         | 0.15                    | 10                        |
| 3              | 12.56        | 102        | 0.63                    | 10                        |
| 4              | 12.34        | 124        | 0.12                    | 10                        |
| 5              | 12.01        | 105        | 0.20                    | 10                        |
| 6              | 11.94        | 95         | 0.17                    | 10                        |


Verwende anschließend das Slicing um die umgesetzte Leistung im Widerstand für die Meswerte 3 und 5 zu berechnen.

**Tipp:**

1. Ihr habt bereits die Funktionen für die Leistung in Aufgabe 3 definiert und könnt sie hier erneut verwenden. 
2. Das Sclicen von verschachtelten Listen funktioniert genauso wie bei normalen Listen: 

```python
spalte0 = daten[0]  #<-- Wählt die Spalte 0 an   
spalte0[2]          #<-- Wählt aus Spalte 0 den Messwert mit Index 2 an
# oder als Einzeiler:
daten[0][2]  
```

3. Wie verhält sich die Messwertnummer zum Listenindex?
<div>

### Arbeiten mit Messreihen:

Bisher hat uns das programmieren eher mehr Arbeit gemacht als uns welche abgenommen. Zeitersparnis bekommen wir sofern wir viele Rechnungen hintereinander ausführen müssen. Hierfür gibt es die **for**-Schleife. Diese Schleife führt die gleichen Zeilen eins Codes wiederholt für die Elemente in einer Liste aus:

In [None]:
liste = [1, 2, 3, 4]

for wert in liste:
    print('Wert:', wert)
    rechnung = wert + 2
    print('Ergebnis:', rechnung)

Bei einer Schleife ist darauf zu achten, dass der Anweisungsblock welcher wiederholt ausgeführt werden soll mit 4x Leerzeichen eingrückt wurde. Dies entspricht einmal der TAB-Taste.

In [None]:
liste = [1, 2, 3, 4]
print('Hier läuft das Hauptprogramm')

for wert in liste:
    print('Schleife')
    print('Wert:', wert)
    rechnung = wert + 2
    
print('Hier läuft wieder das Hauptprogramm')
rechnung = rechnung + 5
print('Letztes Ergebnis + 5: ', rechnung)

Statt das Ergebnis lediglich per `print`-Anweisung darstellen zu lassen, können wir auch unser Wissen um Listen benutzen und die berechneten Werte einer neuen Liste anfügen:

In [None]:
Stromwerte = [101, 105, 98, 87, 112]    # mA
Spannungswerte = []# Einheit? <-- Deshlab Docstrings und Help!
Widerstand = 100   # Ohm

for Strom in Stromwerte:
    Spannungswerte.append(Spannung(Strom, Widerstand))

Spannungswerte

Python ermöglicht uns auch eine kompaktere Schreibweise die so genannte "list comprehension": 

In [None]:
Spannungswerte = [Spannung(Strom, 1000) for Strom in Stromwerte]

Wir können auch über mehre Daten gleichzeitig loopen. Hierzu kann die `zip` Anweisung genutzt werden. `zip` verbindet hierbei die einzelnen Elemente einer Liste wie bei einem Reißverschluss miteinander:

In [None]:
Werte1 = ['A', 'B', 'C', 'D']
Werte2 = [0, 1, 2, 3]

for w1, w2 in zip(Werte1, Werte2):
    print(w1, ' und ', w2)

Dies kann zum Beispiel dann hilfreich sein wenn sich mehr als eine Variable ändern soll, z.B. bei einer Messreihe für die Schallgeschwindigkeit in Luft:

In [None]:
# Gemessene Werte:
frequenzen = [30.17, 30.63, 30.01, 29.98, 30.12, 29.87, 29.94] #kHz
wellenlängen = [11.12, 11.34, 11.45, 11.25, 11.01, 11.45, 11.23] # mm

# Variante 1:
schallgeschindigkeiten = []  # m/s

for f,l in zip(frequenzen, wellenlängen):
    schallgeschindigkeiten.append(f*l)

print(schallgeschindigkeiten)

# oder Variante 2:
schallgeschindigkeiten2 = [f*l for f,l in zip(frequenzen, wellenlängen)]
print(schallgeschindigkeiten2)

Wir können auch die `zip`-Anweisung mit mehr als nur zwei Listen verwenden:

In [None]:
l1 = ['a', 'b', 'c']
l2 = [1, 2, 3]
l3 = ['x', 'y', 'z']

for i,j,k in [l1, l2, l3]:
    print(i, 'und', j, 'und', k)

<div class=task>
    
#### Aufgabe 4.b.: Werte berechnen:
Berechnet nun für die Messwerte aus Aufgabe 4 a. die Leistung $P$ und den Widerstand $R$ sowie deren Fehler. Nutzt hierfür die ausführliche schrebweise der **for**-Schleife im Fall des Widerstands $R$ und den list-comprehension Syntax für die Leistung $P$. Fügt die berechneten Werte als neue Spalten and die Liste *daten* an. 
<div>

## Das Darstellen von Messdaten mittels `matplotlib`:
Das Plotten von Daten ist eines der wichtigsten Mittel um eine Fülle von Informationen kompakt und verständlich seinem Gegenüber darzubieten. Gute Plots zu erstellen kann eine regelrechte Kunst sein und ist für ein gutes Paper, bzw. eine gute Bachelor- bzw. Masterarbeit unverzichtbar.  

<figure class="image">
<img src="images/MaterialPythonkurs092018/Xenon1tResults1yearx1texposure.png"  alt="{{ Xenon1t results 2018 }}" width=50%>
<figcaption>Resultate des XENON1T Dunkle Materie Experiments. Die Graphik wurde mittels Matplotlib in Python erstellt. </figcaption>
</figure>

Jede Programmiersprache verfügt über zusätzliche Pakete (im Englischen "packages") welche die Funktionalität der verwendeten Programmiersprache erweitern. **Matplotlib** ist ein umfangreiches Package, welches das Zeichnen von 2D und 3D Grafiken ermöglicht. Alle Parameter und Einstellungen einer Grafik werden entsprechend des Python-Codes eingestellt. Dadurch wird das Erstellen der Grafik reproduzierbar und man kann schnell dieselbe Grafik mit neuen Daten füttern.

Es ist unmöglich alle Möglichkeiten und Einstellungen die euch **Matplotlib** bietet auswendig zu kennen. Mit der Zeit werdet ihr ein solides Grundwissen der gängisten Befehle haben. Für alles weitere hilft euch die [Dokumentation und ihre Beispiele](http://matplotlib.org/). Des Weiteren ist insbesondere hier die **IPython Hilfe** und das **automatische Vervollständigen von Befehlen** besonders hilfreich.

Für das Praktikum wollen wir uns zunächst lediglich drei unterschiedliche Arten von Plots angucken:

* Normale Liniengrafiken
* Plots mit Fehlerbalken
* Histogramme 

Zunächst müssen wir Python mitteilen, dass wir das **Matplotlib** package nutzen möchten:

In [None]:
import matplotlib.pyplot as plt   

`import` läd für und aus dem package matplotlib das Modul `pyplot`. Mit Hilfe des Zusatzes `as plt` wird ein alias erstellt. Dieser Alias erspart uns im nachfolgenden Arbeit, wie wir im nachfolgenden Beispiel sehen können:

In [None]:
plt.plot([1,2,3,4,5],   # <-- x-Daten
         [1,2,3,4,5]    # <-- y-Daten
        )
plt.show()              # <-- Zeigen des Plots

Hätten wir den Alias nicht definiert hätten wir den folgenden etwas länglichen Code benötigt:

```python
matplotlib.pyplot.plot([1,2,3,4,5], [1,2,3,4,5])
matplotlib.pyplot.show()
```

Innerhalb der Python-Community haben sich ein paar Standards etabliert an welche man sich halten sollte. So ist für `matplotlib.pyplot` der Alias `plt` zu verwenden. 

Im oberen Beispiel habt ihr nun auch bereits gesehen wie wir einfache Liniengrafiken erstellen können. Dabei sieht der Plot noch etwas blass aus. Dies können wir mit ein paar zusätzlichen Befehlen ändern.

In [None]:
xdaten = [1,2,3,4,5]
ydaten = [1,2,2,4,5]

plt.plot(xdaten, ydaten,       # <-- Wie eben die x und y daten
         color = 'red',        # <-- Farbe der Linie
         linestyle='dashed',   # <-- Linientyp
         label='Graph 1'       # <-- Name der Linie
        )
plt.xlabel('X-Achse')          # <-- Beschriftung der x-Achse
plt.ylabel('Y-Achse')          # <-- Beschiftung der y-Achse
plt.legend()                   # <-- Hinzufügen der Legend mit den 
                               #     in plot definierten labels
plt.show()

Viele der eben verwendeten Optionen bieten euch unterschiedliche Auswahlmöglichkeiten:

**Linestyle:**
* `''`:  keine Linie
* `'-'`: durchgehende Linie
* `'--'`: gestrichelte Linie
* `'-.'`: Strich-Punktlinie
* `':'`: Punktlinie
* `'steps'`: Treppenfunktion

**Color**:
* red, blue, yellow, 
* RGB Werte von 0 bis 1 (statt von 0 bis 255): (1, 1, 1), (1, 0.2, 0.4)

Darüber hinaus gibt es auch noch andere nützliche Styleoptionen wie `alpha` was die Transparenz eurer Linie ändert (Werte zwischen 0-1), oder `linewidth`-Option mit dessen Hilfe ihr die Linienbreite ändern könnt. 

Auch die anderen Befehle welche wir verwendetet haben verfügen über zusätzliche Optionen:

In [None]:
xdaten = [1,2,3,4,5]
ydaten = [1,2,2,4,5]

plt.plot(xdaten, ydaten,       
         color = 'red',        
         linestyle='dashed',   
         label='Graph 1'       
        )
plt.xlabel('X-Achse',
           color = (0,1,0)     # <-- Beschriftungsfrabe
          )          

plt.ylabel('Y-Achse', 
           fontsize=14)        # <-- Beschiftungsgröße

plt.legend(title='Messwerte',  # <-- Legendentitel
           loc=3)              # <-- Legendenposition: 
                               # 0: Best, 
                               # 1: Oben Rechts 
                               # 2: Oben Links
                               # 3: Unten Links    
plt.show()

Sofern ihr mehrere Graphen in einen Plot zeichnen möchtet geht dies auch ganz einfach.

In [None]:
xdaten = [-3, -2, -1, 0, 1, 2, 3]
ydaten1 = xdaten
ydaten2 = [x**2 for x in xdaten]
ydaten3 = [x**3 for x in xdaten]

plt.plot(xdaten, ydaten1, label='Linear')
plt.plot(xdaten, ydaten2, label='Quadratisch')
plt.plot(xdaten, ydaten3, label='Cubisch')

plt.legend(title='Exponent')
plt.xlabel('X-Werte')
plt.ylabel('Y-Werte')
plt.show()

Ihr seht, das `plot` zwischen den angegebene Werte interpoliert. Möchtet ihr eine glatte Kurve zeichnen so müsst ihr die Anzahl an Punkten für die Interpolation erhöhen.

In [None]:
def cubic(x):
    '''
    Funktion welche den cubischen Wert einer Zahl zurück gibt.
    '''
    return x**3


x1 = list(range(-3, 4, 1))            # <- Werte zwischen -3 und 3
x2 = [i/10 for i in range(-30,31,1)]  # <- 10 mal mehr Werte

y1 = [cubic(j) for j in x1]
y2 = [cubic(value) for value in x2]


plt.plot(x1, y1, label='Werte 1', linestyle='dashed')
plt.plot(x2, y2, label='Werte 2')
plt.xlabel('x-Werte')
plt.ylabel('y-Werte')
plt.legend()
plt.show()

### Errorbarplot

In der Physik gehören zu jedem gemessen Wert ein Messunsicherheit/Messfehler. Diese Fehler sollten natürlich auch in unseren Grafiken korrekt dargestellt werden. Hierfür können wir den `errorbar`-Plot verwenden.

In [None]:
spannung = [0.9, 2.0, 3.0, 4.1, 4.9, 6.2] # [V]
strom = [105, 204, 298, 391, 506, 601] # [mA]
spannung_error = [0.3]*len(spannung)  # Konstanter Ablesefehler [V]
strom_error = [14, 9, 12, 8, 7, 11]      # gemessener schwankender Fehler[mA]

# plt.errorbar() # <--- Wie verwende ich den errorbar plot?

plt.ylabel('Spannung [V]')
plt.xlabel('Strom [mA]')
plt.show()

<div class=task>
    
#### Aufgabe 5.: Erstelle eine `errorbar`-Plot :

Editiert die obere Zelle so, dass ihr mit Hilfe des Befehls 

```python
plt.errorbar()
```

einen Errorbarplot erstellt. Verwende hier für die IPython help-funktion um den exakten Syntax zu erfahren. 

**Erinnerung:**
Ihr könnt die IPython-Hilfe aufrufen in dem ihr euren Cursor innerhalb das Wort errorbar von plt.errorbar bewegt und die Tastenkombination shift + tab verwendet. Lest nun nach wie ihr die x- und y-Werte und deren Fehler an die Funktion übergeben müsst.


Leider ist diese Standardvariante des Errorbar plots noch nicht das was wir möchten. Die Messwerte sind linear interpoliert und die errorbars sehen noch etwas eigenartig aus. Dies können wir jedoch im Handumdrehen ändern. Kümmern wir uns zunächst um die Plotmarker:

In [None]:
#plt.errorbar(, 
#             ,
#             ,
#             ,                        
#                                       # Änderungen für plotmarker:             | Kurzform:
#             linestyle='',             # <-- Schaltet den Linienstyle aus       | ls=''
#            marker='d',               # <-- Ändert den Markertyp in Diamanten  | -----
#             markerfacecolor='orange', # <-- Ändert die Markerfarbe zu Orange   | mfc='orange'
#             markeredgecolor='k',      # <-- Setzt die Kantenfarbe auf schwarz  | mec='k'
#             markersize=7              # <-- Ändert die Markergröße             | ms='7'
#            ) 

plt.ylabel('Spannung [V]')
plt.xlabel('Strom [mA]')
plt.show()

All die Optionen welche wir hier für die Plotmarker verwendet haben können wir auch in der normalen `plt.plot`-Anweisung verwenden. Dabei gibt es eine ganze fülle an unterschiedlichen [marker Symbole](http://matplotlib.org/api/markers_api.html):
 
* `+`: Plus
* `o`: Kreis
* `*`: Stern
* `,`,`.`: kleiner und sehr kleiner Punkt
* `s`: Quadrat
* `p`: Pentagon
* `h`: Hexagon
* `1`, `2`, `3`, `4`: nach unten, oben, links, rechts zeigendes Dreieck
 
Nach dem wir uns um unsere Marker gekümmert haben müssen wir nun auch noch unsere Fehlerbalken enstprechend anpassen:

In [None]:
plt.errorbar(strom, 
             spannung,
             xerr=strom_error,
             yerr=spannung_error,     
             ls='',            
             marker='d',              
             mfc='orange', 
             mec='k',      
             ms=7,
                            # Fehlerbalken optionen:
             ecolor='k',    # <-- Ändert die Linienfarbe der errorbars
             elinewidth=2,  # <-- Ändert die Fehlerbalkenbreite
             capsize=5,     # <-- Ändert die Breite der Endkappen der Fehlerbalken
             capthick=2     # <-- Ändert die Dicke der Endkappen
            ) 

plt.ylabel('Spannung [V]')
plt.xlabel('Strom [mA]')
plt.show()

### Histogramme:

Ein weiterer Plottyp welcher häufig Verwendung findet ist das Histogramm. Um unser Histogramm mit Pseudozufallszahlen zu bestücken müssen wir diese erst erzeugen. Hierfür können wir das `numpy`-Modul verwenden. `numpy` ist ein weiteres Standardmodul welches viele nützliche Funktionen mit sich bringt. Hier wollen wir uns jedoch nur auf das erstellen von Zufallszahlen beschränken. 

In [None]:
import numpy as np

In [None]:
rnd_numbers = np.random.normal(0,1,1000)  # <-- Hier werden 1000 gausförmig verteile Zufallszahlen
                                          # mit einem Mittelwert von 0 und einer Standardabweichung 
                                          # von 1 erzeugt.

Das histgrom lässt sich ganz einfach mit der `plt.hist`-Anweisung erstellt.

In [None]:
plt.hist(rnd_numbers)

plt.xlabel('Zufallswert')
plt.ylabel('Anzahl der Einträge')
plt.show()

Auch für Histogramme gibt es viele unterschiedlichen Optionen welche ihr entweder mit Hilfe der Help-Funktion oder den Beispielen in der [Matplolibdokumentation](http://matplotlib.org/) herrausfinden könnt.

In [None]:
rnd_numbers2 = np.random.normal(1,2,1000)


plt.hist(rnd_numbers, 
         bins=13, 
         range=(-3,5),         # <-- Achtung im Gegensatz zur range-Anweisung ist 
                               # das Intervall hier geschlossen [-3, 5]
         histtype='step',      # Ändert den Balkentyp in Stufen
         linestyle='dashed',
         label='Verteilung 1'
        )

plt.hist(rnd_numbers2, 
         bins=13, 
         range=(-3,5),
         alpha=0.5,            # Ändert die Transparenz der Balken 
         label='Verteilung 2'
        )

plt.legend()
plt.xlabel('Zufallswert')
plt.ylabel('Anzahl der Einträge')
plt.show()

Bei Histogrammen solltet ihr immer darauf achten, dass euer binning sinnvoll gewählt ist. Weder zu viele noch zu wenig Bins führen zu einer sinnvollen Darstellung eurer Daten.

In [None]:
plt.hist(rnd_numbers, 
         bins=100, 
         range=(-3,3),
         label='Zu viele bins'
        )

plt.legend()
plt.xlabel('Zufallswert')
plt.ylabel('Anzahl der Einträge')
plt.show()

plt.hist(rnd_numbers, 
         bins=3, 
         range=(-3,3),
         label='Zu wenig bins'
        )

plt.legend()
plt.xlabel('Zufallswert')
plt.ylabel('Anzahl der Einträge')
plt.show()

Nach dem wir jetzt die verschiedenen Plottypen mit ihren unterschiedlichen Optionen kennen gelernt haben möchten wir diese natürlich auch speichern können. Dies können wir auf zwei unterschiedliche Arten machen.

Entweder ihr macht mit eurer Maus einen Rechtsklick auf eure Grafik und wählt "Grafik speichern als" aus, oder ihr verwendet statt der `plt.show`- die `plt.savefig`-Anweisung dafür.

In [None]:
plt.errorbar(strom, 
             spannung,
             xerr=strom_error,
             yerr=spannung_error,     
             ls='',            
             marker='d',              
             mfc='orange', 
             mec='k',      
             ms=7,
             ecolor='k',    
             elinewidth=2,  
             capsize=5,    
             capthick=2    
            ) 

plt.ylabel('Spannung [V]')
plt.xlabel('Strom [mA]')
plt.show()
#plt.savefig(r'C:\Users\Daniel\Desktop\myplot.png',  # <-- Pfad in dem der Plot gespeichert werden soll
#            dpi=300)                                # <-- Auflösung mit dem der Plot gespeichert werden soll.
#                                                    #     300 - 600 dpi solltet ihr hier verwenden.

## Fitten von Messdaten:

### Methode der kleinsten Quadrate

Im folgenden wolllen wir die **Methode der kleinsten Quadrate (Least Squares)** näher beleuchten. Diese Methode wird oft benutzt um eine Funktion $\lambda(x; \ $**$\phi$**$)$ mit den Funktionsparametern $\mathbf{\phi}$ an die gemessenen Punkte **$(x,y)$** anzupassen. Um jedoch die **Methode der kleinsten Quadrate** zu verstehen wollen wir sie erst einmal anschaulich und mathematisch herleiten. Dabei stüzen wir uns im folgenden auf eine Herleitung aus dem Buch **"Statistical Data Analysis"**  von **Glen Cowan**.

In unserem Grundpraktikum haben wir bereits gelernt, dass Messwerte durch Zufallszahlen $x_i$ representiert werden und einer gewissen **Wahrscheinlichkeitsdichtefunktion (probability density function)** $f(x)$ unterliegen. 

<figure class="image">
<img src="images/MaterialPythonkurs092018/PorbDensFun.png"  alt="{{ Beispiel PDF }}" width=70%>
</figure>


Eine **pdf** gibt an mit welcher **Wahrscheinlichkeit ein Wert $x_i$** innerhalb eines **infinitesimalen Intervals $\text{d}x_i$** zu finden ist. Des Weitren gilt das die Gesamtwahrscheinlichkeit gegeben ist durch $\int_S f(x) dx = 1$. 

Nun betrachten wir folgendes Beispiel: In unserem Labor messen wir genau drei mal die Raumtemperartur T. Auch hier gilt, dass unsere Messung der einzelnen $T_i$ einer gewissen **Wahrscheinlichkeitsdichtefunktion** folgen. Betrachtet nun das folgende Bild; welche **Wahrscheinlichkeitsdichtefunktion** passt besser zu den gezeigten Daten und **Warum?**

<figure class="image">
<img src="images/MaterialPythonkurs092018/ProbMaxTemp.png"  alt="{{ Beispiel PDF }}" width=100%>
</figure>

Die rechte Verteilung spiegelt unsere Messdaten besser wieder. Dies können wir auch mathematisch ausdrücken. Für $N$ voreinander unabhängige Zufallszahlen bzw. Messpunkte (in unserem Beispiel $N = 3$) ist die Gesamtwahrscheinlichkeit gegeben durch das Produkt der einzelnen Wahrscheinlichkeitsdichten $f(x_i, \theta)$ multipliziert mit dem jeweiligen infinitesimalen element $dx_i$

$$\prod_{i = 1}^{N} f(x_i,\theta) \  dx_i \text{   für alle } x_i \text{ in } [x_i, x_i + dx_i]$$

wobei $x_i$ in unserem Beispiel den Messpunkten $T_i$ und $f(x_i,\theta)$ unserer Gausverteilung mit $\theta = (\mu, \sigma)$ entspricht. Sprich sofern unsere Werte gut von der jeweiligen **Wahrscheinlichkeitsdichtefunktion** repräsentiert werden, d.h. wir die richtigen Parameter $\theta$ gewählt haben (wie im rechten oberen Plot), gilt 

$$ \prod_{i = 1}^{N} f(x_i,\theta)  dx_i$$ 

ist **maximal**. Da die einzelnen $dx_i$ von unseren Parametern $\theta$ unabhängig sind gilt die gleiche Argumentation auch für 

$$ \mathcal{L}(x_1 ... x_N; \theta_1 ... \theta_N) = \prod_{i = 1}^{N} f(x_i,\theta)$$ 

wobei $\mathcal{L}(x_1 ... x_N; \theta_1 ... \theta_N)$ die sogenannte **likely hood function** darstellt.

Wie kommen wir nun von der **likely hood function** auf unsere **Methode der kleinsten Quadrate** und dem fitten einer Funktion $\lambda(x; \ $**$\phi$**$)$ an die gemessenen Punkte **$(x,y)$**? Dazu brauche wir noch einen Zwischenschritt. Oftmals ist es einfacher statt die **likely hood function** zu maximieren die so genannte **log likely hood function**

$$ \log( \mathcal{L}(x_1 ... x_N; \theta_1 ... \theta_N)) = \sum_{i = 1}^{N} \log(f(x_i,\theta))$$

zu maximieren. Dies ist im Grunde das Gleiche, da der logarithmus eine monoton-steigende Funktion ist. Auch in unserem Fall der **Methode der kleinsten Quadrate** benötigen wir die **log likely hood function**. 

Stellt euch nun vor wir haben eine Messung mit $N$ voneinander unabhängigen Messpunkten (x,y). Des Weiteren nehmen wir an, dass alle $x_i$ ohne Fehler sind und das unsere $y_i$ gaußförmig um einen unbekannten Wahrenwert $\lambda_i$ (sprich $\lambda_i$ entspricht dem Erwartungswert $\mu_i$ unserer Gaußverteilung) mit einer bekannten Varianz $\Delta y_i^2$ verteilt sind (Diese Annahme lässt sich mit dem zentralen Grenzwertsatz begründen, so lange der Fehler sich aus der Summe kleinen Fehlern zusammensetzt). Die dazugehörige  **likely hood function** ist dann gegeben durch:

$$ \mathcal{L}(y_1 ... y_N; \lambda_1 ... \lambda_N, \Delta y_1 ... \Delta y_N)) = \prod_{i = 1}^{N}\frac{1}{\sqrt{2 \pi \Delta y_i^2}} \cdot \exp \bigg( \frac{ -(y_i - \lambda_i)^2}{2 \cdot \Delta y_i^2}\bigg)$$

Beziehungsweise die **log likely hood function** mit $\lambda_i = \lambda(x_i; \phi)$ ergibt sich zu

$$ \log(\mathcal{L}(y, \theta)) \approx -\frac{1}{2} \sum_{i = 1}^{N}\bigg( \frac{ (y_i - \lambda(x_i; \phi))^2}{\Delta y_i^2}\bigg)$$

wobei die konstanten Terme welche nicht von unserer Funktion $\lambda(x_i; \phi)$ abhängen vernachlässigt worden sind. Durch den Faktor $-\frac{1}{2}$ ist das maximieren dieser **log likely hood function** gleich dem minnimieren von

$$ \chi(\phi_1 ... \phi_N)^2 = \sum_{i = 1}^{N} \frac{ (y_i - \lambda(x_i; \phi))^2}{\Delta y_i^2}$$

Diese Funktion ist unsere gesuchte **Methode der kleinsten Quadrate**. Mit ihrer Hilfe kann eine beliebige Funktion $\lambda(x; \phi)$, welche liniear in ihren Parametern $\phi$ ist, an unsere Messdaten $(x,y\pm\Delta y)$ gefittet werden. Dabei stellt der Fitprozess selbst lediglich ein Minimierungsproblem dar. Im folgenden sind unsere Annahmen noch einmal grafisch in einem Beispiel dargestellt.

<figure class="image">
<img src="images/MaterialPythonkurs092018/LeastSquare.png"  alt="{{ Least Square Beispiel }}" width=100%>
</figure>

Es gibt verschiedene Arten von Algorithmen um Minimierungsprobleme zu lösen. Wie diese genau Aufgebaut sind lernt ihr in anderen Progrmmierkursen wie zum Beispiel *Programmieren für Physiker* oder *Computer in der Wissenschaft*. Zum Glück haben uns bereits in Python andere Menschen diese Arbeit abgenommen und wir können aus dem Package `scipy.optimize` die Funktion `curve_fit` verwenden. 

Hierbei stellt curve_fit eine Methode dar, Fit-Funktionen nach der obigen vorgestellten Methode der *kleinsten Quadraten* zu bestimmen. Dies hat zur folge, dass lediglich die y-Fehler eurer Messwerte für den Fit verwendet werden können. 

In [None]:
from scipy.optimize import curve_fit

Gucken wir uns einen Fit ohne Messfehler an um die Funktion etwas näher kennen zu lernen.

In [None]:
# Und jetzt fitten wir:
para, pcov = curve_fit(Spannung,   # <-- Funktion die an die Messdaten gefittet werden soll
                       strom,      # <-- gemessenen "X"-Werte
                       spannung    # <-- gemessenen "Y"-Werte 
                      )

print(para)
print(pcov)

Ihr seht die `curve_fit` gibt uns zwei unterschiedliche Listen zurück. Die erste Liste `para` beinhaltet die berechneten Fitparameter. `pcov` hingegen ist eine [Kovarianzmatrix](https://de.wikipedia.org/wiki/Kovarianzmatrix) auf deren Diagonalen ihr die Varianzen ($\sigma^2$) der einzelnen Parameter findet (auf der Nebendiagonalen befinden sich die Kovarianzen, die euch aber im PGP nicht weiter zu kümmern brauchen).

Lasst uns das Resultat mal darstellen:

In [None]:
plt.plot(strom, 
             spannung,    
             ls='',            
             marker='d',              
             mfc='orange', 
             mec='k',      
             ms=7,
             label='Messwerte aus A. 5 (ohne Fehler)'
            ) 
plt.plot(strom, 
         [Spannung(value, para[0]) for value in strom], 
         ls ='dashed',
         color='orange',
         label = f'Fitgerade mit R = {para[0]:0.2f} +/- {pcov[0,0]**(1/2):0.2f} ohm'
        )

plt.legend()
plt.ylabel('Spannung [V]')
plt.xlabel('Strom [mA]')
plt.show()

Das Ergebnis sieht bereits ganz gut aus, allerdings kennt hier unsere Funktion `curve_fit` die Fehler unserer Messwerte noch garnicht. Da dies sehr unphysikalisch ist lasst uns das ganze nochmal mit Unsicherheiten wiederholen: 

In [None]:
para2, pcov2 = curve_fit(Spannung,   
                       strom,      
                       spannung,
                       sigma=spannung_error,   # <-- Diesesmal mit Fehler
                       absolute_sigma=True     # <-- Diesen Option müssen wir auf Wahr setzen, da 
                                               # wir in der Regel absolute und keine relativen 
                                               # Unsicherheiten messen.
                      )

plt.errorbar(strom, 
             spannung,
             xerr=strom_error,
             yerr=spannung_error,     
             ls='',            
             marker='d',              
             mfc='orange', 
             mec='k',      
             ms=7,
             ecolor='k',    
             elinewidth=2,  
             capsize=5,     
             capthick=2,     
             label='Messwerte aus A. 5'
            ) 
plt.plot(strom, 
         [Spannung(value, para2[0]) for value in strom], 
         ls ='dashed',
         color='orange',
         label = f'Fitgerade mit R = {para2[0]:0.2f} +/- {pcov2[0,0]**(1/2):0.2f} ohm'
        )

plt.legend()
plt.ylabel('Spannung [V]')
plt.xlabel('Strom [mA]')
plt.show()

Wie ihr sehen könnt ist der Wert für den Widerstand zwar gleich geblieben, jedoch die Unsicherheit des Wertes hat sich erhöht.

Wie gut denkt ihr fittet unsere obige Funktion unsere Messdaten? Sehr gut? Gut? Befriedigend? Oder doch eher schlecht?   Wäre es nicht gut ein Maß für die Güte des Fits zu haben? Wie könnte ein solches Maß aussehen?

Ihr habt das entscheiden Kriterium bereits kennen gelernt, bei der Methode der kleinsten Quadrate geht es darum das  $\chi^2$ zu minimieren sprich klein zu machen. Gucken wir uns hierzu erst noch einmal an wie sich das $\chi^2$ berechnet:

$$ \chi(\phi_1 ... \phi_N)^2 = \sum_{i = 1}^{N} \frac{ (y_i - \lambda(x_i; \phi))^2}{\Delta y_i^2}$$

Dies bedeute in unserem Fall:

$$ \chi(R)^2 = \sum_{i = 1}^{N} \frac{ (U_i - u(I_i; R))^2}{\Delta U_i^2}$$

wobei hier groß $U$ unsere gemessenen Spannung und klein $u$ unsere Funktion entspricht.

In [None]:
chi_2 = [ (u - Spannung(I, para2[0])/du)**2 for I,u,du in zip(strom, spannung, spannung_error)]
chi_2 = sum(chi_2)
print(f'Das chi-qudrat ist {chi_2:.0f}')

Wie vergleicht sich dieses $\chi^2$ nun mit einer Funktion welche unsere Daten schlechter beschreibt. Zum Beispiel sofern wir die Spannung über die Funktion 

$$ U(R,I) = R \cdot I + C $$

beschreiben würden, also zusätzlich einem konstantem Offset.

In [None]:
def Spannung2(I, R, C):
    return R * I + C 



para3, pcov3 = curve_fit(Spannung2,   
                         strom,      
                         spannung,
                         sigma=spannung_error,
                         absolute_sigma=True     
                      )

chi_2_new = [ (u - Spannung2(I, *para3)/du)**2 for I,u,du in zip(strom, spannung, spannung_error)]
chi_2_new = sum(chi_2_new)
print(f'Chi-qudrat nach URI:  {chi_2:.0f}\nChi-qudrat nach URIC: {chi_2_new:.0f}')

Wie ihr sehen könnt ist das $\chi^2$ für unsere zweite Funktion etwas größer als für das klassische ohm'sche Gesetzt. Somit würden wir unsere zweiten Ansatz verwerfen. 

Damit man für einen gegebene Datensatz nicht hunderte von verschiedene Funktionen durchprobieren muss gibt es für das $\chi^2$ eine allgemeine Faustregel, welche den berechneten $\chi^2$-Wert mit der Anzahl unserer Freiheitsgrade vergleicht. Die Anzahl an Freiheitsgrade ist allgemeinhin gegeben als *Anzahl der Messwerte - Anzahl der Funktionsparameter* ($m - n$).

1. Sofern  $\chi^2/\text{ndof} >> 1$: sollte die Hypothese bzw. die Fitfunktion angezweifelt werden. Sie beschreibt in diesem Fall die Messdaten nur unzureichend. (Bzw. sollte $\chi^2/\text{ndof} > 1$ kann dies auch bedeuten, dass eure Unsicherheiten unterschätzt sind)
2. Sofern $\chi^2/\text{ndof} \approx 1$: beschreibt die Hypothese bzw. die Fitfunktion die Daten wie erwartet und wird nicht abgelehnt. 
3. Falls $\chi^2/\text{ndof} << 1$ beschreibt die Hypothese bzw. die Fitfunktion die Daten wesentlich besser als erwartet. In diesem Fall heißt es nicht, dass unsere Hypothese falsch ist, aber man sollte überprüfen ob die gemessenen Fehler nicht überschätzt worden sind (oder eine Korrelation zwischen denn Messfehlern vor liegt).  

Sofern ihr eine Arbeit schreibt und eure **Goodness-of-the-Fit** ($\chi^2/\text{ndof}$) angeben wollt so gebt immer beides an, das $\chi^2$ und die Anzahl an Freiheitsgraden ndof. Beide Werte getrennt habne einen größeren Informationsgehalt als der Resultierende Quotient (genaueres lernt ihr in z.B. in der Vorlesung *Statistik, Datenanalyse und Simulationen* im Master).

<div class=task>
    
#### Aufgabe 6.: PGP Auswertung:

Jetzt seid ihr ein letztes mal gefordert. In dieser Aufgabe wollen wir alles was wir heute gelernt haben nochmal reflektieren und anwenden. Erstellt hierfür ein neues Jupyter-Notebook und bearbeitet die Aufgaben im Skript. Sofern ihr Fragen bzw. Probleme habt vergesst nicht auf die folgenden Hilfsmöglichkeiten zurückzugreifen:

1. Verwenden der IPython-Hilfe unter Verwendung der shift + tab Tasten.
2. Die ausführlichen Dokumentation von Python und das Angebot etlicher nützlicher Hilfsbeiträge in verschiedenen Foren (z.B. stackoverflow) im Internet.
3. Fragt bei den Assistenten nach während der Stunde nach bzw. nutzt den Emailkontakt auf der [gitlab Seite](https://gitlab.rlp.net/hoek/pgp1-python-einfuehrung/tree/master). 
