Ready to present

Final files
Makrus hat nen kleinen Pimmel
2023-07-17 00:33:12 +02:00 · 2023-07-17 00:02:10 +02:00 · 2023-07-16 20:00:15 +02:00 · 2023-07-16 19:16:43 +02:00 · 2023-07-16 14:15:26 +02:00 · 2023-07-16 00:40:47 +02:00
9 changed files with 1257 additions and 0 deletions
--- a/Abschlussprojekt/connection.py
+++ b/Abschlussprojekt/connection.py
@ -0,0 +1,16 @@
 import dataclasses
@dataclasses.dataclass()
 class ConnectionGene:
    nodes: tuple[int, int]
    weight: float
    innovation_no: int
    disabled: bool = False
 def reset_innovation_numbers():
    _CONNECTION_GENES.clear()
 _CONNECTION_GENES: dict[tuple[int, int], ConnectionGene] = dict()
--- a/Abschlussprojekt/genome.py
+++ b/Abschlussprojekt/genome.py
@ -0,0 +1,280 @@
 from __future__ import annotations
 import dataclasses
 import itertools
 from enum import Enum
 from random import choice
 import matplotlib.pyplot as plt
 import numpy as np
 from graphs import creates_cycle
 rng = np.random.default_rng()
 from connection import _CONNECTION_GENES, ConnectionGene
 from node import NodeGene, NodeType
 class MutationType(Enum):
    ADD_CONNECTION = 1
    ADD_NODE = 2
 class Genome:
    def __init__(self):
        # Initialize nodes
        self.nodes: dict[int, NodeGene] = dict()
        # Initialize connections
        self.connections: dict[tuple[int, int], ConnectionGene] = dict()
        self.fitness = 0
    def set_node(self, key: int, node: NodeGene) -> None:
        self.nodes[key] = node
    def set_connection(self, key: tuple[int, int], connection: ConnectionGene) -> None:
        self.connections[key] = connection
    def add_node(self, node_type: NodeType = NodeType.HIDDEN) -> int:
        """
        Adds a node of the given type to the genome and returns the identification key.
        """
        key = len(self.nodes)
        self.nodes[key] = NodeGene(key, node_type)
        return key
    def add_connection(self, from_node: int, to_node: int, weight: float) -> tuple[int, int]:
        """
        Adds a connection of weight between two given nodes to the genome and returns
        the identification key.
        """
        if not isinstance(from_node, int) or not isinstance(to_node, int):
            raise ValueError("Nodes must be integer keys.")
        if from_node not in self.nodes or to_node not in self.nodes:
            raise ValueError("Nodes do not exist.")
        key = (from_node, to_node)
        connection = ConnectionGene(key, weight, -1)
        if key in _CONNECTION_GENES:
            connection.innovation_no = _CONNECTION_GENES[key].innovation_no
        else:
            connection.innovation_no = len(_CONNECTION_GENES)
            _CONNECTION_GENES[key] = connection
        self.connections[key] = connection
        return key
    @staticmethod
    def new(inputs: int, outputs: int) -> Genome:
        genome = Genome()
        # Add input nodes
        for _ in range(inputs):
            genome.add_node(node_type=NodeType.INPUT)
        # Add output nodes
        for _ in range(outputs):
            genome.add_node(node_type=NodeType.OUTPUT)
        # Fully connect
        for i in range(inputs):
            for o in range(inputs, inputs + outputs):
                genome.add_connection(i, o, weight=1)
        return genome
    @staticmethod
    def copy(genome: Genome) -> Genome:
        clone = Genome()
        # Copy nodes
        for key, node in genome.nodes.items():
            clone.set_node(key, dataclasses.replace(node))
        # Copy connections
        for key, connection in genome.connections.items():
            clone.set_connection(key, dataclasses.replace(connection))
        # Set fitness
        clone.fitness = genome.fitness
        return clone
 def mutate(genome: Genome) -> None:
    mutation = choice([MutationType.ADD_NODE, MutationType.ADD_CONNECTION])
    if mutation is MutationType.ADD_CONNECTION:
        _mutate_add_connection(genome)
    elif mutation is MutationType.ADD_NODE:
        _mutate_add_node(genome)
 def crossover(mother: Genome, father: Genome) -> Genome:
    mother_connections = {conn.innovation_no: conn for conn in mother.connections.values()}
    father_connections = {conn.innovation_no: conn for conn in father.connections.values()}
    innovation_numbers = set(mother_connections.keys()) | set(father_connections.keys())
    child_connections: dict[int, ConnectionGene] = {}
    for i in innovation_numbers:
        # Matching genes
        if i in mother_connections and i in father_connections:
            child_connections[i] = choice((mother_connections[i], father_connections[i]))
        # Disjoint or excess
        else:
            # Mother has better fitness
            if mother.fitness > father.fitness and i in mother_connections:
                child_connections[i] = mother_connections[i]
            # Father has better fitness
            elif father.fitness > mother.fitness and i in father_connections:
                child_connections[i] = father_connections[i]
            # Equal fitness
            else:
                connection = choice((mother_connections.get(i, None), father_connections.get(i, None)))
                if connection is not None:
                    child_connections[i] = connection
    # Determine input/output dimensions
    inputs = sum(node.type == NodeType.INPUT for node in mother.nodes.values())
    outputs = sum(node.type == NodeType.OUTPUT for node in mother.nodes.values())
    # Create child and set nodes & connections
    child = Genome.new(inputs, outputs)
    for connection in child_connections.values():
        # Set connections
        child.set_connection(connection.nodes, dataclasses.replace(connection))
        from_node, to_node = connection.nodes
        # Add nodes if required
        if from_node not in child.nodes:
            child.set_node(from_node, NodeGene(from_node, NodeType.HIDDEN))
        if to_node not in child.nodes:
            child.set_node(to_node, NodeGene(to_node, NodeType.HIDDEN))
    return child
 def _mutate_add_connection(genome: Genome) -> None:
    """
    In the add_connection mutation, a single new connection gene with a random weight
    is added connecting two previously unconnected nodes.
    """
    from_node = choice([id for id, node in genome.nodes.items() if node.type != NodeType.OUTPUT])
    try:
        to_node = choice(
            [
                id
                for id, node in genome.nodes.items()
                if node.type != NodeType.INPUT and (from_node, id) not in genome.connections
            ]
        )
    except IndexError:
        return
    # Checking for cycles
    if creates_cycle(genome.connections.keys(), (from_node, to_node)):
        return
    genome.add_connection(from_node, to_node, weight=rng.uniform(0, 1))
 def _mutate_add_node(genome: Genome) -> None:
    """
    In the add_node mutation, an existing connection is split and the new node
    placed where the old connection used to be. The old connection is disabled
    and two new conections are added to the genome. The new connection leading
    into the new node receives a weight of 1, and the new connection leading out
    receives the same weight as the old connection.
    """
    # Find connection to split
    try:
        connection = choice([node for node in genome.connections.values() if not node.disabled])
    except IndexError:
        return
    connection.disabled = True
    # Create new node
    new_node = genome.add_node()
    from_node, to_node = connection.nodes
    # Connect previous from_node to new_node
    genome.add_connection(from_node, new_node, weight=1)
    # Connection new_node to previous to_node
    genome.add_connection(new_node, to_node, weight=connection.weight)
 def _excess(g1: Genome, g2: Genome) -> list[int]:
    g1_connections = {conn.innovation_no: conn for conn in g1.connections.values()}
    g2_connections = {conn.innovation_no: conn for conn in g2.connections.values()}
    less_connections, more_connections = sorted((g1_connections, g2_connections), key=lambda c: max(c.keys()))
    return [k for k in more_connections.keys() if k > max(less_connections.keys())]
 def _disjoint(g1: Genome, g2: Genome) -> list[int]:
    g1_connections = {conn.innovation_no: conn for conn in g1.connections.values()}
    g2_connections = {conn.innovation_no: conn for conn in g2.connections.values()}
    less_connections, more_connections = sorted((g1_connections, g2_connections), key=lambda c: max(c.keys()))
    return list(
        {i for i in less_connections.keys() if i not in more_connections}
        | {i for i in more_connections.keys() if i not in less_connections and i <= max(less_connections.keys())}
    )
 def _get_delta(g1: Genome, g2: Genome, c1: float, c2: float, c3: float) -> float:
    n = max([len(g1.nodes), len(g2.nodes)])
    g1_connections = {conn.innovation_no: conn for conn in g1.connections.values()}
    g2_connections = {conn.innovation_no: conn for conn in g2.connections.values()}
    innovation_numbers = set(g1_connections.keys()) | set(g2_connections.keys())
    # Calculate number of excess genes
    less_connections, more_connections = sorted((g1_connections, g2_connections), key=lambda c: max(c.keys()))
    e = len([k for k in more_connections.keys() if k > max(less_connections.keys())])
    # Calculate number of disjoint genes
    d = len(
        {i for i in less_connections.keys() if i not in more_connections}
        | {i for i in more_connections.keys() if i not in less_connections and i <= max(less_connections.keys())}
    )
    # Average weight difference of matching genes
    w = 0
    for i in innovation_numbers:
        if i in g1_connections and i in g2_connections:
            w += abs(g1_connections[i].weight - g2_connections[i].weight)
    delta = ((c1 * e) / n) + ((c2 * d) / n) + (c3 * w)
    return delta
 def specify(genomes: list, c1: float, c2: float, c3: float) -> list[list]:
    THRESHOLD = 1
    species = []
    for genom in genomes:
        done = False
        if len(species) < 1:
            species.append([genom])
            done = True
        for spicy in species:
            print("Delta: ", _get_delta(genom, spicy[0], c1, c2, c3))
            if _get_delta(genom, spicy[0], c1, c2, c3) < THRESHOLD and not done:
                spicy.append(genom)
                done = True
        if not done:
            species.append([genom])
    return species
--- a/Abschlussprojekt/graphs.py
+++ b/Abschlussprojekt/graphs.py
@ -0,0 +1,28 @@
 def creates_cycle(connections: list[tuple[int, int]], test: tuple[int, int]) -> bool:
    """
    Returns true if the addition of the 'test' connection would create a cycle,
    assuming that no cycle already exists in the graph represented by 'connections'.
    https://github.com/CodeReclaimers/neat-python/blob/4928381317213ee3285204ae1f2a086286aa3a10/neat/graphs.py#L4
    """
    i, o = test
    if i == o:
        return True
    visited = {o}
    while True:
        num_added = 0
        for a, b in connections:
            if a in visited and b not in visited:
                if b == i:
                    return True
                visited.add(b)
                num_added += 1
        if num_added == 0:
            return False
--- a/Abschlussprojekt/neat.ipynb
+++ b/Abschlussprojekt/neat.ipynb
--- a/Abschlussprojekt/node.py
+++ b/Abschlussprojekt/node.py
@ -0,0 +1,14 @@
 import dataclasses
 from enum import Enum
 class NodeType(Enum):
    INPUT = 1
    HIDDEN = 2
    OUTPUT = 3
@dataclasses.dataclass(frozen=True)
 class NodeGene:
    id: int
    type: NodeType
--- a/Abschlussprojekt/requirements.txt
+++ b/Abschlussprojekt/requirements.txt
@ -0,0 +1 @@
 pygraphviz
--- a/Abschlussprojekt/visualization.py
+++ b/Abschlussprojekt/visualization.py
@ -0,0 +1,83 @@
 import matplotlib.pyplot as plt
 import networkx as nx
 import numpy as np
 import tabulate
 from genome import Genome, NodeType, mutate
 from node import NodeType
 def _find_layer(g: nx.DiGraph, hidden_node: int, inputs: list[int]) -> int:
    paths = []
    for input_node in inputs:
        paths += list(nx.all_simple_paths(g, input_node, hidden_node))
    path_lengths = [len(path) for path in paths]
    return 2 if len(path_lengths) == 0 else max(path_lengths)
 def genome_graph(genome: Genome):
    graph = nx.DiGraph()
    # Add nodes
    for node in genome.nodes.keys():
        graph.add_node(node)
    # Add edges
    for connection in genome.connections.values():
        if connection.disabled:
            continue
        from_node, to_node = connection.nodes
        graph.add_edge(from_node, to_node, weight=connection.weight)
    inputs = [node.id for node in genome.nodes.values() if node.type == NodeType.INPUT]
    hidden = [node.id for node in genome.nodes.values() if node.type == NodeType.HIDDEN]
    outputs = [node.id for node in genome.nodes.values() if node.type == NodeType.OUTPUT]
    for input_node in inputs:
        graph.nodes[input_node]["layer"] = 0
    max_layer = 1
    for hidden_node in hidden:
        layer = _find_layer(graph, hidden_node, inputs)
        max_layer = max(layer, max_layer)
        graph.nodes[hidden_node]["layer"] = layer
    for output_node in outputs:
        graph.nodes[output_node]["layer"] = max_layer + 1
    plt.subplot()
    pos = nx.multipartite_layout(graph, subset_key="layer")
    nx.draw_networkx_nodes(graph, pos, nodelist=inputs, node_color="#ff0000")
    nx.draw_networkx_nodes(graph, pos, nodelist=hidden, node_color="#00ff00")
    nx.draw_networkx_nodes(graph, pos, nodelist=outputs, node_color="#0000ff")
    nx.draw_networkx_labels(graph, pos)
    nx.draw_networkx_edges(graph, pos)
 def genome_table(genome: Genome):
    table = [
        (conn.innovation_no, "->".join([str(n) for n in conn.nodes]), "DIS" if conn.disabled else "")
        for conn in genome.connections.values()
    ]
    table.sort(key=lambda c: c[0])
    table = zip(*table)
    print(tabulate.tabulate(table, tablefmt="psql"))
 if __name__ == "__main__":
    g1 = Genome.new(3, 2)
    g1.add_connection(0, 4, 0.5)
    mutate(g1)
    mutate(g1)
    mutate(g1)
    mutate(g1)
    mutate(g1)
    mutate(g1)
    # mutate(g1)
    # genome_graph(g1)
    # plt.show()
    genome_table(g1)
--- a/6/aufgabe06.ipynb
+++ b/6/aufgabe06.ipynb
@ -0,0 +1,317 @@
 {
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 205,
   "metadata": {},
   "outputs": [],
   "source": [
    "import tensorflow as tf\n",
    "from tensorflow import keras\n",
    "import numpy as np\n",
    "from tqdm import tqdm, trange\n",
    "from random import sample\n",
    "from typing import Literal\n",
    "import statistics\n",
    "import gymnasium \n",
    "\n",
    "rng = np.random.default_rng()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 206,
   "metadata": {},
   "outputs": [],
   "source": [
    "def build_dqn(n_actions, input_dims, fc1_dims, fc2_dims):\n",
    "    model = tf.keras.Sequential([\n",
    "        tf.keras.layers.Dense(fc1_dims, activation=tf.keras.activations.relu, input_shape=(input_dims,)),\n",
    "        tf.keras.layers.Dense(fc2_dims, activation=tf.keras.activations.relu),\n",
    "        tf.keras.layers.Dense(n_actions)\n",
    "    ])\n",
    "    model.compile()\n",
    "\n",
    "    return model"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 207,
   "metadata": {},
   "outputs": [],
   "source": [
    "mutate_weights = np.vectorize(lambda w : w if rng.uniform() > 0.7 else w + rng.normal(scale=0.3))\n",
    "\n",
    "def mutate(agent: tf.keras.Sequential) -> None:\n",
    "    for layer in agent.layers:\n",
    "        w, b = layer.get_weights()\n",
    "        layer.set_weights([mutate_weights(w), b]) # don't touch biases\n",
    "\n",
    "def recombine(mother: tf.keras.Sequential, father: tf.keras.Sequential) -> tf.keras.Sequential:\n",
    "    parent = rng.choice((mother, father))\n",
    "    child = tf.keras.models.clone_model(parent)\n",
    "    child.build(4)\n",
    "    child.compile()\n",
    "    child.set_weights(parent.get_weights())\n",
    "    return child"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Warum ist es eventuell nicht die beste Lösung, jedes Individuum nur einmal zu testen?\n",
    "Um die Fitness zu ermitteln, sollte jedes Individuum mehrmals getestet werden, da der Agent nicht immer gleich gut abschneidet. Hier gestaltet es sich sinnvoll, jedes Individuum mindestens 3 Mal zu testen und den Median-Score zu wählen um Ausreißer nach unten und oben aus der Wertung zu nehmen. Alternativ könnte auch der durchschnittliche Score sinnvoll sein.\n",
    "\n",
    "### Fällt Ihnen eine gute Methode für ein Crossover ein?\n",
    "Ja! Tests haben ergeben, dass das Wählen eines zufälligen Elternteils sinnvoll ist und schnell berechnet werden kann. Danke an Melissa für den Tipp.\n",
    "\n",
    "### Welche Beobachtung machen Sie mit den unterschiedlichen Selektionsarten?\n",
    "Hier die Avg-Scores des besten Individuums von jeweils 5 Durchgängen mit 20 Generationen, 30 Individuen und einer Selection von 15: \\\n",
    "Avg-Score mit Elitist: 384, 500, 500, 500, 500 \\\n",
    "Avg-Score mit Proportional: 500, 291, 500, 432, 188 \\\n",
    "500 ist der maximale Score.\n",
    "Für genauere Aussagen müsste man mehr Durchgänge durchführen. Da ein Durchgang >4min dauert, wurde darauf allerdings verzichtet.\n",
    "Beide Selektionsarten haben oft das Optimum erreicht. In diesen Durchgängen hat Elitist bessere Ergebnisse erzielen können. Mit Elitist konnte 4 von 5 Mal der Optimum erreicht werden."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 212,
   "metadata": {},
   "outputs": [],
   "source": [
    "def fitness(agent: tf.keras.Sequential, n: int = 3) -> int:\n",
    "    env = gymnasium.make('CartPole-v1')\n",
    "\n",
    "    scores = []\n",
    "\n",
    "    for _ in range(n):\n",
    "        done = False\n",
    "        score = 0\n",
    "        observation, _ = env.reset()\n",
    "        while not done:\n",
    "            actions = agent(observation[np.newaxis, :])\n",
    "            action = np.argmax(actions)\n",
    "            observation, reward, terminated, truncated, _ = env.step(action)\n",
    "            done = terminated or truncated\n",
    "            score += reward\n",
    "\n",
    "        scores.append(score)\n",
    "\n",
    "    return statistics.median(scores)\n",
    "    \n",
    "\n",
    "def evolution(\n",
    "    generations: int = 50,\n",
    "    population_size: int = 20,\n",
    "    selection_size: int = 5,\n",
    "    selection_type: Literal[\"elitist\"] | Literal[\"proportional\"] = \"elitist\",\n",
    "):\n",
    "    assert selection_type in (\"elitist\", \"proportional\")\n",
    "    population = [build_dqn(2, 4, 5, 5) for _ in range(population_size)]\n",
    "\n",
    "    for _ in trange(generations):\n",
    "        # Select individuals with highest fitness for reproduction\n",
    "        population = sorted(population, key=lambda agent: fitness(agent), reverse=True)\n",
    "\n",
    "        if selection_type == \"elitist\":\n",
    "            selection = population[:selection_size]\n",
    "        elif selection_type == \"proportional\":\n",
    "            population_fitness = [fitness(nn) for nn in population]\n",
    "            selection = np.random.choice(\n",
    "                population,\n",
    "                selection_size,\n",
    "                p=[f / sum(population_fitness) for f in population_fitness],\n",
    "                replace=False\n",
    "            ).tolist()\n",
    "\n",
    "        # Reproduce\n",
    "        offsprings = []\n",
    "        for _ in range(population_size - selection_size):\n",
    "            mother, father = sample(selection, 2)\n",
    "\n",
    "            offspring = recombine(mother, father)\n",
    "            mutate(offspring)\n",
    "            \n",
    "            offsprings.append(offspring)\n",
    "\n",
    "        # Create new population\n",
    "        population = selection + offsprings\n",
    "        \n",
    "    # Return best individual of final population\n",
    "    return max(population, key=lambda agent: fitness(agent))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 222,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "100%|██████████| 20/20 [02:08<00:00,  6.41s/it]\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "episode  0 score 500.00 average score 500.00\n",
      "episode  1 score 500.00 average score 500.00\n",
      "episode  2 score 500.00 average score 500.00\n",
      "episode  3 score 500.00 average score 500.00\n",
      "episode  4 score 500.00 average score 500.00\n",
      "episode  5 score 500.00 average score 500.00\n",
      "episode  6 score 500.00 average score 500.00\n",
      "episode  7 score 500.00 average score 500.00\n",
      "episode  8 score 500.00 average score 500.00\n",
      "episode  9 score 500.00 average score 500.00\n",
      "episode  10 score 133.00 average score 466.64\n",
      "episode  11 score 500.00 average score 469.42\n",
      "episode  12 score 106.00 average score 441.46\n",
      "episode  13 score 500.00 average score 445.64\n",
      "episode  14 score 128.00 average score 424.47\n",
      "episode  15 score 500.00 average score 429.19\n",
      "episode  16 score 500.00 average score 433.35\n",
      "episode  17 score 500.00 average score 437.06\n",
      "episode  18 score 500.00 average score 440.37\n",
      "episode  19 score 500.00 average score 443.35\n",
      "episode  20 score 500.00 average score 446.05\n",
      "episode  21 score 500.00 average score 448.50\n",
      "episode  22 score 500.00 average score 450.74\n",
      "episode  23 score 500.00 average score 452.79\n",
      "episode  24 score 118.00 average score 439.40\n",
      "episode  25 score 500.00 average score 441.73\n",
      "episode  26 score 500.00 average score 443.89\n",
      "episode  27 score 500.00 average score 445.89\n",
      "episode  28 score 117.00 average score 434.55\n",
      "episode  29 score 500.00 average score 436.73\n",
      "episode  30 score 500.00 average score 438.77\n",
      "episode  31 score 500.00 average score 440.69\n",
      "episode  32 score 123.00 average score 431.06\n",
      "episode  33 score 189.00 average score 423.94\n",
      "episode  34 score 500.00 average score 426.11\n",
      "episode  35 score 500.00 average score 428.17\n",
      "episode  36 score 106.00 average score 419.46\n",
      "episode  37 score 500.00 average score 421.58\n",
      "episode  38 score 500.00 average score 423.59\n",
      "episode  39 score 500.00 average score 425.50\n",
      "episode  40 score 500.00 average score 427.32\n",
      "episode  41 score 500.00 average score 429.05\n",
      "episode  42 score 500.00 average score 430.70\n",
      "episode  43 score 500.00 average score 432.27\n",
      "episode  44 score 138.00 average score 425.73\n",
      "episode  45 score 500.00 average score 427.35\n",
      "episode  46 score 500.00 average score 428.89\n",
      "episode  47 score 500.00 average score 430.38\n",
      "episode  48 score 500.00 average score 431.80\n",
      "episode  49 score 500.00 average score 433.16\n",
      "episode  50 score 459.00 average score 433.67\n",
      "episode  51 score 500.00 average score 434.94\n",
      "episode  52 score 500.00 average score 436.17\n",
      "episode  53 score 500.00 average score 437.35\n",
      "episode  54 score 500.00 average score 438.49\n",
      "episode  55 score 157.00 average score 433.46\n",
      "episode  56 score 500.00 average score 434.63\n",
      "episode  57 score 500.00 average score 435.76\n",
      "episode  58 score 164.00 average score 431.15\n",
      "episode  59 score 112.00 average score 425.83\n",
      "episode  60 score 346.00 average score 424.52\n",
      "episode  61 score 500.00 average score 425.74\n",
      "episode  62 score 500.00 average score 426.92\n",
      "episode  63 score 500.00 average score 428.06\n",
      "episode  64 score 500.00 average score 429.17\n",
      "episode  65 score 500.00 average score 430.24\n",
      "episode  66 score 500.00 average score 431.28\n",
      "episode  67 score 140.00 average score 427.00\n",
      "episode  68 score 500.00 average score 428.06\n",
      "episode  69 score 500.00 average score 429.09\n",
      "episode  70 score 500.00 average score 430.08\n",
      "episode  71 score 500.00 average score 431.06\n",
      "episode  72 score 500.00 average score 432.00\n",
      "episode  73 score 500.00 average score 432.92\n",
      "episode  74 score 500.00 average score 433.81\n",
      "episode  75 score 500.00 average score 434.68\n",
      "episode  76 score 500.00 average score 435.53\n",
      "episode  77 score 500.00 average score 436.36\n",
      "episode  78 score 477.00 average score 436.87\n",
      "episode  79 score 500.00 average score 437.66\n",
      "episode  80 score 130.00 average score 433.86\n",
      "episode  81 score 500.00 average score 434.67\n",
      "episode  82 score 394.00 average score 434.18\n",
      "episode  83 score 500.00 average score 434.96\n",
      "episode  84 score 500.00 average score 435.73\n",
      "episode  85 score 500.00 average score 436.48\n",
      "episode  86 score 500.00 average score 437.21\n",
      "episode  87 score 500.00 average score 437.92\n",
      "episode  88 score 500.00 average score 438.62\n",
      "episode  89 score 500.00 average score 439.30\n",
      "episode  90 score 500.00 average score 439.97\n",
      "episode  91 score 500.00 average score 440.62\n",
      "episode  92 score 140.00 average score 437.39\n",
      "episode  93 score 500.00 average score 438.05\n",
      "episode  94 score 500.00 average score 438.71\n",
      "episode  95 score 500.00 average score 439.34\n",
      "episode  96 score 179.00 average score 436.66\n",
      "episode  97 score 282.00 average score 435.08\n",
      "episode  98 score 500.00 average score 435.74\n",
      "episode  99 score 108.00 average score 432.46\n"
     ]
    }
   ],
   "source": [
    "env = gymnasium.make('CartPole-v1')\n",
    "agent = evolution(generations=20, population_size=30, selection_size=15, selection_type='elitist')\n",
    "scores = []\n",
    "\n",
    "for i in range(100):\n",
    "    done = False\n",
    "    score = 0\n",
    "    observation, info = env.reset()\n",
    "    while not done:\n",
    "        action = np.argmax(agent(observation[np.newaxis, :]))\n",
    "        observation, reward, terminated, truncated, info = env.step(action)\n",
    "        done = terminated or truncated\n",
    "        score += reward\n",
    "\n",
    "    scores.append(score)\n",
    "    \n",
    "\n",
    "    avg_score = np.mean(scores[max(0, i-100):(i+1)])\n",
    "    print('episode ', i, 'score %.2f' % score, 'average score %.2f' % avg_score)"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.10.12"
  },
  "orig_nbformat": 4,
  "vscode": {
   "interpreter": {
    "hash": "bd385fe162c5ca0c84973b7dd5c518456272446b2b64e67c2a69f949ca7a1754"
   }
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
 }
--- a/6/dqn_model.keras
+++ b/6/dqn_model.keras
Author	SHA1	Message	Date
Kai Koellemann	ef7dce9bee	Ready to present	2023-07-17 00:33:12 +02:00
paumann	8fd7baaf93	Final files	2023-07-17 00:02:10 +02:00
Kai Koellemann	0fd332a6e5	Makrus hat nen kleinen Pimmel	2023-07-16 20:00:15 +02:00
Kai Koellemann	eaf2e7e111	Am Konzept weitergearbeitet	2023-07-16 19:16:43 +02:00
Kai Koellemann	fa6a721cc8	Aufgabe 6	2023-07-16 14:15:26 +02:00
paumann	e22a273609	viz	2023-07-16 00:40:47 +02:00
paumann	439f995eae	Initial commit	2023-07-15 14:25:10 +02:00