Information Engineering LabF. Höppner, Ostfalia University of Applied Sciences
|
Hier finden Sie eine Reihe von Fragen, die im Rahmen der jeweiligen Veranstaltungen beantwortet werden.
Wie können Daten aus verschiedenen Systemen so organisiert und integriert werden, dass System-übergreifende Fragestellungen möglichst leicht beantwortet werden können? Sie entwickeln ein eigenes, kleines Data Warehouse mit Pentaho. Grundlage sind Daten, die von Studierenden mit Anwendungen selbst generiert wurden.
Wie verschaffe ich mir zu gegebenen Daten, die ich nicht alle einzeln betrachten kann oder möchte, einen Überblick? Wie kann ich Zusammenhänge zwischen Attributen feststellen? Wie schütze ich mich davor, dass ich Zusammenhänge betrachte, die nur zufällige Effekt sind? Wie kann ich Daten zu Gruppen zusammenfassen? Wie kann ich automatisch aus Daten Regeln erzeugen, die mir eine Vorhersage bestimmter Attribute erlauben?
Was ist Wissensmanagement? Wie findet eine Suchmaschine die besten Ergebnisse für meine Anfrage? Wie kann das Wissen darüber, wie in der Vergangenheit ein Problem gelöst wurde, für zukünftige Fälle genutzt werden? (Case Based Reasoning, Collaborative Filtering) Wie kann Wissen so abgelegt werden, dass es automatisch verarbeitbar wird? (Logik, Expertensysteme, Semantic Web).
Wie organisiert ein Datenbank-Managementsystem (DBMS) die Daten? Wie wird die Ausführung von SQL-Anfragen optimiert? Wie wird nach einem Absturz des DBMS sichergestellt, dass keine Daten verloren gehen? Wie wird bei parallelen Transaktionen sichergestellt, dass sich die Anweisung nicht gegenseitig behindern? Wie können richtig große Datenmengen (BIG DATA) durch verteilte Berechnung mit Hadoop Map/Reduce bewältigt werden?
Wie werden Datenmengen, die zu groß für einen einzigen Rechner sind, effizient verarbeitet? Wie können wir auf so großen Datenmengen noch Algorithmen ausführen? Einführung mit praktischen Aufgaben in Hadoop Map/Reduce und Apache Spark.