DECISION & PROCESS SIMULATION · FRAMEWORK

Role-Based Decision & Process Simulation

Simulate. Understand. Decide.

Ein eigenständiges Framework zur Simulation von Entscheidungs- und Prozessdynamiken in IT- und BPM-Vorhaben. Mehrere spezialisierte Rollen analysieren denselben Change Request gleichzeitig und parallel. Damit werden typische Probleme (widersprüchliche Entscheidungen, späte Konflikte, übersehene Risiken) sichtbar, bevor ein Projekt überhaupt produktiv startet. Diese Seite zeigt das aktuelle Reifebild eines lauffähigen Prototyps, die konzeptuelle Architektur sowie die Skalierungs-Roadmap vom lokalen Mini-PC über einen GPU-Cloud-Pod bis zur Anbindung produktiver Online-Modelle.

1 Sponsor 16 Agents 10 Rollen-Gruppen 6 Intelligence-Schichten 3 Skalierungs-Stufen Prototype laufend
Visuelle Klammer des Frameworks, Aquarium-Metaphorik 🔍 Vergrössern
EINLEITUNG

Vom unscharfen Antrag zur tragfähigen Entscheidungsgrundlage

Ausgangslage in der Praxis

Anforderungen werden in der Regel schriftlich, strukturiert und nach Priorität geordnet eingereicht. Der Empfänger hängt vom Kontext ab. Im Arbeitsalltag sind es meist interne IT-Teams, das Produktmanagement oder die Projektleitung, abgewickelt über Ticketsysteme wie Jira, Azure DevOps, ClickUp, ServiceNow oder Asana.

Anforderungen für Prozessanpassungen, Change Requests, Bug-Fixes oder neue Initiativen sind in der Praxis fachlich häufig schlecht beschrieben. Implizites Wissen wird vorausgesetzt, die Schnittstellen zwischen Fachbereich und IT bleiben unklar, und Anforderungen werden oft als Lösung statt als Problem formuliert.

In agiler Softwareentwicklung wird zugunsten knapper User Stories häufig auf ausführliche Spezifikationen verzichtet. Ohne saubere Akzeptanzkriterien und ohne fachliche Prozessmodelle wie BPMN entstehen Missverständnisse. Beschrieben wird meist nur der goldene Weg, also der Idealfall. Seltene Ausnahmen, Fehlerbehandlungen und Folgeprozesse bleiben ausgeblendet, was zu Lücken in der späteren Systemanpassung führt.

Den Beteiligten fehlt zudem oft eine gemeinsame Sprache. Fachbereiche denken in Business-Begriffen, während die IT logische und systemische Regeln benötigt. Wo das Bindeglied fehlt, typischerweise ein Business Analyst, bleiben die Beschreibungen vage.

Workshops, Reviews und Refinements als etablierte Gegenmittel

Workshops, Reviews und Backlog Refinements sind die etablierten Praktiken, um Anforderungen nach der ersten Einreichung zu verbessern. Eine klare Definition of Ready hilft, das Niveau dieser Formate zu sichern. Diese Praktiken sind notwendig und wertvoll, setzen aber alle nach der Einreichung an, also zu einem Zeitpunkt, an dem die Anforderung bereits in Umlauf gebracht wurde. Vertagungen, Nachschärfungen und Eskalationen sind die häufigen Folgen einer solchen rein reaktiven Qualitätskontrolle.

Beitrag des Modells

Das Role-Based Decision & Process Simulation Framework setzt davor an. Durch die iterative Konsultation virtueller Rollen entsteht ein konsolidierter Entscheidungsreport mit Governance-Status, Rollenkonflikten, Risiko-Klassifizierung, Pattern-Empfehlungen, Architektur-Skizze und nächsten Schritten. Dadurch gelangt die Anforderung in einem deutlich tragfähigeren Zustand ins Backlog Refinement. Auch dort, wo eine Anforderung bereits Lösungsansätze enthält, die im Unternehmen akzeptiert sind, lassen sich diese gegen die fachliche und technische Sicht der relevanten Rollen prüfen.

Hintergrund und Eigenanteil

Die Methode ist aus rund zwanzig Jahren Praxis in Prozess- und Requirements Engineering in agilen Software-Entwicklungs-Kontexten entstanden, mit Schwerpunkten in Banking, Versicherung und Medien. Konzeptioneller Bezugspunkt ist die Schwarmintelligenz-Idee aus offenen Multi-Agent-Engines wie MiroFish. Die Implementierung, die Rollen-Spezifikationen, die Konsolidierungs-Logik und die domänenbezogene Anwendung auf Enterprise-Entscheidungsvorbereitung sind eigene Arbeit.

Reife und bewusste Eingrenzung

Die hier gezeigte Schicht ist eine Präsentations- und Demonstrations-Schicht. Sie ist bewusst eingegrenzt durch die Lesbarkeit für ein gemischtes Publikum und durch die Möglichkeiten der lokal betriebenen Ollama-LLM-Runtime auf dem NAB9-Mini-PC. Höhere Ausbaustufen wie Ressourcen- und Kapazitäts-Bewertung oder Cloud- und GPU-basierte Parallelisierung sind in der Roadmap angelegt, aber nicht Teil dieser Schicht. Die weiter unten beschriebenen Anwendungsschichten sind Beispiele aus einem grösseren Spektrum, abhängig von der Entwicklungsstufe des jeweiligen Unternehmens.

FUNKTIONSWEISE

Sechs Intelligence-Schichten von der Anforderung zum Entscheidungsreport

Das Framework arbeitet in mehreren aufeinander aufbauenden Intelligence-Schichten. Eine Anforderung durchläuft sie als Sequenz, am Ende steht ein konsolidierter Entscheidungsreport.

Die Kette verläuft von Requirements oder Change Request über Role Intelligence, Governance Intelligence, Pattern Intelligence, Solution Intelligence, Architecture Blueprint Intelligence und Decision Intelligence zum Entscheidungsreport. Jede Schicht baut auf den Ergebnissen der vorhergehenden auf.

Sechs-Schichten-Grafik des Frameworks mit Role-, Governance-, Pattern-, Solution-, Architecture-Blueprint- und Decision-Intelligence sowie dem Entscheidungsreport 🔍 Vergrössern

Die folgenden sechs Karten erläutern jede Schicht im Detail. Farbe und Nummer der Karten entsprechen der jeweiligen Schicht in der Grafik oberhalb.

1

Role Intelligence

Mehrere spezialisierte Rollen erheben parallel ihre Sichten auf den Antrag. Konflikte zwischen Rollen werden sichtbar gemacht, nicht aufgelöst.

2

Governance Intelligence

Risiken werden früh erkannt und klassifiziert. Kritische Anträge können gestoppt werden, bevor sie weitere Ressourcen binden. Governance-by-Design.

3

Pattern Intelligence

Die Anforderung wird gegen wiederkehrende Lösungs- und Strukturmuster geprüft. Passende Muster und sinnvolle Kombinationen werden benannt.

4

Solution Intelligence

Aus Rollen-Perspektiven und Mustern entsteht ein Lösungsraum mit fachlichen Optionen, ohne Festlegung auf eine konkrete technische Umsetzung.

5

Architecture Blueprint Intelligence

Eine fachlich-technische Zielstruktur mit klaren Verantwortungsgrenzen entsteht. Frontend, API, Sicherheit, Audit und Speicher werden sauber getrennt.

6

Decision Intelligence

Alle Vorschichten werden zu einer Entscheidungsgrundlage verdichtet. Empfehlung, Risiko-Klassifizierung und Handlungsoptionen kommen zusammen.

Aus dieser Sequenz entsteht der Entscheidungsreport mit sechs strukturierten Komponenten. Die Farbe einer Komponente verweist auf die Quell-Schicht in der Grafik.

Governance Status

Freigegeben, mit Auflagen oder Abgelehnt, mit Begründung.

Role Insights und Konflikte

Kernerkenntnisse und Spannungsfelder aus allen Rollen-Sichten.

Risiken und Gegenmassnahmen

Identifizierte Risiken mit vorgeschlagenen Massnahmen.

Pattern-Empfehlungen

Anwendbare Muster und sinnvolle Kombinationen.

Architecture Blueprint

High-Level-Struktur und Verantwortungsbereiche.

Nächste Schritte

Klare Handlungsempfehlungen für das Umsetzungsteam.

Funktionsweise · Reflexion

Was das Framework leistet, wo es Grenzen hat, was es wert ist

Was das Framework leistet

Sechs Perspektiven statt Einzellösung, frühe Risikoerkennung und Governance-by-Design in einer Sequenz. Auditierbar, erweiterbar, Enterprise-tauglich. Lokaler KI-Betrieb hält Daten im Unternehmen.

Roadmap

Target Architecture Intelligence als spätere Schicht entwickelt die heutige Blueprint-Schicht zur mittelfristigen Zielarchitektur weiter. Derzeit Ausblick, nicht Teil des aktuellen Standes.

AUSBLICK

Bewusste Grenzen der Offenlegung

Rollen-Konsultation, Bewertungs- und Konsolidierungsmechanismen sind nicht-öffentliche Eigenarbeit. Die Sektion macht die strukturelle Komplexität sichtbar, ohne die Implementierungs-Mechanik offenzulegen.

Wert des Frameworks

Der Wert liegt in der Verbindung von Business-Analyse, Governance, Pattern Intelligence, Solution-Denken, Architekturdenken und Entscheidungsmodell zu einer Sequenz. Diese Verbindung ist nicht trivial nachzubauen.

ANWENDUNGSSCHICHTEN

Fünf Wirkungsfelder im Unternehmen

Die folgenden Schichten sind Beispiele aus einem grösseren Spektrum möglicher Anwendungsfälle. Welche Schichten in einem konkreten Unternehmen relevant werden, hängt von der Reifegrad-Stufe der dortigen Prozesse und der internen Governance-Kultur ab.

01

Pre-Distribution-Schärfung

  • Anforderung vor Workshop, Gremium, Review schärfen
  • Initiator dimensioniert vorab via rollenbasierter Konsultation
  • Weniger Vertagungen, Nachschärfungen, Eskalationen
02

BA-, PO- und Process-Owner-Empowerment

  • Brücken-Rollen erarbeiten Anforderungen autonom
  • Keine Bindung von Fach- und Technik-Experten
  • Stärkt Eigenständigkeit, entlastet operative Strukturen
03

Proaktive Eigeninitiative gegenüber dem Sponsor

  • Verbesserungsvorschläge gegenüber Sponsor begründen
  • Vorbereitetes Gespräch mit dimensionierten Antworten
  • Aus Pitch wird informierte Diskussion
04

Budget- und Portfolio-Steuerung

  • Pflicht-CRs vs. Kür-CRs unterscheiden
  • Vergleichbare Basis für Budget-Allokation
  • Spricht Portfolio-Verantwortliche und Programm-Manager an
05

Ressourcen- & Kapazitätsplanung

  • Auslastung interner Profile in Bewertung einbeziehen
  • CR-Realisierbarkeit unter Kapazitäten beurteilen
  • Setzt PPM/HR-Integration voraus, derzeit Vision
VISION

EINGRENZUNG · REICHWEITE UND DISCLOSURE

Die hier beschriebenen Anwendungsschichten zeigen, wo das Framework Wirkung entfaltet, nicht wie es die Mechanik umsetzt. Die konkrete Konfiguration der Rollen-Konstellation, der Iteration und der internen Auswertungsmechanismen bleibt aus den in der Funktionsweise-Sektion genannten Gründen aussen vor.

ROLLEN-KONSTELLATION

Sponsor als Mandatsgeber, Rollen-Gruppen im Schwarm

Die rollenbasierte Konsultation arbeitet mit zwei klar getrennten Strukturen. Der Sponsor steht ausserhalb des Schwarms als Mandatsgeber. Der Schwarm besteht aus mehreren Rollen-Gruppen, deren Sichtweisen parallel erhoben und gegeneinander geprüft werden.

00 · AUSSERHALB DES SCHWARMS MANDATSGEBER

Sponsor

Vision · Ressourcen · Mandat · Rückendeckung

Zehn Rollen-Gruppen im Schwarm

011

Business Analysis

Anforderungen, Akzeptanzkriterien

021

Product & Strategy

Produktvision, Priorisierung

033

Engineering & Architecture

Umsetzbarkeit, Architektur

041

Quality & Testing

Testbarkeit, Qualität

052

Security & Compliance

Security, Compliance

061

Operations & Runtime

Betrieb, Monitoring

073

Process Governance

Prozess, Governance

082

Delivery & Collaboration

Delivery, Sprintfähigkeit

091

UX & Experience

Nutzerwert, Bedienbarkeit

101

AI Governance

KI-Governance, Kontrolle

Die innere Konfiguration der Rollen und die Mechanismen ihrer Konsultation sind Teil der nicht-öffentlichen Eigenarbeit. Diese Sektion macht die Struktur der Konstellation sichtbar, ohne die operative Mechanik offenzulegen.

ARCHITEKTUR UND SKALIERUNGSPFAD

Vom lokalen NAB9 in die GPU-Cloud und weiter zu Public-LLM-APIs

Die Sektion beschreibt, wo das Framework heute läuft, welche Skalierungsstufen vorgesehen sind und wie die Datenhaltung in den verschiedenen Stufen geregelt ist. Die heutige Schicht läuft auf einem Minisforum NAB9 mit Intel-i9-12900HK-Prozessor, 64 GB Arbeitsspeicher und integrierter Grafikeinheit. Auf dem Gerät arbeitet eine Ubuntu-VM unter VMware Workstation, in der ein lokaler Ollama-LLM-Stack betrieben wird.

Wegen der integrierten Grafikeinheit ist die parallele Konsultation virtueller Rollen auf der lokalen Stufe begrenzt. Für umfangreichere Konstellationen wird Hardware mit dedizierter GPU-Leistung benötigt. Das Framework ist deshalb auf drei Skalierungsstufen ausgelegt, die je nach Anwendungs- und Datensensitivität gewählt werden können.

Architektur-Trigger: Bei umfangreicheren Rollen-Konstellationen stösst die integrierte Grafikeinheit an klare Grenzen. Das Framework verlagert sich stufenweise in die GPU-Cloud und kann am Ende auf gehostete Modelle externer Anbieter umgestellt werden.
Stufe 1 · Heute ✓ Implementiert

Lokal auf dem NAB9

Mini-PC mit integrierter GPU, Ubuntu-VM, Ollama-Stack
Minisforum NAB9 mit aufgeschlüsseltem Hardware-Layout
Minisforum NAB9 | Hardware-Basis Stufe 1
Hardware
Intel i9-12900HK
GPU
integriert
RAM
64 GB
Konstellation
begrenzt durch GPU
Cloud
keine Abhängigkeit

Aktueller Stand. Ressourcenschonend, ohne Cloud-Abhängigkeit, deckt die Demonstrations- und Entwicklungsphase ab. In dieser Stufe verlassen Daten den eigenen Betrieb nicht. Anforderungen, ihre Auswertungen und der Entscheidungsreport bleiben auf dem eigenen Gerät. Für Kontexte mit höheren Anforderungen an die Datenhaltung wäre eine weitere Ausbaustufe denkbar.

Details unten

Stufe 3 · Ausblick 🎯 Vision

Public-LLM-APIs

Gehostete Modelle externer Anbieter
Backend
Public-LLM-API (kostenpflichtig)
Modelle
aktuell verfügbare Modelle
Skalierung
provider-seitig
Kosten
Pay-per-Token
Voraussetzung
interne Compliance-Freigabe

Diese Stufe ist als Ausblick angelegt und nicht Teil des aktuellen Standes. Sie ist auf unsensible Anwendungsfälle oder anonymisierte Auswertungen beschränkt und setzt eine interne Freigabe durch die zuständigen Compliance-Funktionen voraus.

Stufe 3 Konzept: Decision-Lab Core verbindet sich über ein Secure API Gateway mit einer anbieter-neutralen externen LLM-API
Externe LLM-API über Secure Gateway

Details unten

Vertiefung pro Stufe

Stufe 1 im Detail | Vom Ist-Stand zum Möglichen auf dieser Hardware
Ist – Verifizierter Stand heute
Host-System
GerätNAB9 Venus
CPUi9-12900HK
Kerne / Threads14 / 20
RAM64 GB DDR4
RAM-Aufbau2 × 32 GB
GPUIris Xe, 96 EU
Storageca. 5,7 TB
Host-OSWin 10 Pro 25H2
Virtualisierung & Gast
PlattformVMware WS Pro 25
Ziel-VMDecisionCoreSystem
Gast-OSUbuntu 24.04 LTS
Codenamenoble
ContainerDocker 29.1.3
VerwaltungPortainer :9000
Runtime & Entwicklung
LLM-RuntimeOllama 0.23.1
Python3.12
Git2.43.0
Modell Aqwen2.5:3b | 1,9 GB
Modell Bqwen2.5:7b | 4,7 GB
Modell-Volumenca. 6,6 GB
Kann – Potenzial dieser Hardware
Rollen-Konstellation Acht Rollen im Release-1-Scope sequenziell mit qwen2.5:7b oder parallel-leicht mit qwen2.5:3b. Die Vollkonstellation der sechzehn Agents überschreitet die lokale Kapazität und ist Ziel auf Stufe 2.
Modellgrössen-Eignung 3B Q4 schnell, gut für parallele Rollen-Calls. 7B Q4 stabil, gut für Konsolidierung. 13B Q4 ladbar, Latenz steigt deutlich. 30B+ technisch möglich, praktisch zu zäh für iterative Konsultation.
Datenhaltung Anforderungen, Auswertungen und Reports verlassen den eigenen Betrieb nicht. Keine Cloud-Abhängigkeit, keine Token-Kosten, geeignet für sensible Inhalte und Demonstrationen unter NDA.
Reproduzierbarkeit VM-Snapshot, Container-Konfiguration und Modell-Pulls sind versionierbar. Der gesamte Stack lässt sich auf vergleichbarer Hardware in unter einem Tag rekonstruieren.
Trigger für Stufe 2 Wechsel zu dedizierter GPU wird sinnvoll, wenn die Vollkonstellation simultan laufen soll, Kontextfenster über sechzehntausend Token zur Norm werden oder mehrere Anfragen gleichzeitig zu beantworten sind.
Modellwahl – Warum Qwen
  • Lokal realistisch: Q4-Quantisierung läuft stabil auf iGPU plus CPU, ohne dedizierte GPU.
  • Disziplinierte Strukturen: Saubere JSON-Ausgaben für rollenbasierte Verdichtung, vorbereitet für Tool- und Schema-Calling.
  • Sehr gutes Deutsch: Belastbar für deutsche Rollen-Prompts, Akzeptanzkriterien und Reports.
  • Konsistente Rollenlogik: Persona-Treue über System-Prompts hinweg, kaum Rollendrift in längeren Sequenzen.
  • BA-Performance geprüft: Requirements-Analyse und Akzeptanzkriterien im eigenen Mandatsumfeld getestet.
  • Familie mit Apache 2.0: Qwen-Coder und Qwen-Math als Wachstumspfad, kommerziell unbedenklich.
Verglichen mit Alternativen Llama 3.x zeigt schwächeres Deutsch in Q4-Quantisierung. Mistral 7B liefert weniger strukturierte Outputs. Qwen wurde wegen Sprachqualität, JSON-Disziplin und steuerbarer Persona-Treue gewählt.
Stufe 2 im Detail | Vom Lokal-Stack zur dedizierten GPU-Cloud
Plan – Geplanter Zielstand
Pod-Konfiguration
ArchitekturServerless Endpoint
GPU2 × RTX 3090
vCPU64 (EPYC 7H12)
RAM251 GB
Skalierungprovider-seitig
Abrechnungpay-per-second
Provider-Optionen
InternationalRunPod, Lambda
SchweizExoscale, Infomaniak
CH-SpezialSwissAI
Standortnach Datenschutz
ComplianceGDPR / nDSG
Vertragsformpay-per-use
Modell & Betrieb
Modellgrösse30B bis 70B Q4
Konstellationalle 16 Agents
Kontextfenster32k bis 128k Token
DatenpfadClient > Queue > Worker
Worker-Lifecycleidle > Shutdown
Image-BasisDocker, identisch lokal
Kann – Was das ermöglicht
Vollkonstellation Alle sechzehn Agents in zehn Rollen-Gruppen simultan. Keine Sequenzialisierung mehr, deutlich kürzere Gesamt-Durchlaufzeit pro Anforderung.
Grössere Modelle 30B und 70B Q4 produktiv nutzbar. Tiefere Reasoning-Ketten, robustere Pattern-Erkennung, präzisere Architektur-Skizzen.
Längere Kontexte 32k bis 128k Token erlauben umfangreiche Anforderungen plus BPMN-Modelle, Akzeptanzkriterien und Vorgaben im gleichen Call.
Parallele Sessions Mehrere CR-Bewertungen gleichzeitig. Mehrere Mitarbeitende können das Framework parallel nutzen, ohne sich gegenseitig zu blockieren.
Kostenprofil Kein Idle-Cost. Worker fahren bei Inaktivität herunter. Nur tatsächlich gebrauchte GPU-Zeit wird berechnet.
Architekturwahl – Warum Serverless GPU
  • Pay-per-second: Kein Idle-Cost, bedarfsorientierte Skalierung mit der Anfragelast.
  • Souveränitäts-Wahl: Schweizer Provider möglich für sensible Inhalte, internationale für unkritische.
  • Kein Vendor-Lock: Pod-Image und Modell-Konfiguration zwischen Providern übertragbar.
  • Identisches Image: Docker-Setup identisch zum lokalen NAB9, Code bleibt unverändert.
  • Workload-Trennung: Hardware-Upgrade über Provider, ohne eigene Capex und ohne Wartung.
  • Datenhoheit erhalten: Volle Modell- und Prompt-Kontrolle, anders als bei Public-LLM-APIs.
Verglichen mit Alternativen Eigene GPU-Workstation: keine Capex, kein Strom, keine Wartung. Dauer-VM in Cloud: keine Leerlauf-Kosten. Public-LLM-API: volle Modellkontrolle und Datenhoheit bleiben unter eigenem Dach.
Stufe 3 im Detail | Kontrollierte Integration externer Modellleistung
Ansatz – So würde es funktionieren
Decision-Lab Core
Rollen, Gruppen, Simulation, Governance
INTERN
Prompt & Context Router
Rollenlogik, Knowledge-Auswahl, Policies
INTERN
Secure API Gateway
Auth, Rate Limits, Logging, Maskierung
INTERN
Externe LLM-API
Externe Modellleistung, grosse Kontexte, z.B. Anthropic, OpenAI, Mistral, Google
EXTERN
Response Normalizer
JSON-Schema, Risiko-Level, Decision Keys
INTERN
Consolidator & Governance
Release Readiness, Veto-Logik, Ergebnisbewertung
INTERN
Technische Spezifikation
IntegrationREST / HTTPS
AuthentisierungAPI Key / Service Account / Backend Proxy
Datenflusskontrolliert, protokolliert
Outputstrukturierte JSON-Antwort
GovernancePolicy- und Freigabelogik
Kostenmodellnutzungsabhängig
VoraussetzungDatenschutz und Compliance
Kann – Was das ermöglicht
Frontier-Qualität Höchste verfügbare Reasoning-Tiefe für Deep-Analysis-Aufgaben mit grossen Kontexten.
Modellschicht extern Fachlogik bleibt im Decision-Lab. Nur die Inferenz wird ausgelagert, keine Modell-Pflege intern.
Provider-Wechsel über Config Gateway-Konfiguration entkoppelt Provider vom Anwendungscode. Neuer Provider ohne Refactoring.
Cross-Model-Validation Dieselbe Anforderung über mehrere Provider laufen lassen, Modell-Bias und Konsistenz messen.
Punktuelle Spitzenlast Provider-Skalierung statt eigener Aufrüstung, geeignet für unregelmässige Volumen-Peaks.
Bedingungen – Was erfüllt sein muss
  • Compliance-Freigabe: Datenschutz und Security geben Provider und Use Case explizit frei.
  • Datenklassifikation: Pro Anforderung Schutzstufe und Behandlung individuell festgelegt.
  • Maskierung im Gateway: Sensible Felder werden vor Outbound-Calls automatisch ersetzt oder unterdrückt.
  • DPA-Verträge: Data-Processing-Agreement mit jedem aktiven Provider unterzeichnet.
  • Audit-Trail: Token-Logs, Modell-Versionen und Provider-Nachweise revisionssicher abgelegt.
  • Kostenkontrolle: Token-Budgets pro Use Case, automatische Schwellwerte und Alarme.
Einordnung Stufe 3 erweitert das Framework um externe Modellleistung. Die Fachlogik bleibt im Decision-Lab. Stufe 3 ergänzt Stufe 1 und 2, sie ersetzt sie nicht.
Serverless Endpoint Flow: Client sendet Request an api.runpod.ai/v2/.../run, der in der Queue auf GPU-Worker verteilt wird
Stufe 2 im Detail: Wie der serverlose Endpunkt funktioniert. Requests landen in einer Queue und werden auf so viele GPU-Worker verteilt, wie aktuell aktiv sind. Bei Inaktivität fahren Worker herunter, nur tatsächlich gebrauchte GPU-Zeit kostet.

Die hier beschriebenen Architektur-Stufen markieren die heutige Reife und den vorgesehenen Wachstumspfad. Konkrete Konfigurations-Details der LLM-Runtime, der Speicher-Strategie und der internen Kommunikations-Mechanismen sind Teil der nicht-öffentlichen Eigenarbeit.

METHODE UND URHEBERSCHAFT

Eigene Methode an der Schnittstelle Business Analyse, BPM und IT

Die Sektion beschreibt die fachliche Herkunft des Frameworks, den konzeptionellen Bezug zu vorhandenen Open-Source-Arbeiten und die Abgrenzung der eigenständigen Anteile.

Methodische Herkunft

Das Framework ist aus 20 Jahren Business-Analyse-Praxis in Banking, Versicherung und Medien gewachsen. Stationen umfassen unter anderem Mandate bei Credit Suisse, BANK-now, ElipsLife (Swiss Re) und Goldbach Media (Tamedia). Die formale Methodengrundlage umfasst die Zertifizierungen IREB Certified Professional for Requirements Engineering und IPMA Level D. Ergänzend wurde der MAS in Business Process Engineering an der FHS St. Gallen abgeschlossen. Wiederkehrende Muster aus diesen Mandaten sind in die rollenbasierte Konsultation und in die Bewertungs-Strukturen eingeflossen.

Konzeptioneller Bezug zu MiroFish

Der visuelle und konzeptionelle Anker für die Schwarm-Metaphorik ist das Open-Source-Projekt MiroFish, eine Schwarmintelligenz-Engine auf Basis der Frameworks OASIS und CAMEL-AI, veröffentlicht unter der Lizenz AGPL-3.0. Übernommen wurden der konzeptionelle Ansatz der parallelen Konsultation mehrerer virtueller Rollen sowie die Aquarium- und Fisch-Metaphorik in der Visualisierung. Eigenständig entwickelt wurden der gesamte produktive Code, die Spezifikation der Rollen und Rollen-Gruppen, die Konsolidierungs-Logik und die Übertragung auf den Enterprise-Decision-Vorbereitungs-Kontext. Die Lizenz-Pflichten gegenüber MiroFish sind dort relevant, wo Code übernommen wurde, was in der hier beschriebenen Eigenentwicklung nicht der Fall ist.

Eigenarbeit und IP-Position

Der eigentliche Wert des Frameworks liegt nicht in einer einzelnen technischen Komponente, sondern in der Verbindung von Business-Analyse, Governance-Denken, Pattern-Wissen, Solution-Räumen, Architektur-Skizzen und Entscheidungs-Verdichtung zu einer durchgängigen Sequenz. Diese Verbindung ist über Jahre gewachsen, in der Praxis erprobt und durch die domänen-spezifischen Inhalte der Rollen unterlegt. Sie ist in dieser Form nicht trivial nachzubauen.

Bewusste Eingrenzung

Die konkreten Inhalte der Rollen-Wissensbasen, die internen Bewertungs- und Konsolidierungs-Algorithmen sowie die Konfiguration der Iterations-Schritte bleiben Teil der nicht-öffentlichen Eigenarbeit. Diese Sektion macht die Herkunft und die Eigenständigkeit sichtbar, ohne die innere Mechanik offenzulegen.

Interesse am Framework oder am Profil dahinter

Für ein Gespräch zur Anwendbarkeit im eigenen Unternehmen oder für konkrete Anfragen zu Mandaten und Festanstellungen.